语言保留民族的历史、习俗、传统、记忆、独特的思维方式、意义和表达方式,也被用来建设未来。然而,一些少数民族的语言正以惊人的速度灭绝。一种语言的灭绝意味着一个世界的消亡。为此,语言研究者们开始转向人工智能,希望利用这一新技术来拯救这些濒危的语言。

澳大利亚 ARC 语言动力学卓越中心(CoEDL)的一组研究人员为了向生活在偏远社区的儿童教授土著语言,开发了一种低成本、易于移动的机器人 Opie。当孩子们通过故事、游戏和课程学习时,Opie 的眼睛会与他们互动。这个机器人还会记录下孩子们的语言技能,以便老师们追踪他们的进步。CoEDL 与谷歌合作,为土著语言转录和构建了 AI 模型。得益于谷歌的开源人工智能平台 TensorFlow 的支持,这种机器学习技术为语言学家节省了数百万个小时的时间来转录 CoEDL 超过 4 万小时的录音。

新西兰土著语言毛利语的研究者杰森·洛弗尔(Jason Lovell)创立一个由 IBM 沃森提供支持的 Facebook Messenger 聊天机器人 Reobot,能够用毛利语和英语回复用户。即使用户的输入有拼写错误,Reobot 也能理解。洛弗尔希望在不久的将来引入语音功能,来为学习者提供与毛利人交谈的机会。

对许多组织来说,维护数字语言数据并使其便于土著社区使用是一项挑战。加拿大第一民族文化委员会(FPCC)的任务是支持不列颠哥伦比亚省的土著语言、艺术、文化和遗产的复兴,它与当地社区合作,通过其 First Voice 平台保存语言数据,制作教学程序和应用程序。First Voice 的最新创新是一款键盘应用程序,可让用户可以在移动设备上的任何应用程序上输入超过 100 种当地语言,包括社交媒体、电子邮件和文字处理。First Voices 将其数据存储在 Nuxeo 中,Nuxeo 是一个开源的云本地内容服务引擎,集成了机器学习等人工智能技术。

未来学家托马斯·弗雷构想了一个全球语言档案馆,一种“语言卢浮宫”,在这里甚至可以学习灭绝的语言:只要为人工智能语言娱乐引擎收集和输入足够的视频、音频和书面文件,即可生成一个功能性的三维化身,它能够向想要学习的人教授语言。人工智能引擎会走得更远,填补任何语言上的空白,如果需要,它会创建一种语言的书面形式,并提供语言之间的翻译。

作为构建全球语言档案馆的第一步,弗雷创建了一个濒危语言项目,由第一民族文化委员会和濒危语言目录/濒危语言项目(ELCat / ELP)团队管理。濒危语言项目汇集了全球合作伙伴提供的濒危语言资源和信息,到目前为止已收集了 3418 种语言的数据,其中许多语言出现在濒危语言世界地图上。

【数字叙事 毕昂】