随着语言以惊人的速度灭绝,濒危语言的使用者正与时间赛跑,利用现代科技将他们独特的语言和文化传给下一代。
联合国宣布,2019年为国际土著语言年(International Year of Indigenous Languages),以努力提高人们对濒危语言面临的困境的认识。
“通过语言,人类保存了自己的发展历史、习俗和传统文化,还有人类的记忆、独特的思维模式和表达方式,人们也用它来构建自己的未来。语言在人权、政治、稳定、和谐和可持续发展领域至关重要。”联合国可持续发展的目标(SDGs)文件中提到。
由于人工智能在语言存储和学习方面的优势,现在它在拯救濒危语言的过程中变得空前重要。
AI都做了哪些工作?
杰森·洛弗尔正在学习新西兰的土著语言——毛利语,但缺乏练习对象,因此,他与IBM的“沃森人工智能”合作,自己开发了一个Facebook Messenger聊天机器人,并取名“Reobot”,该机器人可以用毛利语、英语与用户交流。即便用户打错字或拼写错误,机器人也不会有理解上的问题。洛弗尔希望在不久的将来引入发音指导功能。无论在哪里,语言学习者都有机会使用毛利语进行交谈,Reobot可以帮助学习者更快建立信心和语言技能。
为了方便生活在偏远地区的儿童学习澳大利亚的土著语,ARC卓越语言动态研究中心( CoeDL)的一组研究人员开发了一种低成本、易携带的机器人Opie。当孩子们通过故事、游戏和课程学习时,机器人Opie的眼睛会盯着他们,记录孩子们的语言技能,供老师跟踪他们的语言学习情况。凭借谷歌的开源人工智能学习平台TensorFlow,CoeDL还转录了土著语并构建人工智能模型。机器学习技术确实节省了语言学家数百万小时的记录时间,目前CoeDL有四万多小时的语音储存。
对许多组织来说,维护语言数据库,并将它提供给土著语语言区访问使用是不小的挑战。加拿大第一人民文化委员会(FPCC)在支持不列颠哥伦比亚省土著的语言、艺术、文化和遗产振兴的任务中,与当地社区合作,通过其First Voices平台归档语言数据,并制作教学计划及应用程序。
First Voices的最新突破是一款应用键盘,用户可以在移动设备上的任何应用(包括社交媒体、电子邮件和在线文档)中输入100多种土著语言。First Voices将其数据存储在Nuxeo中,这是一个开源的云原生内容服务引擎,结合了人工智能和机器学习。
未来的目标?
未来学家托马斯·弗雷设想打造一个语言界的自然博物馆——“语言卢浮宫”,在这里你甚至可以学到已经灭绝的语言,“输入足够的视频、音频和文稿内容方面的数据给人工智能语言重建引擎,以生成一个三维模型,可以教语言学习者濒危语言。”人工智能引擎能更进一步填补任何语言空白,如果需要,它可以创建书面语言,并提供语言之间的互译。
弗雷引用了由加拿大第一人民文化委员会和夏威夷大学的濒危语言名录/濒危语言项目( elcat / elp )团队管理的濒危语言项目,并将其视为创建全球语言档案的第一步。通过全球合作者的努力,濒危语言项目汇编了有关濒危语言的资源和信息,到目前为止,已经有3418种语言的数据,其中许多都已列入世界濒危语言。
更多干货文章,请关注智能观的公众号:zhinengguanym,里面很多方法论、干货与前沿思想等文章。在对话框回复:编码书,获取儿童编码相关书籍。有关前沿教育的问题,也欢迎与我们交流。
来源:福布斯
作者:Stephen Ibaraki
智能观编译
—完—
声明:
编译文章旨在帮助读者了解行业新思想、新观点及新动态,为原作者观点,不代表智能观观点。
网友评论