姓名:周雪宁
学号:1702110196
转载:https://mp.weixin.qq.com/s/r9onLpGNMsXk9aA0bC5dwg
【嵌牛导读】:剑桥AI公司Speechmatics使用机器学习技术Automatic Linguist,可在一天内学会一门语言的基础,一周内掌握一门新语言。该公司希望有朝一日能够掌握世界上的所有语言。
【嵌牛鼻子】:人工智能,机器学习
【嵌牛提问】:剑桥公司如何进行如此强大学习能力的实现?
【嵌牛正文】:
11月11日,剑桥AI公司Speechmatics正式上线其机器学习平台Automatic
Linguist,能在一周内掌握一门新语言。该平台沿用剑桥大学研发的技术,能够识别并应用语言中的不同模式。目前,该平台能够识别28种语言,实现从语音到文字的准确转录。
图示: Speechmatics将28种语言逐渐加入其系统中。
一个大公司客户要求Speechmatics两周内学会印地语,该公司发布了一个系统,根据测试,该系统比市场领先者的错误率少23%。
Speechmatics首席执行官Benediktvon Thüngen在接受Cambridge Independent采访时表示,“印地语非常简单。我们发现它在发音方面与英语非常相似,所以我们可以使用一个叫做‘适应’的过程。它从我们拥有的不同数据集中学习。”
“每种语言都有各自有趣的地方。韩语、土耳其语、芬兰语、德语等语言都是粘着构词,词语结合起来构成新的词汇。这是一个有待解决的有趣问题。”
“越南语、汉语等变调语言,也是一个很有意思的挑战。要教会系统去处理这些语言。”
Speechmatics首席执行官Benediktvon Thüngen。
语言识别的传统路径要经过繁琐、昂贵的人工过程,专家要手动收集、清理海量数据。这是一个一次性系统,因此只关注使用最广泛的几种语言才算经济实用。
但是经过剑桥大学博士、Speechmatics首席技术官Tony Robinson数十年对神经网络的研究,Speechmatics可以通过识别基本声音和语法结构,在一天之内掌握一门语言的基础。
剑桥大学博士、Speechmatics首席技术官Tony Robinson。
该软件的主要用途之一是为电视提供准确、实时的字幕,并增加了专业个性化词典,如足球员姓名。
Benedikt说金融机构能够使用这一技术进行通话录音,以证明合规性和对PPI不当销售进行审查。他预言:“语音将成为与设备互动的主要机制。”
该公司白皮书提到,“我们的终极目标是为所有语言提供一个语言包。鉴于世界上约有7000种语言,这将是一个雄心勃勃的目标,我们希望有朝一日能够全部掌握这些语言。”
网友评论