近来因跑步的缘故,觉得这一个小时左右的时间浪费有点可惜,于是选择听书。两个多月的时间里,陆陆续续听了两本半。
第一本书由专业播音人员朗读,另两本由读书App的AI语音功能生成。不得不说,现在的AI语音技术已经相当成熟,综合评论下来,个人觉得真人朗读可以给九分,AI语音可以给七到八分。
发音
一般来说,真人朗读者如果下足功夫,是可以保证不出错的——发音存在争议的不纳入统计。我听的这本书仍有极个别多音字读错,但错误率已经极低。相比而言,AI语音对多音字的读错率会更高一些,说明AI对语境的判断仍不足,比如“长”字,受过完整小学语文教育的朗读者应该不会出错,但AI却错误率极高。
节奏
毫无疑问,一名专业的朗读者,节奏肯定是不应该有问题的。令我感到惊喜的是AI,虽然存在一些明显缺陷,但节奏感已经颇为明显。至于存在问题的地方,原因也已经提过,其实还是语境分析不足——这方面训练需要的数据量,用海量来形容已觉不足。
语速
这方面最简单,无论是真人还是AI,都能恰当处理。如有需要,你还可以通过App加速或减速。
情感
毫无疑问,当前乃至短期内肯定是真人优胜,情感方面的处理,本来就是AI相对棘手的问题,但我也从AI的读音力听出一些情感变化,相信以后也会不断改善。
网友评论