美文网首页机器学习和人工智能入门
自动配音或将成为现实?

自动配音或将成为现实?

作者: 翻译技术点津 | 来源:发表于2022-04-26 13:18 被阅读0次

以下文章来源于海上技客 ,作者Nini

当前,字节跳动正探索语音本地化。2021年10月,一篇名为《神经配音:根据脚本为无声视频配音》的论文探讨了通过机器合成的人类语言是否可以具备“专业配音演员的配音能力”。

作者写道:“配音演员能够充分利用韵律进行配音,如重音、语调和节奏,这样一来,他们的配音与预先录制的视频就能达到同步。”说到自动视频配音(AVD),合成语音需要与脚本和唇动保持一致。

语音合成(TTS)与自动视频配音都是为了生成可理解的语音,但只靠语音合成不足以达成目标,因为语音合成只使用文本作为输入,不太可能与视频完全同步。

另一方面,神经配音使用基于图像的扬声器嵌入模块,允许它产生与扬声器面部特征(例如性别、年龄)一致的语音。

作者说,自动视频配音最具挑战性的部分是对齐原始视频中的视频帧和音素。神经配音员的文本视频对齐器允许同步语音以适当的速度和情绪与视频中的唇动相结合。

接着,作者更明确地证明了神经配音器能够根据输入的面部图像控制音色。研究人员为12名男性和12名女性各挑选了10张图像,每张图像中的细节略有不同(例如头部姿势、光照、妆容等)。首先使用一个预先设定好的语音编码器,将音频对应的讲话者嵌入可视化,从语音编码器中导出音频中的语音特征。

结果显示,由同一讲话者的图像生成的语料形成了一个密集的集群,而代表每位讲话者的集群是相互分离的。此外,不同性别讲话者的面部图像合成的语音之间存在明显差异(如下图所示)。结论便是,神经配音器可以利用面部图像来改变生成的语音的音色。

讲话者嵌入可视化(左上、右下分别为12名男性、12名女性所得结果)

字节跳动旗下火山翻译产品经理刘坚在同济大学讲座中表示,现阶段影视行业寻找相似音色的配音员存在一定难度,而字节跳动通过外语音色模拟、肖像风格迁移,已经能够实现输出后的译后视频保留人物的音色特征,且口型与目标语言匹配,营造出自然的影片效果。

神经配音器无疑与上述音色模拟、口型修正等功能密切相关,无论是在技术界还是影视界,其发展意义重大。相信通过多方向探索,神经配音器将得以完善,自动配音或将成为现实。

名词对照:

TikTok: 抖音

ByteDance: 字节跳动

Neural Dubber: 神经配音器

Automatic video dubbing (AVD): 自动视频配音

Text-to-speech (TTS): 语音合成技术

注:本文采用MT+PE模式,原文地址请阅读原文

作者 | Seyma Albarino

机翻引擎 | Google Translate

译后编辑 | 王雨宁

撰稿排版 | 王雨宁

责任编辑 | 孔德

转载编辑:陈雨

关注VX公众号“语言服务行业”与“翻译技术教育与研究“,了解更多语言服务行业与翻译技术相关的资讯和洞察~

相关文章

  • 自动配音或将成为现实?

    以下文章来源于海上技客,作者Nini 当前,字节跳动正探索语音本地化。2021年10月,一篇名为《神经配音:根据脚...

  • 面对未来,教育怎么办

    未来是什么样子的?自动驾驶将要成为现实,科技不断进步,我们的生活将变得更加智能化,传统行业将发成重变,很多行...

  • 未来人类社会畅想

    未来,智能机器与自动化大规模代替了人类的劳动。 人类现有社会价值观将产生巨大变革。不劳而获将成为现实。 例如一种可...

  • 抖音怎么配音?抖音短视频配音图文版教程(超详细)

    配音视频的种类有很多,比如给动物进行配音、模仿影视剧片段或搞笑配音等。但无论是什么样的配音视频,都离不开视频和配音...

  • 理想的现实

    现实彷徨,理想美好,在理想与现实,彷徨与美好之间,若即若离,或隐或现,而努力的出现可以成为理想的现实,只剩美好,不在彷徨

  • 5.17 胡汶淇 旅酒1702 配音演员

    定义1:配音 标题:1.在中国,成为一名职业配音员究竟有多难?| 深扒 (因为喜欢这个职业) 2.回归配音演员...

  • 用印象笔记存档名片

    安卓客户端: 点击主界面「+」按钮›「拍照」,将摄像头对准名片或文件,自动识别结束后会自动保存笔记。 iPhone...

  • 科幻变现实?《三体》中“太空电梯”或将变为现实?

    阿基米德在很久之前就说过,给我一个支点,我可以撬起地球。虽然这个支点很难走,但是这也表达了元如果找到合适的辅助工具...

  • 沉迷学习-国际经济5-政策选择-2018-06-15

    一:市场自动调节 当一国的国际贸易出现大量顺差或逆差的时候,市场会自动将两国贸易调节至均衡。 1:金本位自动调节。...

  • 断舍离-看不见的世界在变化

    在断舍离里使用自动法则,启动自动成立的机制。并且将段身体自动化。也就是训练自己成为能够现代的最终彻底脱离没法收拾的...

网友评论

    本文标题:自动配音或将成为现实?

    本文链接:https://www.haomeiwen.com/subject/eewcyrtx.html