什么是MuAViC？

MuAViC是第一个音视频语音翻译基准，也是最大的音视频语音识别多语言基准。它包含大约 1,200 小时的跨 9 种语言的转录数据。

在无数的日常情况下，背景噪音——交通声、音乐声、其他人说话的声音——让我们更难理解别人在说什么。人类经常使用来自其他感官的信息，尤其是视觉，来帮助我们交流（正如 Harry McGurk 和 John MacDonald 在 1976 年的研究“听嘴唇和看声音”中指出的那样）。例如，如果您在一场喧闹的音乐会上与朋友交谈，您可能会关注他们的脸部以补充您能听到的内容。

音视频开源网站
18个实时音视频开发中会用到开源项目实时音视频的开发学习有很多可以参考的开源项目。一个实时音视频应用共包括几个环...
10大机器学习开源项目推荐（Github平均star为1385）
翻译 | suisui 出品 | 人工智能头条（AI_Thinker）本文推荐的10大机器学习开源项目是由Myb...
谷歌AI年终总结
道德准则和AI 2018年，谷歌发布了谷歌AI准则，如减少了谷歌翻译的性格偏倚，探索发布了更多的数据集和模型，给大...
Meta AI新发布的超大规模语言模型-OPT-175B
Meta AI在2022年5月3日新发布的OPT-175B模型，该模型是现阶段第一个模型参数超过千亿级别的开放模型...
国家大力扶持人工智能，再不学习就晚了！
人工智能时代的未来 AI还有多远？无人驾驶、人脸识别、语音识别、实时翻译、智能安防…… 随着AI技术的不断发展...
R语言meta分析（5）累积Meta分析
R语言meta分析(1)meta包 R语言meta分析(2)单个率的Meta分析 R语言meta分析(3)亚组分析...
R语言meta分析（7）诊断性meta分析（meta4diag包
R语言meta分析(1)meta包 R语言meta分析(2)单个率的Meta分析 R语言meta分析(3)亚组分析...
R语言meta分析（10）功能强大的metafor
R语言meta分析(1)meta包 R语言meta分析(2)单个率的Meta分析 R语言meta分析(3)亚组分析...
R语言meta分析（9）连续数据的meta分析
R语言meta分析(1)meta包 R语言meta分析(2)单个率的Meta分析 R语言meta分析(3)亚组分析...
R语言meta分析(3)亚组分析
R语言meta分析⑴meta包 R语言meta分析(2)单个率的Meta分析 R语言meta分析(3)亚组分析原...