美文网首页
Sora,从哑剧走向有声剧

Sora,从哑剧走向有声剧

作者: 银河星尘 | 来源:发表于2024-02-21 17:01 被阅读0次

2024年开年王炸,OpenAI发布的AI视频模型Sora,能够生成长达一分钟的视频,同时保持视觉质量和对用户提示的遵循。确实给影视行业带来了颠覆性的影响!但是现在的Sora视频更像是电影业初期时的「无声电影」。
短短几天之后,语音初创公司ElevenLabs放大招,直接用AI给Sora经典视频完成了配音。而且所有的配音全部由AI生成,没有一点编辑痕迹。
若想精确地实现「视频-音频」的无缝匹配,则需要LLM在其潜在空间内理解一些「隐式的物理原理」。这个属于视觉-音频联合学习(Audio-Visual Learning)领域。
那么,一个端到端的Transformer需要掌握以下能力,才能正确模拟声波:

  • 确定每个物体的种类、材质和空间位置。
  • 识别物体间的复杂互动,比如棍子是敲在木头、金属还是鼓面?敲击的速度如何?
  • 辨识场景环境,是餐厅、空间站、黄石国家公园还是日本神社?
  • 从模型的内存中提取物体及其环境的典型声音模式。
  • 应用「软性」的、已学习的物理规则,组合并调整声音模式的参数,或者即时创造全新的声音,类似于游戏引擎中的「程序化音频」。
  • 对于复杂场景,模型需要根据物体的空间位置,将多条声音轨道叠加起来。


    英伟达高级科学家Jim Fan

    当这项技术成熟之后,针对每个人的兴趣爱好,定向即时产生广告视频、小视频,这个能力将让广告投放方疯狂,真正形成了定向轰炸。在未来,可能我们的周围将无时无刻不被各种定向广告视频包围,请千万千万要捂紧你的钱包。

相关文章

  • 好看的影视作品的演员

    Nao Jinguuji Shiina Sora Matsushita Saeko Oohashi Miku Im...

  • 告诉朋友真相...(mofy)

    Sora’s made raspberry biscuits! Here you are,plenty for e...

  • 在逆境中翻盘,在绝望中蜕变

    蜕变,让世界从无声走向有声,从黑白走向色彩;蜕变,让天地一切都在进化,让世间充斥了生命;蜕变,让追寻蓝天、翱翔海底...

  • [AKB48]《1994年の雷鸣》中文日文罗马歌词

    ano hi wa sora ga hikattetatokiori mabataki suru you nisu...

  • #SorachanCoin#(#SORA#) get base

    https://www.finexbox.com/market/pair/SORA-ETH.html https:...

  • 和而不同

    一间小屋 你想唱歌 她想看剧 我想看书 歌有声 剧有声 书无声 却胜有声 知趣的人 离开吧 无所谓的人 继续吧

  • 哑剧

    心就要起飞 周五的酒杯 噪杂的北京,四通路公交车终点站。 男孩路过阳光下温柔的细语, 那片无声无息的秋天的气息。 ...

  • 哑剧

    南方和北方一样,男人和女人一样,沙漠的故事和海洋一样。用脚丈量着舞台,哑剧就可以粉墨登场。 我很熟悉这辆车、这条路...

  • 哑剧

    他们坚决主张,无论什么词汇,一概废除…… —— 《格列佛游记·飞岛国》 我的家乡,那个小镇,...

  • 哑剧

    我爱你,与你无关。 我手里抱着我的小兔子,和我想的你。神神叨叨念念N次,还是无疾而终。那么好看的你,那么干净的你,...

网友评论

      本文标题:Sora,从哑剧走向有声剧

      本文链接:https://www.haomeiwen.com/subject/nkxwadtx.html