OpenAI王炸！文生视频模型Sora重磅登场

作者: 产品蔡老板 | 来源:发表于2024-02-16 22:37 被阅读0次

深度语言模型-GPT
空炸登场
NLP模型应用之三：GPT与GPT-2
下一个纪元的 AI --- 专访 Open AI CEO S
OpenAI新模型---DALL·E
2018-03-04
ChatGPT技术报告
大家好，给大家介绍一下，这是我隔壁寝室@……
王炸或炸王
人工智能故事生成——GPT-2

2月16日凌晨，OpenAI 推出了一项惊艳的人工智能技术Sora。该技术可以根据用户的文字描述，生成逼真的视频，为创意产业和视频制作领域带来了无限可能。从演示效果看，Sora 的表现非常出色。

Sora 凭借其卓越的能力，只需根据用户的文字描述，即可快速生成长达 60 秒的视频。这些视频中，场景细腻精致、角色表情栩栩如生，镜头运动也极为复杂。这无疑使视频制作变得更为高效、便捷，不禁让人们对文生视频的未来充满了期待。

目前Sora还没有开放使用。AIGC最本质的问题：算力资源一直没有有效解决。在GPT4.0文字生成都存在使用频率限制的情况下，将高质量文生视频的能力赋予千万级别以上的用户，这一目标在当前算力资源有限的情况下显得遥不可及。目前，我们的计算能力还无法满足大规模生成高质量视频的需求，因此，实现这一愿景需要我们进一步突破技术瓶颈，提升算力水平。

商业宣传是有目的性的，大胆猜测，openAI通过Sora的发布，目的是为了说服资本投钱。归根结底，技术上的进步，已经树立了信心，剩下的就是钱的事情了。

我对文生视频充满了浓厚的兴趣，坚信在未来的算力资源得到有效解决后，每个人都能释放出自己的想象力，创造出独特的视频画面。这一愿景预示着AI技术将惠及千家万户，这是一个非常美好的未来憧憬。

当然，也有人借此吹嘘文生视频在未来会颠覆电影产业、视频产业等等，其实没必要杞人忧天，但凡对电影产业稍微有点常识，都没必要焦虑。电影产业本质上是创意主导的产业。AIGC高级人工智能，从用户体验上来说，总结为：一流的逻辑，二流的内容，三流的文采。你问他问题，回答更加简明流畅，概括性极强，然后它能够抓住问题的要点。如果你就某个细节追问的话，它也能对答如流，所以它的上下文理解能力，已经和自然人是不相上下，但是在创意型问题上，其内容表达以及想象力空间，是不尽如人意的。

本质上分析，我们回归三个世界理论。第一个世界是我们接触到的物理世界，五官能够感知的。第二世界，人的心理世界，这个心理世界包括思想、意识、情感、主观体验，第二世界是一定和人的主体性是不能分离的。第三世界，第三世界是一个抽象的世界，这个抽象的世界，各种符号系统，就是今天世界上已经存在的各种知识、语言、逻辑，这个知识是独立于人的，它具有另外一种知识的客观性，全世界所有人能理解。AI所拥有的知识是第三世界的知识，它对第三世界的理解掌握，现在已经远远超过人类了。但是它对第一世界的直观感受和第二世界的心理活动。

所以AI再怎么强，它只有理性，它就是一个超级大学霸，但是它缺乏我们人类所具有的直觉、悟性、想象力。