如何评价 OpenAi 发布的视频生成模型 Sora?
人的智能是有限的,人工智能也是一样的,人工智能可以辅助人类、或者服务于人类,但是不能做危害人类的事情,像前期我们发展机器人一样,要限制它的发展,留下好的一面。这是金涌院士在和讯巨浪中的发言,人工智能的发展对于我们人类是有好处的,但是要以可持续性发展的眼光去看待这个问题。
去年十月份有幸参与了杭州人工智能谈论小组,大家都在讨论 LIm 大模型+视频生成这一领域,讨论的最多的就是太难,没办法使文本素材生成高保真的视频。没想到 2024 年开年第一件事,不是开年大吉红包拿来,而是 OpenAI 推出了 sora 这一文本生成视频大模型,被称为是世界模拟器。
简单的说,就是在 sora 中输入文字和关键场景,sora 可以生成 60 秒的视频/图像,最神奇的是 sora 可以像视频编辑器一样扩展插入的次序,可以向前、向后插入视频,以及 sora 可以无缝连接其他视频,可以在两个或者多个视频之间逐渐进行插值,在具体完全不同主题和场景构成的视频之间创建无缝过渡。这就是一个具体文字输入属性的视频编辑器,对于像最火的互联网短剧可以分分钟生成故事丰富且饱满的短剧来,这将对于影视圈带来一定冲击。
当然 sora 作为一个世界模拟器也有很多局限性,它不能准确地模拟许多基本相互作用的物理过程,像玻璃破碎、吃食物。
Sora 和过去的图片、视频生成方法不一样的一点在于。过去的图片、视频生成方法会将视频调整大小、裁剪或标准尺寸,而 sora 直接对原始大小的数据进行训练,这样在可变的持续时间、分辨率、长宽比上都做了优化。
在技术层面采用了 Transformer,因为 Transfomer 在各个领域都表现出了卓越的扩展特性。
Sora 在人工智能方面的野心很大,这可能就是去年创始人被裁员的原因吧。sora 不仅是一款视频生成器,未来 sora 可能会实现与世界互动、模拟数字世界。这些都是 sora 最大的特点,借用开头的一句话“人的智能是有限的,人工智能也是一样的,但是可以借助人工智能实现人的智能”,作为人类我们应该以可持续发展的眼光去看到 OpenAI 发布的视频生成模型 Sora….
版权声明: 本文为 InfoQ 作者【算法的秘密】的原创文章。
原文链接:【http://xie.infoq.cn/article/37bddbb08861830fe3e7e1256】。文章转载请联系作者。
评论