写点什么

如何评价 OpenAi 发布的视频生成模型 Sora?

作者:算法的秘密
  • 2024-02-27
    浙江
  • 本文字数:808 字

    阅读完需:约 3 分钟

人的智能是有限的,人工智能也是一样的,人工智能可以辅助人类、或者服务于人类,但是不能做危害人类的事情,像前期我们发展机器人一样,要限制它的发展,留下好的一面。这是金涌院士在和讯巨浪中的发言,人工智能的发展对于我们人类是有好处的,但是要以可持续性发展的眼光去看待这个问题。


去年十月份有幸参与了杭州人工智能谈论小组,大家都在讨论 LIm 大模型+视频生成这一领域,讨论的最多的就是太难,没办法使文本素材生成高保真的视频。没想到 2024 年开年第一件事,不是开年大吉红包拿来,而是 OpenAI 推出了 sora 这一文本生成视频大模型,被称为是世界模拟器。


简单的说,就是在 sora 中输入文字和关键场景,sora 可以生成 60 秒的视频/图像,最神奇的是 sora 可以像视频编辑器一样扩展插入的次序,可以向前、向后插入视频,以及 sora 可以无缝连接其他视频,可以在两个或者多个视频之间逐渐进行插值,在具体完全不同主题和场景构成的视频之间创建无缝过渡。这就是一个具体文字输入属性的视频编辑器,对于像最火的互联网短剧可以分分钟生成故事丰富且饱满的短剧来,这将对于影视圈带来一定冲击。


当然 sora 作为一个世界模拟器也有很多局限性,它不能准确地模拟许多基本相互作用的物理过程,像玻璃破碎、吃食物。


Sora 和过去的图片、视频生成方法不一样的一点在于。过去的图片、视频生成方法会将视频调整大小、裁剪或标准尺寸,而 sora 直接对原始大小的数据进行训练,这样在可变的持续时间、分辨率、长宽比上都做了优化。


在技术层面采用了 Transformer,因为 Transfomer 在各个领域都表现出了卓越的扩展特性。


Sora 在人工智能方面的野心很大,这可能就是去年创始人被裁员的原因吧。sora 不仅是一款视频生成器,未来 sora 可能会实现与世界互动、模拟数字世界。这些都是 sora 最大的特点,借用开头的一句话“人的智能是有限的,人工智能也是一样的,但是可以借助人工智能实现人的智能”,作为人类我们应该以可持续发展的眼光去看到 OpenAI 发布的视频生成模型 Sora….


发布于: 刚刚阅读数: 5
用户头像

专注技术研究的博客,公众号“雨夜的博客” 2019-01-05 加入

一个技能开发的创业者,五年开发老鸟,自研产品,自主创业!

评论

发布
暂无评论
如何评价OpenAi发布的视频生成模型Sora?_算法的秘密_InfoQ写作社区