写点什么

8 款国内外免费 AI 生成视频工具对比实测!我们真的可以做到“一人搞定一部影视作品“吗?

作者:可信AI进展
  • 2024-09-02
    浙江
  • 本文字数:4030 字

    阅读完需:约 13 分钟

AI 生成视频工具的不断普及,其竞争赛道愈发激烈。产品宣发中的精美 AI 视频更是铺天盖地而来。

宣传必不可少,但实际生成 AI 视频效果如果和宣传差距太大,会大大降低用户的期待值,浪费用户的时间成本,资金成本。

因此本文将从 AI 生成速度、一次可生成视频内容时长、视频呈现效果、文本指令理解,长视频制作等维度对国内外热门 AI 视频生成工具进行实际评测,作为大家日后使用 AI 生成视频工具的一个参考。

本文测评的 AI 视频生成工具(均可免费使用):

  • 国内:即梦 AI、智谱清影、可灵 AI、Vidu

  • 国外:Runway、Pika、Stable Video、Luma Dream Machine

对比结果

首先用图表方式展示 8 款 AI 生成工具在 5 个维度测评评分结果


从图表上来看,国内的三款 AI 视频生成工具评分排列前三,而国外的四款工具中只有 Runway 超越了国产 vidu。

Pika 为此次评分中最低,即梦 AI 排名第一。

为何要打出这样的分数?评判的标准是什么?

为什么即梦 AI 比可灵高出 1.4 分,多在哪个方面?

接下来向大家一一进行分析。

1.AI 生成速度

使用统一提示词生成速度结果如下:

Pika:1mim<即梦、Runway、Stable Video:2min<Vidu:3min<清影、可灵:5min<Luma(等待几小时)

1.从 AI 生成速度来说,pika 使用 1 分钟即可快速生成视频,反应速度超越了所有的测试生成工具,因此生成速度评分最高

2.国产 AI 工具在一般情况下生成视频不会超过 5 分钟,但小编在使用可灵与清影时,多次在下午 3-6 点时,平台便出现拥挤情况,生成速度可达 7 分钟,甚至更久,但使用即梦和 vidu 时没有类似的情况发生。因此即梦,vidu 的评分比可灵和清影高。

3.除了 Luma,国外 AI 工具在生成速度评分都比国内的高。因为除 Luma 外,其他工具在使用时很少遇到拥挤状况,并且稳定在 2min 内。

4.为什么 Luma 获得最低评分?Luma 刚上线时,使用只需要等待不超过 5 分钟,后因服务器拥堵出现生成大量延迟——如今热度渐退。现在生成时长却高达几小时,难道再也回不去了吗?

2.一次可生成视频内容时长(免费情况下)

使用统一提示词测试结果如下:

即梦:12s>清影、Luma Dream Machine:6s>可灵 5s>Vidu、Stable Video 、Runway:4s>Pika:3s

1.在免费的条件使用下,即梦 AI 在两分钟生成视频内容时间最长可达 12 秒,获得最高分数。而可灵与即梦拉开差距的地方,一部分原因就是在此处,可灵免费情况下只能生成 5 秒。

2.在免费情况下目前只有 Luma 一次可生成 6 秒视频,其余均≤国内视频生成工具。(但小编认为花费几小时等待 6 秒视频,时间成本太高)。

3.视频内容呈现效果

视频内容呈现效果,将细分为 AI 拟人化、物理定律、运镜、人物一致性,视频风格,多人场景几个维度进行评定。

1.AI 拟人化:

统一提示词:一只柴犬手里拿着报纸,它正坐在沙发上看报纸

测试国外工具使用统一英文提示词:A Shiba Inu holding a newspaper in his hand and sitting on the sofa reading the newspaper

00:32 视频查看

从视频中可以看到,可灵 AI,即梦 AI 能够较好让柴犬模拟人类看报纸形象,而其他的工具只能让柴犬抓住报纸或者目光并不聚焦在报纸上

2.物理定律:

统一提示词:一个女孩正在将一杯牛奶倒入另一个杯子里。

测试国外工具使用统一英文提示词:A girl is pouring a glass of milk into another glass.

00:32 视频查看

从视频可以看到,即梦 AI 再一次很好的生成女孩倒牛奶,并且牛奶快满时立刻做出停止倒牛奶动作,整体非常丝滑,本次国内智谱清影、可灵 AI、Vidu 都很好表现牛奶倒进杯子的动作,但是从视频内容时长,女孩形象描绘等方面判断,即梦 AI 是最好的。

反观国外 AI 工具并不能很好展现这一次的指令,牛奶杯破碎,女孩自己喝牛奶等视频出现。

3.运镜轨迹:

统一提示词:两只蝴蝶停落在花朵上,视频画面由远到近不断的放大。

测试国外工具使用统一英文提示词:Two butterflies landed on the flower, and the video screen continued to zoom in from far to near.

00:32 视频查看

从视频可以发现,可灵 AI、即梦 AI、清影可以很好描绘清楚两只蝴蝶,视频画面由远到近的运镜规则和保持数量的一致性,但这也与他们存在控制运镜轨迹的选项有关。

但相同条件下反观国外 AI,Stable Video,pika 有可以控制运镜轨迹的选项,但是 Stable Video 败在了画质上,pika 虽然有较好的运镜,但是败在了只描绘了一只蝴蝶。

4.人物一致性:

统一提示词:女孩吃完西瓜,然后开心的笑了。

测试国外工具使用统一英文提示词:The girl ate the watermelon and smiled happily.

00:32 视频查看

从视频可以看到,几款测评工具中只有 vidu、可灵 AI、即梦保持较好的人物一致性。可灵 AI 对于女孩吃西瓜和笑的五没有出现五官扭曲的状况,整体自然流畅;vidu 中小女孩五官和身体没有扭曲,并且很自然的做出了打招呼的动作;即梦稍逊色于可灵、vidu,出现了短暂的五官模糊。其他的视频工具生成的内容均出现人物五官前后动作的扭曲。

5.视频风格:

统一提示词:视频生成卡通形象,一只企鹅正在大海里游泳。

测试国外工具使用统一英文提示词:The video generates a cartoon image of a penguin swimming in the sea.

00:27 视频查看

从视频可以看到,即梦 AI 刻画的企鹅卡通形象更加生动,但貌似突破了指令限制——企鹅正在海上冲浪;卡通版企鹅游泳的动作清影描绘的更加生动。此次国外 AI Stable Video 不能参与测试,因为每天只有 3-4 次免费机会使用。而其他的工具并没有刻画出卡通企鹅游泳的视频形象。

6.多人场景:

统一提示词:很多老人在同一个超市里购买鸡蛋。

测试国外工具使用统一英文提示词:Many old people buy eggs in the same supermarket

00:27 视频查看

从视频可以看到,即梦 AI,清影,Runway 对于很多老人进行了较好的描绘,清影更是描绘了很多老人忙碌购买鸡蛋的场景,而国外工具之多描绘四五个人的形象。

通过 6 个维度对视频呈现效果的测试,我们可以发现即梦 AI 基本扛过了每一次的测试;清影在 AI 拟人化、人物一致性方面存在欠缺;可灵 AI 在人物一致性,卡通形象刻画上略显逊色;vidu 只在其中几个测试中表现良好。而国外工具中只有 Runway 通过一次测试。

因此即梦 AI 成为视频内容呈现效果评分最高得主。

4.文本指令理解

统一提示词:一只顽皮的虎斑猫在清澈的水池里游泳。这只猫正在游泳,爪子伸开,在水里激起涟漪。池子周围是绿色植物和一些漂浮的泳池玩具。阳光在水面上投下倒影。

测试国外工具使用统一英文提示词:A playful tabby cat swimming in a clear blue pool. The cat is mid-stroke with its paws outstretched, creating ripples in the water. The pool is surrounded by lush green plants and a few floating pool toys. The sun is shining brightly, casting reflections on the water's surface

在本次测试中,清影,可灵对于“猫咪游泳”,“涟漪”,“阳光在水面投出阴影”等文本提示词做出了较好的理解。清影中猫咪游泳更加自然,两者对于水面动态效果刻画的较好。

00:20 视频查看

在国外 AI 视频生成工具中,Runway、Pika、Stable Video 在内容呈现效果,文本指令(将指令翻译成英文后生成)理解都远不及国内 AI。Stable Video 出现猫咪“双目失明”的一面;Runway4 秒视频却保持静止不动;短短 3 秒的 Pika 视频更难于表现指令内容。

00:11 视频查看

有人提出 Luma Dream Machine 过了几小时肯定能生成出较高质量的视频

00:05

但实际上 luma 的文本指令理解能力较差,猫咪只做出转头动作。提示词并没有给出摇头指令,没有很好的理解“这只猫正在游泳,爪子伸开,在水里激起涟漪。提示词,因此时间成本花费情况下依然得不到满意的视频。但是总体来说,luma、Runway 对于画面细节的刻画做的很好,

5.长视频制作

如果只用 AI 视频工具来制作,目前对于长达几十秒,几分钟的视频是有一定的难度的。

大部分需要生成许多份 AI 的碎片视频拼凑在一起;要保证视频中人物外貌的一致;AI 是否准确理解提示指令...等等因素困扰着我们

目前实测的国内外工具中,可灵与即梦可以在原来的基础上延长视频,但需要开通该平台的会员才可以使用,

其延长效果并得不到保证,需要不断的试错。试错成本预估多少,我们不得而知,像是在赌注。

(小编在前不久开通某 AI 视频生成工具的一个月会员,赠送的生成视频额度两天内直接消耗完毕,还没有较满意的结果。)

总结

通过以上测试不难看出,国内 AI 生成工具的性价比,比国外要更胜一筹。但在评比中,国外 AI 生成视频 Runway 还是稍领先 vidu0.2 分。

还在想国外 AI 生视频并没有那么太糟糕,但今日得知 Runway 在 Hugging Face 上的内容全部删除...这会影响后续我们使用它生成内容吗?难道真的如名字一样要 run way 了吗..我们静待发展。目光再次转回国内,即梦 AI 在多轮测试中可以获得榜首,可灵 AI、清影紧随其后。

可灵评分低于即梦主要原因是——在免费情况下生成内容时长较少;视频内容呈现质量逊色一筹。

但我们最终的目的并不是排列名次,而是想选出目前较优秀的 AI 视频生成工具,通过它们的帮助,让我们可以一个人自编自导一段精彩视频甚至很久。

通过以上不断对比。在未来 AI 视频创作中,我总结一个 AI 使用生成视频方法,供大家参考:

  1. 首先使用即梦 AI 与清影生成 2-3 次视频检测自己的提示词是否需要修改,因为清影是无限制免费使用的,即梦每日可免费生成至多 26 次,可灵只有 6 次机会。

  2. 提示词修改好后,优先使用即梦 AI 进行视频生成,因为通过上面测试它为最优。

  3. 特别提醒的是:需要生成运动轨迹十分明显的视频,可以拿出可灵 AI 进行生成。生成其余不同风格可以继续使用即梦 AI,它对人物刻画十分精细。

  4. 想要生成一段连续的,视频主角不变的长视频,需要投入资金使用。但根据小编的资金投入经验,我认为只要选择一个月会员进行尝试即可。

作为用户完成测试后,发现官方宣传视频可信度是令人怀疑的,免费的额度是完全不够用的,长视频制作依然比较困难,依然需要资金投入来不断的试错。

这时翻到网友制作的关于 Sora 的 Meme...

期待未来 Sora 对广大网友正式开放,为现在的 AI 视频生成的低迷状态带来转机。

文章推荐

AI真“卷出天际”!我国发布全球首个月球专业大模型;0代码可做游戏,谷歌发布世界首个AI游戏引擎|AI日报

OpenAI“草莓项目”最快今年秋季发布!苹果将于9月10号推出首款AI iPhone|AI日报

发布于: 刚刚阅读数: 3
用户头像

分享SPG,AGL,ACE和LLM在金融领域的进展。 2023-12-25 加入

还未添加个人简介

评论

发布
暂无评论
8款国内外免费AI生成视频工具对比实测!我们真的可以做到“一人搞定一部影视作品“吗?_AI测评_可信AI进展_InfoQ写作社区