写点什么

一键生成视频!用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

  • 2024-04-09
    浙江
  • 本文字数:1697 字

    阅读完需:约 6 分钟

简介: 本教程将带领大家免费领取阿里云 PAI-EAS 的免费试用资源,并且带领大家在 ComfyUI 环境下使用 SVD 的模型,根据任何图片生成一个小短视频。


答疑群:加入【PAI-AIGC 活动答疑群】搜索钉群: 52485000325


活动链接:https://developer.aliyun.com/topic/pai/svd

SVD 技术介绍

Stable Video Diffusion(以下简称 SVD),是一个图像到视频模型模型,能够以每秒 3 到 30 帧的可自定义的帧率生成 14 帧和 25 帧的视频。去年 11 月,Stability.AI 发布了它的 1.0 版本。

而这个 1.1 版本的模型经过训练,可在 1024x576 的分辨率下生成 25 帧。总体上他是一个生成短视频,类似 gif 形式的一个模型,而这个也是目前来说开源并且在直接生成视频的模型效果比较好的一个了。

还有一点需要注意,这个 SVD 和我们常用的生成视频类的操作,比如它和 AnimateDiff 相比,这是不一样的技术。但他们也可以同时放在一起使用,比如我们先用 SVD 生成一个视频,hires 提升分辨率后再用 AnimateDiff 重绘等等,这又是后话了。


资源领取

点击https://click.aliyun.com/m/1000391701/ 领取 PAI-EAS 免费试用 1 个月 A10/V100 资源。注意这个免费每日是有一定限额的,先到先得哦~



等待开通完成,点击前往控制台



如果免费额度用完了,可以购买 PAI-EAS 59 元抵扣 200 元资源包 https://www.aliyun.com/activity/2024purchase/bigdata_ai?



来到 PAI 控制台后,推荐大家在这里切换区域为 华北 2(北京),组合开通勾选 OSS 的选项,因为已经开通过所以默认勾上了。然后等待部署,部署完成后就可以前往默认工作空间。



找到左侧的 EAS 服务来部署一个实例。首次使用的时候我们需要先开通授权一下服务。

部署 ComfyUI

点击部署服务,自定义部署。



自定义输入实例名称,然后在镜像内找到 comfyui,版本选择 0.3。



在下面选择资源信息,注意这里非常重要,需要选择试用活动的 GPU,推荐大家选择 A10 的 GPU,如果缺货也可以选择 V100、T4 等。



选择完成,都配置好后,我们点击部署,等待部署完成。由于这个镜像预制好了很多节点,所以部署可能要等上几分钟到 10 分钟左右。如果觉得等了很久也可以点进去服务日志查看日志输出,部署情况。等到看到这行“运行中”,即为部署完成了,我们就可以直接进入 ComfyUI 了。


启动 ComfyUI 进行模型推理

  1. 单击目标服务的服务方式列下的查看 Web 应用




2. 在 WebUI 页面进行模型推理验证。

我们前面提到了 SVD 是一个图片生成视频的模型,所以这里左侧是一个文生图的工作流,首先生成了一张图片。然后再把这张图片输入到右侧的 SVD 模型,进行视频生成。

根据需要,选择文生图的模型和图生视频的模型,本方案使用默认配置。然后在 CLIP 文本编码器中输入 Prompts,修改长宽为 16:9(例如 384:216),单击提示词队列, 等待工作流运行完成即可获得 AI 生成的视频。




3. 请在【合并为视频】将视频改为 GIF 格式,视频生成后,右键单击生成的视频,选择 Save preview 保存图像,即可将生成的 GIF 格式视频保存到本地,通过活动页【提交作品】参与活动!




ComfyUI 参数讲解

左侧的文生图可以调节模型,分辨率。然后是正负 prompt,采样时候的种子,采样器等等。都可以随意修改。



然后来看 SVD 这边的参数。首先就是这个 SVD 图像到视频的条件。设置宽、高,这个是视频的分辨率,不要调的太大。然后是帧数,就是一共生成多少帧。动态 bucketid 这个值越大,画面运动幅度越大。帧率就不用多说了。



然后是这个线性 CFG 引导。这个摆的位置有些靠下,其实他是在模型和 k 采样器之间的。他的作用是在不同的帧之间,按线性来缩放 CFG 值,他会从这个最小 CFG 值随着帧数按线性增大到 K 采样器设置的值。比如我们这个节点设置了为 1,那么实际上的 CFG 就是跟随帧数从 1 变化到 2.5。



整体来说,这个工作流就是一个入门的文生视频工作流,如果我们有需要,也可以把生成图像部分换为自己的一个图像输入,就是最原本的 SVD 图生视频了。

那么后续还有没有更高级的玩法呢?当然有,这里采样器输出的是每一帧的图像,我们当然也可以为他接上高清修复的流程,让他能放大,再接个其他的重绘流程都是可以的。后续就留给大家任意发挥了~


常见问题

更多操作问题可参考:https://help.aliyun.com/zh/pai/use-cases/deploy-ai-video-generation-application-in-eas?

用户头像

还未添加个人签名 2020-10-15 加入

分享阿里云计算平台的大数据和AI方向的技术创新和趋势、实战案例、经验总结。

评论

发布
暂无评论
一键生成视频!用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流_人工智能_阿里云大数据AI技术_InfoQ写作社区