“她”来了,陪伴赛道巨变!为 GPT-4o 加上你的一个数字分身
OpenAI 的每次发布,感觉都会干翻一个行业。昨晚 GPT-4o 的发布,情感陪伴这个赛道像是又要掀起一番惊天巨变。各位创业老板们摩拳擦掌,无数创意精英又要踏入新的征程。
开源社区一定也异常兴奋,相信 Huggingface 和 Github 马上又会孕育出新宠,大家都期待做出 AI 时代的 Super App,至少也要是一个 Killer App,正如去年暑假大红大紫的妙鸭相机和当下的 Kimi Chat。而 Remini 刚刚推出的黏土风格和 jada 风格的滤镜,又掀起了图片创作的小高潮。
彼时,10 块钱的妙鸭相机横空出世,9 块 9 就能制作出自己的数字分身,平均排队时间竟然超过了 5 个小时。而短短 4 个月之后,开源文生图平台 Stable Diffusion WebUI 上就已经支持类似的功能,甚至还支持了简单的文生视频和换装,在 4090 上轻松实现了设计自由。一些算力平台迅速跟进,例如 AutoDL 和 Lanrui 上,都可以找到现成的镜像,一键启动。笔者近期就在京东云新发布的智算平台上,尝试了这个名为 EasyPhoto 的 SD 插件,之所以选择京东云平台,无它,唯价低耳!(顺便说一嘴,加它们微信小助手,可以领取 2 小时的优惠券)。
恰好昨晚 OpenAI 发布会,就当作蹭蹭热度,为 GPT-4o 加一个数字分身。
先上图,我试了三个功能,包括数字分身(类似秒鸭相机生成海马体照片),多人换脸,以及文生视频,效果都相当不错。
这是数字分身效果
这是多人换脸的效果:
这是生成视频的效果:
下面介绍下怎么一步一步使用 sd-webui-EasyPhoto 来完成上面的创作的。
插件的代码路径为:https://github.com/aigc-apps/sd-webui-EasyPhoto
为了省钱,我选择了使用京东云的智算平台进行安装,因为已经默认安装了 Stable Diffusion WebUI,所以只需要安装插件就行。这个平台的使用和其他家类似,注意启动实例时,记着要选择 Stable Diffusion 应用,待实例运行后,在操作栏-应用,点击 Stable Diffusion 就能打开 Stable Diffusion 的页面。
在 Extensions 选项卡中,点击 Install from URL,输入插件的代码路径,点击 Install,稍等几分钟,这个插件就安装好了。
安装完成后,就能在页面看到 EasyPhoto 的标签栏了。需要在 Setting 标签页中将 ControlNet unit number 设置为 4,点击 Apply settings,最后 Reload UI。
在 EasyPhoto 标签栏下,找到第一个 Train 标签,根据提示,上传 5~20 张你自己的半身照片,点击 Start Training 开始训练,会提示你输入一个 userid,然后就开始训练了,训练过程大概会持续 25 分钟左右。
右边的参数不用调整,直接使用默认的就行。训练完的模型,会保存/data/apps/stable-diffusion-webui/outputs/easyphoto-user-id-infos 目录下,有兴趣的同学可以从 JupyterLab 的终端,或者使用 SSH 登陆进行查看。
数字分身训练完成后,就可以使用模型进行各种好玩的创作了。例如第二个标签就是照片换脸(Phote Inference),可以选择平台自带的模版,也可以自行上传一个明星照片进行换脸,在下方选择刚刚生成的你的数字分身 ID,点击右侧的 Start Generation,等待大概 5 分钟,就能生成一张你的明星照片了。如果你训练了多个数字分身模型,也可以选择多脸替换,这样可以创作出一些搞笑的 CP 照。
在右侧的 Video Inference 窗口,可以进行视频生成创作。虽说生成的效果和 Sora 还是有很大差距,但对很多场景,已经够用了。操作很简单,先选择一个视频场景,然后选择你的数字分身 UserID,点击 Start Generation 按钮就开始生成了。
我们可以试着调整下 Prompt,以获得更好的场景描述,可以点击左下角的高级选项,调整下视频的格式和长度,默认为 gif 格式,可以改为 MP4 格式,设置 Video Max num of frames 为视频的长度(秒数)* Video Max fps,这样就可以生产长视频了。
这就是最简单的 EasyPhoto 的入门教程了,大家可以亲自上手实践下,探索更多有趣的玩法,反正有 2 个小时代金券可以白 P
版权声明: 本文为 InfoQ 作者【京东科技开发者】的原创文章。
原文链接:【http://xie.infoq.cn/article/a92523831506cd6284b681771】。文章转载请联系作者。
评论