写点什么

你的新春照小红书包了!速来定制新春头像,技术让年味更浓

  • 2024-02-18
    贵州
  • 本文字数:2134 字

    阅读完需:约 7 分钟

你的新春照小红书包了!速来定制新春头像,技术让年味更浓

新年新气象,换个新春照迎龙年!

不藏了,近期全网爆火的 AI 写真项目 InstantID, 正是来自小红书社区技术创作发布团队。

为了迎接龙年春节的到来,我们全新推出「Spring Festival」新春风格,只需上传一张照片,30 秒内轻松定制年味满满的春节写真。

先来看看效果:

跨越千年的问候,“兵马俑”给你拜年了!



蒙娜丽莎在长城练瑜伽,氛围感满满。



爱因斯坦也在故宫前吃起了饺子,恭贺新春。



那如何用 InstantID 制作新春照呢?操作很简单:

  • 访问 Hugging Face Spaces 中的 InstantID 地址

    huggingface.co/spaces/Inst…

  • 上传一张照片,InstantID 默认风格为「Spring Festival」,点击 Submit 为你生成一个充满新春气息的照片。

当然,如果你想开启更多的创意玩法,还可以自定义添加 Prompt,风格自由搭配。

比如,这是费雯丽的照片,选择「Spring Festival」风格,未添加 Prompt 的效果。



为照片添加一些“魔法”——龙年春节自然少不了龙年元素,感受一下吃饺子、发红包、雪中赏梅的节日氛围。同一张照片,输入不同的 Prompt,30 秒照片焕新。



InstantID 很好地保留费雯丽的面部特征,仔细一看,甚至能还原手部动作、模拟飘雪时风吹动头发的动态效果。

不仅如此,我们还可以上传姿势图为参考,InstantID 生成的绝美侧仰照,很有神韵。



除新春主题外,InstantID 还有非常多的有趣玩法。比如让深度学习大牛、图灵奖获得者 Yann LeCun 变身为经典动漫角色,马里奥、海贼王...



按一年四季,随机生成你的动漫人格,脸部可幼态可成熟。



InstantID 尽情释放你的想象力,来套中国功夫对抗赛,也不是不可以~



InstantID 最独特的地方在于它只需要一张照片,不依赖模型,用时 30 秒就可以生成非常不错的风格效果。从效果和使用体验上来看,InstantID 作为一个高效的、轻量级、可插拔的适配器,赋予预训练的文本到图像扩散模型以 ID 保存的能力。

前不久,小红书技术团队的 5 位工程师发表论文,详细揭秘了 InstantID 背后的技术。



那为什么只需上传一张图 + 简单的提示,InstantID 就能实现高面部保真度,画面与人物统一得很和谐呢?

核心关键是 InstantID 不训练文生图模型的 UNet 部分,仅训练可插拔模块,在推理过程中无需 test-time tuning,在几乎不影响文本控制能力的情况下,实现高保真 ID 保持。



如图所示,我们通过一系列创新技术:弱对齐的 CLIP 特征替换为强语义的人脸特征、人脸图像的特征在 Cross-Attention 中作为 Image Prompt 嵌入、 以及 IdentityNet 来对人脸施加强语义和弱空间的条件控制,InstantID 在不牺牲文本控制能力的情况下,实现了高保真 ID 保持。



Instant 在多个方面展现出其独特优势,我们提出的主要贡献如下:


  • 提供了一种全新的 ID 保留方法,有效弥补了训练效率与 ID 保真度之间的差距。

  • InstantID 是可插拔的,与目前社区内文生图基础模型、LoRAs、ControlNets 等完全兼容,可以零成本地在推理过程中保持人物 ID 属性。此外,InstantID 保持了良好的文本编辑能力,使 ID 能够丝滑地嵌入到各种风格当中。

  • 实验结果表明,InstantID 不仅超越目前基于单张图片特征进行嵌入的方法(IP-Adapter-FaceID),还与 ROOP、LoRAs 等方法在特定场景下不分伯仲。它卓越的性能和效率激发了其在一系列实际应用中的巨大潜力,例如新颖的视图合成、ID 插值、多 ID 和多风格合成等。


还不赶紧上手体验一下,自定义你的春节写真。


Prompt 不知道怎么写?一些好用的“咒语”,拿走不谢~ 也欢迎在评论区晒出你的 Prompt。


  1. Flat illustration, a Chinese girl, ancient style, wearing a red cloth, smile face, white skin, clean background, fireworks blooming, red lanterns.

  2. A man  riding a colossal fire-breathing dragon, engaging in a space battle against extraterrestrial beings.

  3. A person dressed as a superhero, backed by a bizarre alliance of politicians, celebrities, and animals, defending Earth together.

  4. A girl wearing cheongsam, Milky Way, wind, spring festival, cartoon, red backgroud, Red Lantern, fireworks, smile, dressed, Chinese dragon.


另外,今年春节期间,2 月 7 日 至 25 日,我们与著名开源模型社区 Hugging Face  联手,在小红书 APP 上,特别策划「你的新春照我包了」有奖互动。

参与方式:


  • 在小红书 APP 内分享你用 InstantID 生成的新春照。

    (体验入口指路👉huggingface.co/spaces/Inst…

  • 带 #你的新春照我包了 话题发笔记,并关注和 @Hugging Face 小红书账号,让更多人看到你的创意。

  • 晒出你的 Prompt,分享你的新年愿望和期待,邀请朋友和家人一起参与,拼出新春照一条龙。

活动奖励:

  • 我们将根据参与笔记的互动和创意,送出由 小红书技术 REDtech 和 Hugging Face 提供的新年礼物!

  • 优质笔记将获得专属活动流量扶持,惊喜多多。



我们相信,通过开源,InstantID 能够激发更多开发者的创造力,推动 AI 技术的进一步发展,同时也让更多人享受到科技带来的便利和乐趣。

准备好了吗?一起来玩 InstantID,这个新年,因你而不同!


用户头像

2亿人生活方式分享背后的多模态学习 2022-04-11 加入

小红书技术团队官方账号,小红书技术创新与问题解读的分享平台,与你共前进。

评论

发布
暂无评论
你的新春照小红书包了!速来定制新春头像,技术让年味更浓_AI_小红书技术REDtech_InfoQ写作社区