Midjourney|文心一格 prompt 教程 [进阶篇]:Midjourney Prompt 高级参数、各版本差异、官方提供常见问题
Midjourney|文心一格 prompt 教程[进阶篇]:Midjourney Prompt 高级参数、各版本差异、官方提供常见问题
1.Midjourney Prompt 高级参数
Quality
图片质量是另一个我比较常用的属性,首先需要注意这个参数并不影响分辨率,并不改变分辨率,并不改变分辨率(重要的事情要说三遍)。
它改变的更多的是图片的细节,比如下面这个例子,下方第一张图是 0.25 ,你会发现最右边的图细节比第一张图多很多很多。
但低 Quality 也不是没有好处,它的好处是生成图片的时间会更快,换句话说,你可以花更少的 GPU 时间,我一般会用这个参数做一些探索性生成图,大方向没问题,再让模型丰富细节。
除了在 prompt 里输入外,你也可以在设置里,调整默认的版本,相关教程请查阅 Midjourney 基础设置。
Seed
你在使用 Midjourney 的时候,应该会发现,即使用相同的 prompt,每次生成的图片都会不一样。其实 Midjourney 会为每个生成的图片打上一个 seed 编号,你可以在 prompt 里加入这个 seed 参数,这样每次生成的图片就一样了,以下是官方的例子:
调用方法很简单:
那如何获得这个 seed?
找到你想要获得 seed 的图片,然后在其消息右上角有个 emoji 按钮,点击后会出现一个 emoji 菜单,然后在 emoji 菜单里输入 envelope ,最后点击 ✉️ emoji ,然后在图片下方就会出现一个 envelope 的 emoji,最后你会收到 Midjourney Bot 的私信推送,该消息上面就会有 Seed 号码。
Image Weight
这个翻译成中文是「图片权重」的意思。
当你同时用 img prompt 和文字 prompt 的时候,就可以通过这个参数设置到底更像图片还是更像文字,当这个参数越大,AI 生成的图片就越像原图,越小,就越像文字描述。
以下是 Midjourney 的官方案例,可以看到,数值越大,就越像原图:
Stop
这个参数跟 ChatGPT 里的 stop 类似,就是强制暂停模型。
Style
这个参数主要是用于切换 V4 模型中的分支模型。
我个认为觉的这个不是很好用,且因为 V5 已经推出,大家都在用 V5 了,所以未来我认为会淘汰(这个我猜测其实是 V5 的其他分支版本,早放出是为了收集数据)。所以就不做介绍了。
Uplight
当 Midjourney Bot 图片生成完成后,图片下方都会有一排 U 按钮,这些按钮做的事情就是这个 Uplight 参数做的事情,一般人都会通过点击按钮来使用,比较少在 prompt 里添加。
而且现在 V5 版本,U 按钮已经不会影响分辨率了,只是做为一个裁切图片的功能。所以这个参数也是一个我认为要被淘汰的参数。大家不必关心。
Upbeta
另一个我认为会被淘汰的按钮。
Video
我觉得这个参数很有意思,这其实是个类似录 gif 的参数。在 prompt 里加入这个参数,升成图片的同时,还会记录升成的过程,但可惜这个参数只支持到 V3,估计官方未来也会放弃吧,主要是没啥用,就是好玩。
2. Midjourney 各版本差异
V1、V2、V3、V4、V5
我们都用相同的 prompt 来看看各版本的差异,我使用的是官方案例里的 prompt:
从上图里其实你就能看到 Midjourney 的进化方向:
越来越丰富的细节,生成的内容也越来越真实。V1 和 V2 基本上就是简笔画,看看 V2 第四张图前景和背景的处理就很粗暴,到了 V3 背景和透视都变得更加合理,然后到了 V4 基本就是一个可用的状态。
分辨率越来越高。V1~V3 单张图是 256 x 256,到了 V5 单图已经默认是 1024*1024。
参数更多,Prompt 更加重要。这个在 V5 版本更加明显,感觉以前的版本,并不太能理解一些词,比如材料词 marble 之类的。但到了 V5 理解能力变强了。
艺术风格词变得更重要。这个结论暂时没有得到官方的认证,甚至有很多人认为 V5 版本是个更「通用」的版本,我的理解是 V5 提高了整个基准线,不需要太多描述词,就能生成一个「可以看」的图片,但如果要生成一张你跟你预期完全一致的图,其实变难了,你需要了解更多的 prompt。
然后我们再来看看更复杂的 prompt 看看版本的差异:
看看生成的结果,是不是差距非常大,从 V1 到 V5 的进化,Midjourney 大约花了 1 年的时间,如果仅算研发时间,我觉得应该不到 1 年,非常了不起:
Niji
最后再介绍一个 Midjourney 的特殊版本 Niji,这个版本其实是 Midjourney 跟 Spellbrush 一起开发的。「niji」是日语「にじ」,意思是「彩虹」 或者 「2D」。
它在生成动漫类的图片上,比较在行。举个例子,prompt 是 fancy peacock,左图是 v5 模型,右图是 niji v5 模型,右图更偏向于漫画风格:
3. Midjourney 官方 FAQ
本章节,主要是翻译官方的 Discord FAQ 文章,一些大家常见的问题进行翻译,各位可以在官方 Discord prompt-faqs 找到这些原稿。
4K、HD 等所谓的 Rendering 词有用吗?
官方解释 Rendering 词包括:
Rendering words include
4k, 6k, 8k, 16k, ultra 4k, octane, unreal, v-ray, lumion, renderman, hd, hdr, hdmi, high-resolution, dp, dpi, ppi, 1080p
.
有用吗?官方的解释是:
Rendering words do something to your image. They may also be what's breaking your prompt. So, as part of troubleshooting, we recommend removing them. Removing them often fixes issues with blurring, focus, clarity, and coherence.
意思就是会影响,有一定作用,但弊大于利。加入这些词,反而会破坏你的 prompt,特别是一些摄影场景,比如你需要用到诸如背景虚化等效果,再加上 4K 可能就会破坏背景虚化。
所以官方建议去掉这些词。
Prompt 里的词语顺序会影响结果吗?
官方解释:
Word order matters. Early words are generally more influential.
顺序会影响结果,越早出现的词,对结果影响越大。所以我设计的模版才会将「类型」放在最前面。因为这是我的最重要的目标。官方还建议:
避免列举词语:例举的意思是在 prompt 里写多个同一个意思的词。
使用具体的相关词语:越具体生成的图片越符合 prompt。
用句子片段:就是不要像写雅思作文那样,写定语从句、长难句,而是将这些词切开。
避免使用 4K、8K、16K 等安慰剂词汇。
为何 Seed 不生效?
Seeds can not transfer the style or appearance of images across jobs.
Seeds can not be used to 'bookmark' styles or appearance. (i.e. "Use seed XYZ for that!")
Seeds are the weakest force in Midjourney. In --v 5 they may not work as expected at all.
简单总结,就是这个功能在 V5 版本下非常不稳定,你不要预期它能跨图片传输 prompt。
版权声明: 本文为 InfoQ 作者【汀丶】的原创文章。
原文链接:【http://xie.infoq.cn/article/0bfe16edf73e0a555597483eb】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论