算力舱绘图教程(2): 提示词优化

喵爸联萌

发布于254天前
创意设计版霸·老掉牙的设计师·只能依仗AI的艺术家·落伍的伪全栈·除了舌毒嘴贱手残并没有什么别的优点
上一篇:
[算力舱绘图教程(1): 文生图提示词架构](https://lazycat.cloud/playground/guideline/1326)

https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.aipod.comfyui
                                                             

首先,上一次的提示词是这样的:
>长得像日本明星的年轻女孩,活力偶像,皮肤白晳红润,黑色长直发,有一双会说话的大眼睛,穿着时尚的白色裙子,曼妙的身材,表情温柔生动,微笑地看着观众,眼中透出一抹淡淡的忧伤。背景是虚化的现代都市,阳光洒在她的脸上。专业杂志封面人像摄影师的杰作,高清照片。

![屏幕截图 2025-09-21 204704.png](https://dl.playground.lazycat.cloud/guidelines/319/2e0bfd26-7946-417a-b34f-6d31c3834fb0.png "屏幕截图 2025-09-21 204704.png")

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/c05225c6-da1d-491e-a3a6-d5f4b3c143f3.png "image.png")

其实我觉得已经很美了,基本上能切中我的审美,但是总觉得还有点“不食人间烟火”?换句话说就是“AI味”还是存在。

我们能不能再优化或修改一下以便生成更自然的图像呢?

首先让我们分解一下提示词的结构:

# 提示词的基本结构

上次说到这个基本结构是【人物特征+场景+色彩光线+风格】,分解开就是:

-【人物特征】长得像日本明星的年轻女孩,活力偶像,皮肤白晳红润,黑色长直发,有一双会说话的大眼睛,穿着时尚的白色裙子,曼妙的身材,表情温柔生动,微笑地看着观众,眼中透出一抹淡淡的忧伤。
-【场景】背景是虚化的现代都市
-【色彩光线】阳光洒在她的脸上
-【风格】专业杂志封面人像摄影师的杰作,高清照片

我们会发现人物特征说得特别多,其他部分就比较粗略,那么就让我们先在公式中增加更多的“参数”。

## 丰富场景
场景要有真实感,就要加上互动的内容,比如都市就要有行人和车。另外为了突出主体,我们要在开始就保持背景的模糊。

>背景是焦外虚化的现代都市,行人快乐而轻松,公交车和汽车来来往往留下慢速曝光的动感模糊

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/6837a547-79dd-442b-b28b-6c390f83fc3e.png "image.png")

## 丰富光线
阳光是很好的光线描述词,但只有阳光就会比较“干巴”,正常来说皮肤这么白嫩的小姐姐不会站在直射的阳光下吧?或许这就是我们觉得不够自然的地方。

>阳光洒在她的脸上,投射出淡淡的树影。

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/50f894f0-d2ed-4ea8-a7ae-6bcc3e49047c.png "image.png")

## 定义服装

只说裙子,AI就会搞得很简单,多少要加一点式样。这里只露肩就好了,你可以学习一下服装设计的词汇找到更多款式描述。

>她穿着时尚的露肩白色裙子

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/74d5557d-5814-4b2c-8738-8bf702dadb4d.png "image.png")

## 定义动作

手是人类很重要的“表情”部分,手不动的话,人物就比较死板。虽然现在的AI可以把体态姿势做得比较自然,但是还是要有手的动作描述会更好。

>双手交握在胸前。

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/173c954d-7ce8-421f-b18e-3de3d9a29584.png "image.png")

>露齿微笑,微微侧身,双臂交叉在胸前。

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/f24076db-2877-4d84-b7be-e5c89ccd5c5f.png "image.png")


# 更多的细节

上次有说到“美”和“美感”,以及画面与观众间的“共鸣”,记得吗?

没有什么比一些巧妙的小细节更容易打动观众以生成这种共鸣了。

细节就是你看到/或想象到某个具体元素后,继续探索视觉/思维后的新发现。比如发型、配饰、首饰……

让我们随意增加一点细节:

>黑色长直发,发梢有深紫色渐变,背着单肩银色漆皮小挎包,耳朵上有精致的银色耳环,戴着细细的银色项链

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/6b64f206-e8a2-46c2-a272-a26f242a93fc.png "image.png")

这样,整个画面的内容够丰富了,经过适当的修饰,现在完整的提示差不多是这样的:

>长得像日本明星的年轻女孩,活力偶像,皮肤白晳红润,黑色长直发,发梢有深紫色渐变,有一双会说话的明亮大眼睛,穿着时尚的白色露肩裙子,裙边有银色装饰花边。性感的身材,表情温柔生动,微笑地看着观众。露齿微笑,微微侧身,双臂交叉在胸前。眼中透出一抹淡淡的忧伤。背景是焦外虚化的现代都市,行人快乐而轻松,公交车和汽车来来往往留下慢速曝光的动感模糊。阳光洒在她的脸上,投射出淡淡的树影。专业杂志封面人像摄影师的杰作,高清照片。


![image.png](https://dl.playground.lazycat.cloud/guidelines/319/6bf41801-02e4-4f53-a888-6c437e57d569.png "image.png")

很像写小说是不是?毕竟写小说时的人物/景物描写其目的也是在读者脑中显示一幅画面。

可是……是不是还有什么不对劲?
--


# 缺陷美

所谓“AI味”,不光是指手指数量不对、四肢扭区、细节错误这些老问题。有时候过于完美才是硬伤。

正所谓“有缺陷才是完美的”,连缺陷都没有怎么能称得上完美呢?

所以有时候为了追求我们习惯的“凡间的美”,即真实感、接地气,我们需要人为给描述加一点不完美。

因为之前说过了,“你不说AI怎么会知道呢?”,你不提AI还以为你就是要无缺陷的画面,就像前面提到的阳光和手,不太合常理或不自然就会美得不真实。

你可以在任何地方试着增加“必要的缺陷”,但在这里让我们只是去掉原先提示中的“专业杂志封面人像摄影师的杰作,高清照片。”,改为:

>不完美的手机拍摄照片,轻微抖动的模糊边缘, 漏光,过曝。

*小技巧:必要时可以在参数中试着降低一点cfg值,让AI“较少遵守提示要求”,以便"更有缺陷"。但这个数值如果过小会降低生成质量,比如结构出错。另外对于Flux系模型官方不建议改cfg(默认1),只有SD和Qwen效果好些。*

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/12e30d02-e449-4fd8-b66d-087441afaf67.png "image.png")

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/a190fca7-f31b-4b28-9d77-72096de629db.png "image.png")



# 最终提示

现在结果是这样的:

>长得像日本明星的年轻女孩,活力偶像,皮肤白晳红润,黑色长直发,发梢有深紫色渐变,有一双会说话的明亮大眼睛,穿着时尚的白色露肩裙子,裙边有银色装饰花边,戴着银色珍珠耳环。性感的身材,表情温柔生动,微笑地看着观众。露齿微笑,微微侧身,双臂交叉在胸前。眼中透出一抹淡淡的忧伤。背景是焦外虚化的现代都市,行人快乐而轻松,公交车和汽车来来往往留下慢速曝光的动感模糊。阳光洒在她的脸上,投射出淡淡的树影。不完美的手机拍摄照片,轻微抖动的模糊边缘, 漏光,过曝。



![image.png](https://dl.playground.lazycat.cloud/guidelines/319/ad6752ee-7c42-456e-bb6c-c7a11e9e5744.png "image.png")

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/af115a42-e6c7-486d-83d2-8a6588b1795f.png "image.png")

英文版:
>A young girl who resembles a Japanese celebrity, a vibrant idol, has fair, rosy skin, long straight black hair with a dark purple tint at the ends, and bright, expressive eyes. She wears a stylish white off-the-shoulder dress with silver trim. She wears small silver pearl earrings and a small silver patent leather shoulder bag. With a voluptuous figure and a gentle, lively expression, she gazes at the viewer with a smile. She grins, leans slightly to the side, and crosses her arms. A hint of melancholy lingers in her eyes. The background is a modern city with a blurred, out-of-focus image. Pedestrians are happy and relaxed, while buses and cars pass by, leaving a slow-motion blur. Sunlight falls on her face, casting a faint shadow of the trees. The imperfect photo, taken with a mobile phone, shows slightly shaky, blurred edges, light leaks, and overexposure.

Flux1 Krea dev生成的结果可能更加自然:

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/2364a8b1-ffdd-4c74-9891-b7054b16f2c9.png "image.png")

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/1aa67bfb-c6e0-4d11-a55d-08ac34b2a875.png "image.png")

到目前为止,虽然提示词我们还可以继续优化下去,但感觉继续美化的意义不大了。

现在我们知道了只要遵循固定的架构和足够详细的内容,就可以生成美感度足够高的图片。你可以任意修改其中的关键词来生成更多不同的美图。


![image.png](https://dl.playground.lazycat.cloud/guidelines/319/4378aa89-02c6-48c9-af1e-b5bc1dae5a71.png "image.png")


下一篇我们讲一下如何更好地修改内容风格并尽可能发挥你的想象力。

评论

0

暂无评论

说点什么呢~
收藏
2
0
0