Disco Diffusion 使用

在「text_prompts」中代码中默认的语句为:
[“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.”, “yellow color scheme”]
翻译过来就是:
「由画家 Greg Rutkowski 和 Thomas kinkade 绘制的关于一座在汹涌的血海中闪耀的奇异灯塔的作品,以 Artstation 为参考库,黄色配色。」

「beautiful painting」为画种,你可以将它改为「ink painting(墨水画)」「oil painting(油画)」「comic(漫画)」等等。
「a singular lighthouse, shining its light across a tumultuous sea of blood」是内容描述,决定了你的画面中将出现什么,这里自由发挥即可。
「greg rutkowski and thomas Kinkade」是成图更接近哪位画家的风格,此处可以输入不止一位画家。
「Trending on artstation」是画作的参考平台,即 AI 主要从哪个平台获取参照,可以输入的平台有「Facebook」「Pixiv」「Pixbay」等等。
「yellow color scheme」是整个画面的主色调为黄色。

 

[类型]、[前置细节]、[环境]、[参考风格渲染方式和艺术家]
1、指定画作类型
A beautiful painting of
painting,drawing,sketch,pencil drawing,woodblock print,matte painting,child’s drawing,charcoal drawing,a ink drawing,oil on canvas,graffiti,waterocolor painting,fresco,stone tablet
油漆、素描、草图、铅笔画、木版画、哑光漆、儿童画、炭笔画、水墨画、布面油画、涂鸦水彩颜料、壁画、石碑

2、明确的主体
基础建筑主体:cyberpunk city 赛博朋克城市、country cottage 乡村小屋、gothic 哥特、church 教堂、space station 空间站、bellhouse 钟楼、pavilion 亭台楼阁、candy room 糖果屋、industrial city 工业城市、temple 寺庙、landscape风景/景观、majestic palace 雄伟宫殿

3、强烈的风格
①基础文化风格
cyberpunk赛博朋克,psychedelic 迷幻,surreal 超现实,vaporwave 蒸汽波,alien 外星人,modern 现代,ancient 古老,futuristic 未来主义,retro 复古,,realistic 现实,dreamlike 梦幻,funk art 恶臭艺术,abstract 抽象,pop art 波普艺术,impressionism 印象主义,minimalism 极简主义
②艺术家风格
Hiroshi Yoshida, Max Ernst, Paul Signac, Salvador Dali, James Gurney, M.C.Escher, Thomas Kinkade, Ivan Aivazovsky, Italo Calvino, Norman Rockwell, Albert Bierstadt, Giorgio de Chirico, Rene Magritte, Ross Tran, Marc Simonetti, John Harris, Hilma af Klint, George Inness, Pablo Picasso, William Blake, Wassily Kandinsky, Peter Mohrbacher, Greg Rutkowski, Paul Signac, Steven Belledin, Studio Ghibli

4、描写明确的细节
①不用否定
错误:pig that’s not white
正确:pink pig
②不要描述动作
错误:people are swimming
正确:people wear swimsuits

5、镜头语言
portrait 人像, headshot 大头照, ultrawide shot 超广角, extreme closeup 超近景, macro shot 微距 ,an expansive view of 远景

6、描写关键
①用尽量精确地描写
错误:There are some people there
正确:There are two people there (精准的数量)
错误:a monkey on roller skates juggling razor blades in a hurricane
正确:a monkey that’s a hurricane of chaos(简练的语言)
错误:an optimistic vision of an augmented reality future
正确:a solarpunk city filled with holograms(正确的时间)

7、参考描述
①语句句式
The tree of _________and____________
The temple of _________and____________
The gateway to _________and____________
The angel of _________and____________
The emperor/empress of _________and____________

___________in the style of a 70s science fiction novel cover
___________in the style of a metal album cover
___________in the style of cyberpunk noir art deco
___________in the style of glitch art

biblical fantasy illustration of ______________
a ancient chinese painting of ______________
a surreal and organic stone monument to ______________

②有趣的词
punk style list:朋克风格
cyberpunk,nanopunk,biopunk,cyber noir,steampunk,clockpunk,dieselpunk,decopunk,coalpunk,atompunk,steelpunk,islandpunk,oceanpunk,rococopunk,stonepunk,mythpunk,raypunk,nowpunk,cyberprep,postcyberpunk,solarpunk,lunarpunk,elfpunk,atompunk,neonpunk
Tarot Cards(Marjor Arcana): 塔罗纸牌(大阿尔卡纳)
The Fool, The Magician, The High Priestess, The Empress, The Emperor, The Hierophant, The lovers, The chariot, Strength, The Hermit, Wheel of Fortune, Justice, The Hanged Man, Death, Temperance, The Devil, The Tower, The Star, The Moon, The Sun, Judgment, The Word

 

参数:

batch_name:批处理、即该次创作图像的文件和文件夹名称
width_height:(默认为[1280,768] )所需的最终图像大小,需要是64像素的倍数
steps: 迭代次数 (250|50-10000 ) ,超过 250 – 500 步的额外步数的回报会递减
skip_steps: (10|integer up to steps) 噪声调度(降噪强度)跳过迭代
clip_guidance_scale:(5000|1500-100000) CGS 是您将使用的最重要的参数之一。 它告诉 DD 您希望 CLIP 在每个时间步骤向您的“提示”移动的强度。通常越高越好
tv_scale:  (0|0-1000) 总方差去噪。可选选项,设置为 0 以关闭。 控制最终输出图像色块的“平滑度”。
range_scale:(150|0-1000)可选选项,设置为 0 以关闭。用于调整颜色对比度。较低的 range_scale 将增加对比度。非常低的 range_scale 会创建减少的调色板,从而产生更鲜艳或类似海报的图像。 更高的 range_scale 会降低对比度,以获得更柔和的图像。
sat_scale:(0|0-20000)饱和度。可选选项,设置为 0 以关闭。如果使用, sat_scale 将有助于减轻过饱和。如果您的图像太饱和,请增加 sat_scale 以降低饱和度。
init_image:可选选项。在上面的图像序列中,显示的第一张图像只是随机噪声。但如果提供了 init_image,则扩散将以 init_image 作为其起始状态来替换随机噪声。(如果使用 init_image,您可能需要将 skip_steps 增加到总迭代步数的 50% 左右以保留 init 的特征。)
init_scale: (1000|10-20000) 负责控制 CLIP 尝试匹配提供的 init_image 的强度。(译者注:类似于 init_image 在扩散过程中的权重)这与上面的 clip_guidance_scale (CGS) 相平衡。 init_scale 太大,图像在扩散过程中不会发生太大变化。 而 CGS 太大,init_image 信息会丢失。
cutn_batches:(4|1-8) 每次迭代,AI 将图像切割为一个个小的图像块,称之为切片。并将每个切片与“提示”进行比较,以决定如何指导下一个扩散步骤。更多的切片通常可以产生更好的图像,因为 DD 在每个时间步有更多的机会微调图像精度。
skip_augs:作为其代码的一部分,DD 采用了“torchvision 增强”,在图像创建过程中引入随机图像缩放、透视和其他选择性调整。这些增强原本是想帮助提高图像质量,但可能对边缘产生您不想要的“平滑”效果。通过将 skip_augs 设置为 true,您可以跳过这些增强并稍微加快渲染速度。 建议您尝试使用此设置以了解它如何影响您的项目。
display_rate: (50|5-500) 在DD运行期间,您可以使用此变量监控正在创建的每个图像的进度。如果 display_rate 设置为 50,DD 将在每 50 个迭代完成时显示一次进行中的图像。
n_batches: (50|1-100) 此变量设置您希望 DD 创建的静止图像的数量。 如果您使用动画模式(详见下文),DD 将忽略 n_batches 并根据动画设置创建一组动画帧。
resume_run:如果您的运行被中断(例如您自己终止了进程,或者因为断开连接),您可以使用此复选框从中断的地方恢复您的批处理运行。但是,您不得更改批处理中的设置,否则无法可靠地恢复。 其他参数(run_to_resume、resume_from_frame、retain_overwritten_frames)控制您希望如何恢复该次运行。

 

加入文中的关键字,画面里会出现特有的风格/标识物/配色:
如加菲猫,吉卜力,宝可梦等等。截至目前120左右的modifiers。

Disco Diffusion Modifiers


加入文章里的关键字,画风会变成具体某位艺术家的强烈个人风格
截至目前2022年4月,共有400多位艺术家。

Disco Diffusion 70+ Artist Studies


使用不同艺术家和不同的模型,组合的效果参考
https://remidurant.com/artists/

 

A站喜欢的艺术家 https://www.artstation.com

Kevin Gnutzmans
Thomas Kinkade
Beeple
Erik van Helvoirt
Ivan Laliashvili
Mike Winkelmann
Michael Whelan
Ivan Aivazovsky
Jim Burns
Bob Eggleton
Ted Nasmith
Peter Elson
Miho Hirano
Elsa Beskow
Franklin Booth
Raymond Briggs
Bob Byerley
Fenghua Zhong
Jordan Grimmer
Ralph Horsley
Daniel Ridgway Knight

发表评论

您的电子邮箱地址不会被公开。