最近比較熱門(mén),就是可以單純通過(guò)輸入一段文字(提示詞),或者通過(guò)一張圖片,生成新的繪圖作品。
根據(jù)基礎(chǔ)模型和人物模型的不同,可以生成動(dòng)漫,Q版,3D,仿真各種類(lèi)型的任意圖片。
例,比如仿真風(fēng)格:
例,比如3D國(guó)風(fēng):
穩(wěn)定擴(kuò)散(Stable Diffusion)原名是潛擴(kuò)散模型(Latent Diffusion Model, LDM)。
引用:”擴(kuò)散模型的興起可以被視為人工智能生成藝術(shù)領(lǐng)域最近取得突破的主要因素……”
感興趣可以參考這篇: ??《Diffusion 和Stable Diffusion的數(shù)學(xué)和工作原理詳細(xì)解釋》
當(dāng)然,我們通常談到這個(gè)名字時(shí),指的是具體的項(xiàng)目:??https://github.com/CompVis/stable-diffusion
這類(lèi)Python對(duì)不搞計(jì)算機(jī)和人工智能的同學(xué)來(lái)說(shuō)太繁瑣了,
其實(shí)對(duì)于研究人員和科學(xué)家也繁瑣,要不怎么有Anaconda和Jupyter Notebook這類(lèi)工具呢……
這個(gè)是開(kāi)源項(xiàng)目,有興趣的可以自己研究。
所以不通過(guò)命令行,不去管各種環(huán)境,對(duì)普通大眾才是最簡(jiǎn)單的使用方式。
于是我們一般用的都是 Stable-Diffusion WEB UI :瀏覽器的Stable-Diffusion用戶(hù)界面(基于Gradio庫(kù))。
項(xiàng)目位置:??https://github.com/AUTOMATIC1111/stable-diffusion-webui
作者的官方截圖:
估計(jì)是考慮到WEBUI也需要簡(jiǎn)單的配置,以及需要模型,以及各種懶人的懶是無(wú)下限的。
所以居然還有大神制作了啟動(dòng)器,這下真的可以”一鍵使用“了。
SD-WebUI啟動(dòng)器 的官網(wǎng)……呃
作者自己寫(xiě)的唯一發(fā)布途徑嘛:??https://www.bilibili.com/video/BV1ne4y1V7QU
從里面你可以找到啟動(dòng)器本身,以及作者自己推薦的:NovelAI模型(7GB)整合包的下載連接。
?? 簡(jiǎn)單說(shuō)通過(guò)整合包,你可以不懂任何原理,就開(kāi)始AI作圖了。
啟動(dòng)器還可以管理SD-WebUI的版本,各種模型,以及插件。
截圖(高級(jí)選項(xiàng)):
截圖(SD-WebUI版本管理):
截圖(基礎(chǔ)模型管理):
假設(shè)你是通過(guò)上面的啟動(dòng)器的,選擇了適合自己的顯卡顯存,至少有一個(gè)Stable-Diffusion模型(比如整合包那個(gè))然后點(diǎn)擊”一鍵啟動(dòng)“了,則會(huì)出現(xiàn)一個(gè)控制臺(tái)(CMD窗口)。
控制臺(tái)中如果沒(méi)有出錯(cuò)的信息,默認(rèn)會(huì)自動(dòng)打開(kāi)瀏覽器,出現(xiàn)Stable-Diffusion的頁(yè)面。
由于我們用了整合包里面的擴(kuò)展插件,所以這里頁(yè)面是中文的了。
文生圖這頁(yè)里面,簡(jiǎn)單輸入提示詞,就可以成功生成圖片了。
PS:圖生圖也是一樣的,只是需要選一張已有的圖片作為參考。
OK,大功告成,洗洗睡覺(jué)了……
啊嘞嘞!等一下,你會(huì)說(shuō)左上角能選的,根本沒(méi)有我用的這個(gè)模型,OK?
基礎(chǔ)模型(stable-diffusion模型)決定了生成圖片的最基本風(fēng)格,
所以你可以多找?guī)讉€(gè)基礎(chǔ)模型來(lái)生成動(dòng)漫/真實(shí)的不同風(fēng)格的圖片。
需要注意的是,在你決定商用之前需要仔細(xì)看這些模型的協(xié)議和模型內(nèi)容,是否版權(quán)完善。
關(guān)于模型,你可以參考這里:??https://openai.wiki/painting/sd
或者在抱臉一類(lèi)模型網(wǎng)站上下載優(yōu)秀的模型,比如國(guó)風(fēng)3:??https://huggingface.co/xiaolxl/GuoFeng3
請(qǐng)注意這一步提到的是基礎(chǔ)模型(stable-diffusion模型),通常都是幾個(gè)GB大小。
通常名稱(chēng)是 xxx.ckpt
或者 xxx.safetensors
(如果有.safetensors可優(yōu)先選它)。
將下載的模型放入{你的項(xiàng)目位置}\models\Stable-diffusion
目錄當(dāng)中,
刷新一下或者下次打開(kāi)就可以看到了。
One more thing……
可以點(diǎn)擊這個(gè)紅色,呃粉色?的(Show extra networks)按鈕。
然后選擇 模型(ckpt) 這一頁(yè),通過(guò)點(diǎn)擊預(yù)覽圖也可以切換基礎(chǔ)模型。
作用和在左上角下拉列表選擇基礎(chǔ)模型是一樣的。
最開(kāi)始也許沒(méi)有預(yù)覽圖,你可以選個(gè)模型生成一張圖。
然后鼠標(biāo)指向這個(gè)模型預(yù)覽圖名字那里,點(diǎn)擊出現(xiàn)的”用當(dāng)前生成圖片替換預(yù)覽“,這樣就有預(yù)覽圖了。
LoRA: Low-Rank Adaptation (of Large Language Models)簡(jiǎn)單說(shuō)它是對(duì)大模型的微調(diào)。
可以參考:??https://zhuanlan.zhihu.com/p/612992813 或其他資料,這里咱先不討論原理。
我們可以簡(jiǎn)單理解為,這是個(gè)性化的人物模型。
??沒(méi)有或不使用LoRA模型也是可以生成圖片的,所以這一章節(jié)可以跳過(guò)。
同樣可以參考這里:??https://openai.wiki/painting/sd
或者國(guó)風(fēng)3也提供了LoRA模型:??https://huggingface.co/xiaolxl/GuoFeng3
請(qǐng)注意這一步提到的是loRA模型,一般幾十到幾百M(fèi)B大小。
文字里面通常包括lora字樣,以便區(qū)別基礎(chǔ)模型。
通常名稱(chēng)是xxx.safetensors
。
將下載的模型放入{你的項(xiàng)目位置}\models\Lora
目錄當(dāng)中,
同理刷新一下或者下次打開(kāi)就可以看到了。
和基礎(chǔ)模型一樣擊這個(gè)粉色的(Show extra networks)按鈕。
然后選擇 LoRA 這一頁(yè)。
生成預(yù)覽圖的方式和基礎(chǔ)模型一樣,這里就不重復(fù)說(shuō)了。
選用模型的方式是點(diǎn)擊模型,這時(shí)提示詞(prompt)中就會(huì)加入這個(gè)LoRA模型的提示詞,
比如吉卜力風(fēng)格的LoRA就是加入 <lora:Studio Ghibli:1>
,再點(diǎn)擊一下同一個(gè)模型,提示詞中就會(huì)取消它。
??可以用多個(gè)LoRA模型的提示詞噢!
似乎作用和LoRA很類(lèi)似,不重復(fù)寫(xiě)了。
從功能上似乎被LoRA模型取代了,略過(guò)。
提示詞是核心,選擇合適的提示詞才能生成更好的圖片。
提示詞需要用英文的,當(dāng)然也有中文提示詞的相關(guān)項(xiàng)目,有興趣可以自己研究。
輸入提示詞時(shí)候,有時(shí)可以看到聯(lián)想的內(nèi)容,這也是插件的功勞。
提示詞 prompt(上面的框框)是生成什么樣的圖片,
反向提示詞 negative prompt(下面的框框)則是避免什么內(nèi)容。
我們也可以通過(guò) 圖片信息 這一頁(yè),查看一張AI生成的圖片(原圖)是用哪些提示詞,哪些參數(shù)生成的。
以此來(lái)了解別人生成的很不錯(cuò)的圖片的信息,自己用來(lái)參考。
模板風(fēng)格就是一組有名字的提示詞+反向提示詞。
我們可以保存多組提示詞切換著用。
選擇模板風(fēng)格后,點(diǎn)一下這個(gè)小本子一樣的圖標(biāo),就可以把選中的模板風(fēng)格的提示詞內(nèi)容,加入到左邊的輸入框中。
輸出的圖片會(huì)保存到{你的項(xiàng)目位置}\outputs
的子目錄中。
比如文生圖就是txt2img,圖生圖就是img2img。
單張圖片在xxx-images下面。
批量圖片會(huì)合成一張大的網(wǎng)格圖放在xxx-grids下面。
分辨率好像沒(méi)什么可以說(shuō)的……
分辨率低生成比較快,分辨率高則比較慢,做墻紙一般需要1920x1080。
有些模型有分辨率的上限和下限,看說(shuō)明,最好不要超過(guò)。
沒(méi)辦法生成太大的圖,需要大圖可以再次縮放,這里沒(méi)必要寫(xiě)了噢。
通常是-1。
如果你生成了一張很滿(mǎn)意的圖片,但是想繼續(xù)微調(diào),可以固定用上次的隨機(jī)種子再次生成。
似乎模型都推薦用DPM++ SDE Karras
呢。
AI作圖經(jīng)常手腳不對(duì),其實(shí)也是可以調(diào)整的。
這些等我搞懂后,再另外記錄一篇吧,好累啊,先這樣了。
聯(lián)系客服