這兩年 AI 人工智能是火的“一塌糊涂”,無論是 AI 人工智能,還是 AI 語音合成,又或者今天要聊的 AI 繪畫,這些 AI 產(chǎn)品無疑給人類的發(fā)展添加了更高效、更快速的“助燃劑”。
在以前,AI 只是個概念,可放在當下,它是實實在在的產(chǎn)品。世界各地的科技巨頭紛紛推出自己的 AI 產(chǎn)品,就在前兩天的 Google I/O 大會期間,Google 一口氣推出 25 款 AI 產(chǎn)品,可見 AI 的開發(fā)對這些科技公司有多重要。
話題扯遠了,在中國古代,歷史文人黑客留下了寶貴的財富,而畫作又更多是其中之一。在中國古代繪畫主要以山水畫、花鳥畫、人物畫和工筆畫為主要類型。
山水畫:又稱“山水卷”,是中國繪畫中最重要的一種繪畫風格。它通常用水墨作畫,反映自然界的風景,象征自由、自在和超然。山水畫的特點是注重形式結(jié)構(gòu)的整體性和造型語言的多義性,具備深厚的哲學意味,被譽為“中國繪畫三絕”之一。
花鳥畫:描繪花卉和各種禽鳥,反映了中國文化對自然的尊重和喜愛。花鳥畫在中國藝術(shù)中占有重要地位,具有濃郁的文人氣息和高雅的審美品味。
人物畫:描繪人物形象及其衣著、動作和情感表現(xiàn)等,反映了中國文化對于人類和人性的關(guān)注和探索。人物畫的發(fā)展歷程長達數(shù)千年,在中國傳統(tǒng)繪畫中占據(jù)著非常重要的位置。
工筆畫:是一種顏色飽滿、線條精細、細節(jié)描繪豐富的中國傳統(tǒng)繪畫形式。工筆畫通常采用細軟毛筆、顏料和水墨細心描繪,形成了獨特的傳統(tǒng)美學風格。
而西方繪畫同樣具有多種類型,其中比較典型的包括肖像畫、風景畫、歷史畫、宗教畫、抽象畫等。
《清明上河圖》是中國歷史上著名的繪畫作品之一,由北宋宮廷畫家張擇端創(chuàng)作于 12 世紀中葉,描繪了北宋東京汴京城某一清明節(jié)日的繁華景象。這幅畫作結(jié)構(gòu)復(fù)雜、構(gòu)圖精妙、細節(jié)飽滿,被譽為中國繪畫藝術(shù)杰出的代表作之一,對中國繪畫史和文化傳承產(chǎn)生了重要的影響。
相信絕作為中國人基本上都見過《清明上河圖》,而《清明上河圖》是一幅巨型絹本紙質(zhì)的卷軸畫,采用工筆人物、寫意景物的表現(xiàn)方式。其寬 28.5 厘米,長 528.7 厘米,由 24 個連排木箱裝裱。
《清明上河圖》局部
張擇端在創(chuàng)作這幅畫的時候,采用了細膩精致的繪畫技法,以墨線描繪輪廓,再逐層填彩,細致入微地描繪出景物、人物和建筑之間的關(guān)系。每一幅畫面都非常細致,富有變化,體現(xiàn)出作者高超的繪畫能力和藝術(shù)素養(yǎng)。
縱然張擇端畫家用高超的繪畫功底繪制出的作品非常出色,可是如果通過現(xiàn)有的 AI 技術(shù)來還原當時真實的場景又會是怎樣?
有人就這么做了,在 Github 上有位李同學就通過 Stable-Diffusion 把這幅卷軸畫進行了“人物 3D”化,而這樣看著會更真實。
《清明上河圖》AI 局部
截取相同位置的 AI 圖像,我們可以看到非常真實的圖像。
《清明上河圖》AI 局部
《清明上河圖》AI 局部
縱然圖像在放大后看到的細節(jié)并不完美,但是通過 AI 手段我們可以很好的還原畫作中的真實場景。
由于 AI 圖像尺寸過大,大家感興趣的也可以直接在 Github 頁面中進行下載。
https://github.com/pkuliyi2015/multidiffusion-img-demo
注意,該頁面中包含其它圖像,您可以選擇 ancient_city.jpeg 下載近 8.4 MB 圖像查看《清明上河圖》AI 版,或者下載 ancient_city_origin.jpeg 查看原版繪畫。
AI 繪畫帶來的影響以及使用方式不僅僅只有這些,無論是其它的 AI 作品或者使用方式您都可以通過自己的想法進行實現(xiàn)。
大眼仔使用 Stable-Diffusion 生成 AI 作品
目前主流的 AI 繪畫工具有哪些?
自從去年開始 AI 繪畫火起來后,有很多公司都推出了自己的 AI 繪畫工具或者 AI 在線繪畫平臺,但主流的 AI 繪畫工具也就是幾款。
Stable-Diffusion
Stable-Diffusion 又稱 SD,是一款開源且免費的軟件,我們可以在 Github 上下載源代碼進行部署,或者使用第三方修訂集成后的直接使用版本。Stable-Diffusion 是目前最流行的開源繪畫軟件,免費且可本地化部署,因此受到很多人的喜愛。
Midjourney
Midjourney 是一個由同名研究實驗室開發(fā)的人工智能程式,可根據(jù)文本生成圖像,也就是大家所說的 AI 繪畫工具。
Midjourney 于 2022 年 7 月 12 日進入公開測試階段,使用者可透過 Discord 的機器人指令進行操作。它是一個開源的工具,使用 JavaScript 編程語言,通過學習和理解語言的語法來生成圖片,所使用的技術(shù)是一種被稱為“元繪圖”的技術(shù),能夠識別繪畫對象的形狀、顏色和紋理等特征,然后根據(jù)這些特征生成圖片。
Midjourney 的主要特點是速度快,生成的圖片質(zhì)量高,可以根據(jù)用戶提供的文本信息生成各種圖片,包括畫作、插畫、漫畫、動畫等等。此外,Midjourney 還支持多種圖片格式,包括 PNG、JPG、SVG 等,可以在各種終端上使用,包括電腦、手機和平板設(shè)備等。
DALL·E 2
DALL·E 2 是 OpenAI 公司在最新的版本中進一步升級、加強了他們先前發(fā)布的著名語言模型GPT-3的衍生應(yīng)用。它是一種深度學習生成模型,可以將自然語言描述轉(zhuǎn)換為相關(guān)的圖像。
具體地說,DALL·E 2 使用類似于 GPT-3 的技術(shù),通過學習海量的圖像和文本數(shù)據(jù),來學習理解圖片和語言之間的關(guān)系。用戶可以輸入一個自然語言描述,例如“把一只火車變成一只大象”,DALL·E 2 就會自動生成一個符合該描述的圖像。
與此前的版本相比,DALL·E 2擁有更多的參數(shù)和更大的訓練集,這使得它可以生成更真實、更復(fù)雜的圖像,包括極其細節(jié)化的圖像,甚至是對抗性的(Adversarial)攻擊下的圖像等等。
需要指出的是,DALL·E 2 的功能遠不止于生成高清圖像。它還可以產(chǎn)生疫苗的配方、設(shè)計建筑和動物、制作虛擬現(xiàn)實場景和游戲、創(chuàng)作藝術(shù)品,以及許多其他領(lǐng)域的應(yīng)用。DALL·E 2 代表著人工智能生成模型的一個重要進步,也標志著人工智能在圖像生成與創(chuàng)意領(lǐng)域的不斷發(fā)展。
目前 AI 繪畫工具種類非常繁多,大家感興趣可以進行查找。
聯(lián)系客服