GANs,生成式AI的核心技術(shù)
生成式對(duì)抗網(wǎng)絡(luò)(GANs, Generative Adversarial Networks ),這是生成式AI的關(guān)鍵技術(shù)。其本質(zhì)是一種深度學(xué)習(xí)模型,是近年來(lái)復(fù)雜分布上無(wú)監(jiān)督學(xué)習(xí)最具前景的方法之一。
2014年,研究人員首次使用計(jì)算機(jī),利用生成對(duì)抗網(wǎng)絡(luò)GANs,創(chuàng)造出了逼真的人臉。
GAN如何工作?
GAN通過(guò)使兩個(gè)神經(jīng)網(wǎng)絡(luò)相互競(jìng)爭(zhēng)來(lái)學(xué)習(xí)數(shù)據(jù)集的概率分布。一個(gè)叫做Generator的神經(jīng)網(wǎng)絡(luò)生成新的數(shù)據(jù)實(shí)例,而另一個(gè)Discriminator評(píng)估它們的真實(shí)性。即,鑒別器決定它檢查的數(shù)據(jù)的每個(gè)實(shí)例是否屬于實(shí)際的訓(xùn)練數(shù)據(jù)集。
同時(shí),生成器正在創(chuàng)建新的合成/偽造圖像,并將其傳遞給鑒別器。這樣做是為了希望即使它們是假的,它們也將被認(rèn)為是真實(shí)的。生成器的目標(biāo)是生成可傳遞的圖像:說(shuō)謊而不被捕獲。鑒別器的目的是將來(lái)自發(fā)生器的圖像識(shí)別為偽造的。
GAN采取的步驟
1.生成器接受隨機(jī)數(shù)并返回圖像;
2.生成的圖像與從實(shí)際的真實(shí)數(shù)據(jù)集中獲取的圖像流一起饋入鑒別器;
3.鑒別器同時(shí)獲取真實(shí)圖像和偽造圖像,并返回概率(介于0和1之間的數(shù)字),其中1代表對(duì)真實(shí)性的預(yù)測(cè),0代表偽造。
因此,有一個(gè)雙重反饋循環(huán):鑒別器處于反饋循環(huán)中,具有圖像的基本事實(shí)。發(fā)生器與鑒別器處于反饋回路中。
?
─ ╳
AI生“萬(wàn)物”
當(dāng)下,生成式AI已在研究和商業(yè)的多種場(chǎng)景得到應(yīng)用。具體而言,有以下領(lǐng)域:
生成圖形:AI可以從藝術(shù)品中抽象視覺(jué)圖案,然后將這些圖案應(yīng)用到具有該藝術(shù)品特征的虛擬圖像再現(xiàn)中。這些算法還可以將粗糙的涂鴉轉(zhuǎn)換為令人印象深刻的繪圖,該圖像似乎是由描繪真實(shí)世界的專業(yè)人類藝術(shù)家創(chuàng)作的。
生成照片:生成式AI可以通過(guò)生成并疊加到原始任何缺失、模糊或誤導(dǎo)性的視覺(jué)元素上來(lái)自動(dòng)更正照片,將低分辨率原始圖像轉(zhuǎn)換為高分辨率版本,也可以通過(guò)混合現(xiàn)有的肖像或從任何特定的肖像中抽象特征來(lái)產(chǎn)生自然的外觀,或者從語(yǔ)義標(biāo)簽中生成逼真的圖像。
生成音頻:生成式AI可以將任何計(jì)算機(jī)生成的聲音渲染成一個(gè)聽(tīng)起來(lái)像是在人類聲帶中自然產(chǎn)生的聲音,也可以將文本翻譯成語(yǔ)音。
同樣,生成式AI也可以生成視頻、文本、字幕等。
生成材料:生成式AI甚至可以通過(guò)3D打印、CRISPR和其他技術(shù)從零開(kāi)始呈現(xiàn)假肢、有機(jī)分子和其他物品。
在今年的8月,Insilico Medicine和西湖制藥Westlake Pharma宣布建立戰(zhàn)略伙伴關(guān)系,共同開(kāi)發(fā)針對(duì)新型冠狀病毒(COVID-19)的創(chuàng)新小分子藥物。
眼見(jiàn)為實(shí)or虛?
根據(jù)Gartner的預(yù)測(cè),到 2025 年,全球10%的數(shù)據(jù)將有生成式人工智能產(chǎn)生,而今天這一比例還不到 1%。
俗話說(shuō)眼見(jiàn)為實(shí),可是隨著生成式人工智能技術(shù)的不斷發(fā)展,大家準(zhǔn)備好生活在一個(gè)眼見(jiàn)不一定為實(shí)的世界了嗎?
文字 | 公共管理學(xué)院 徐珍珍
圖片 I 公共管理學(xué)院
校對(duì) I 趙改改
排版 I 江婉怡
責(zé)編 I 陳琛 王婷婷
聯(lián)系客服