作者 美圖君
相信你已經(jīng)在網(wǎng)上見(jiàn)過(guò)各式各樣的 deepfake 換臉技術(shù)了。
比如,這些奧巴馬里,哪個(gè)是真的?
其實(shí),他們都是假的。他們是南加州大學(xué)創(chuàng)意技術(shù)研究所(USC Institute for creative technologies)的人工智能學(xué)家 Supasorn Suwajanakorn 用美國(guó)前總統(tǒng)里根的嘴部動(dòng)作和奧巴馬的臉合成的。
這種換臉技術(shù),就叫做 deepfake。
一般來(lái)說(shuō),deepfake 技術(shù)需要大量的訓(xùn)練集數(shù)據(jù),也就是本人的學(xué)習(xí)資料才能做出看起來(lái)可信的結(jié)果。但是最近,位于莫斯科的三星人工智能研究所的科學(xué)家們推出了一種只要幾張圖片,就能還原3D人臉動(dòng)態(tài)的技術(shù)。
下面這些圖片里,左邊是輸入的單張圖片,右邊是 AI 輸出的動(dòng)圖。
在這項(xiàng)技術(shù)中,研究人員使用了3個(gè) AI。
第一個(gè) AI 捕捉 landmark,也就是面部關(guān)鍵特征點(diǎn),比如臉的形狀,眼睛的位置等,并把它們轉(zhuǎn)化為向量。
第二個(gè) AI 負(fù)責(zé)把這些向量轉(zhuǎn)化為視頻。
第三個(gè) AI 把第二個(gè) AI 做出來(lái)的結(jié)果和原圖片進(jìn)行對(duì)比和評(píng)估。
利用這3個(gè)AI,只需要幾張本人的圖片就能實(shí)現(xiàn)人物動(dòng)態(tài)的“腦補(bǔ)”,可以生成原圖片中沒(méi)有的角度。
當(dāng)然,輸入圖片越多,得到的效果就越逼真。
從下面的圖片中你可以看到,用32張圖片訓(xùn)練得到的動(dòng)態(tài)圖比只用一張圖片得到的效果瑕疵更少。但是,只用一張圖片就能還原人的全臉動(dòng)態(tài)效果,效果已經(jīng)很不錯(cuò)了。
下面的這些說(shuō)話的明星人頭動(dòng)圖,哪些是真的,哪些是 AI 造出來(lái)的呢,你能分得清嗎?
其實(shí),它們都是機(jī)器造的,每個(gè)動(dòng)圖用的僅僅是8張圖片。利用這個(gè)技術(shù),可以輕松把單張自拍圖變成動(dòng)態(tài)圖。
用名人的一張相片,也可以“腦補(bǔ)”出動(dòng)態(tài)圖。
被玩壞的瑪麗蓮夢(mèng)露——
達(dá)利——
陀思妥耶夫斯基——
愛(ài)因斯坦——
用來(lái)腦補(bǔ)名畫(huà)也不錯(cuò)。
伊凡·克拉姆斯柯依的《無(wú)名女郎》——
蒙娜麗莎——
這種技術(shù)相當(dāng)于把照片變成了傀儡,動(dòng)作本身是別人的。因此你可以看到,用3個(gè)不同的人的面部動(dòng)態(tài)還原的蒙娜麗莎,效果有很大區(qū)別。
總之看完這3個(gè)不同的人設(shè),我心中已經(jīng)默認(rèn)蒙娜麗莎本人應(yīng)該長(zhǎng)成中間那個(gè)顏藝擔(dān)當(dāng)?shù)陌姹荆⑶议_(kāi)始拒絕蒙娜麗莎本來(lái)的樣貌。在這個(gè)星球上,臉盲星人的生存實(shí)為不易啊。
達(dá)特茅斯學(xué)院的計(jì)算機(jī)科學(xué)教授 Hany Farid 認(rèn)為,這些技術(shù)很難不被濫用,“這是技術(shù)的另一種演化方向,以后可能會(huì)出現(xiàn)和真實(shí)拍攝的多媒體內(nèi)容傻傻分不清的全人造視頻。”
前面提到的制造出奧巴馬 deepfake 視頻的南加州大學(xué)研究者 Suwajanakorn 本人也明白 deepfake 被濫用的可能性以及殺傷力,因此自己參與了鑒定影像真實(shí)性的工具的研發(fā)。如果你對(duì)視頻或者圖片的真實(shí)性有所懷疑,可以用他的 Reality Defender 插件進(jìn)行鑒定。
其實(shí),沒(méi)那么高端的換臉技術(shù)早在網(wǎng)紅屆泛濫了。憑借現(xiàn)在的濾鏡,就可以把隨便一個(gè)路人變成下巴尖到能戳死人的網(wǎng)紅。Deepfake 濾鏡成熟以后,通過(guò)手機(jī)或許就可以變身任何一個(gè)明星,假借明星的臉說(shuō)出你想說(shuō)的話,做你想做的事。
好了,下次奧巴馬邀請(qǐng)你視頻聊天,并向你借錢(qián)的時(shí)候,你知道該怎么做了吧。
聯(lián)系客服