AI換臉越來越溜兒 誰能阻止它走向墮落
本報(bào)記者 陳 曦
Deepfake是一種換臉技術(shù),可以將圖片或視頻中A的臉換到B的頭上。其名字由深度機(jī)器學(xué)習(xí)(deep machine learning)和假照片(fake photo)組合而成。這項(xiàng)技術(shù)不需要操作者具備深厚的專業(yè)知識(shí),只要收集到足夠素材,AI就可以完成。Deepfake換臉效果逼真,讓人難以分辨真假,這也引發(fā)了眾多倫理和隱私問題。
史泰龍和施瓦辛格兩位好萊塢頂級(jí)流量功夫巨星最近一次合體出現(xiàn)在大銀幕上,還是在2013年上映的《金蟬脫殼》中,這讓不少影迷意猶未盡。11月22日,一篇報(bào)道稱,國(guó)外視頻網(wǎng)站上一部名為《Step Brother》的電影短片,借助Deepfake技術(shù),把兩位巨星的面部替換到了兩名小眾演員臉上,而且人臉表情自然,毫無痕跡,這讓不少網(wǎng)友驚嘆:太恐怖。此外,在最近的國(guó)內(nèi)熱播劇《了不起的兒科醫(yī)生》中也使用了這種AI換臉技術(shù)。
根據(jù)安全分析公司Sensity最新調(diào)查結(jié)果,自2018年12月以來,Deepfake在線造假視頻的數(shù)量大約每6個(gè)月翻一番,而截至2020年6月,造假視頻已經(jīng)多達(dá)49081個(gè),比2019年7月增長(zhǎng)了330%。
Deepfake技術(shù)讓視頻換臉變得越來越簡(jiǎn)單,如何打假“李鬼”,讓其避免成為假視頻的“幫兇”已成為當(dāng)務(wù)之急。
用視頻“大變活人”分幾步
Deepfake這種技術(shù)堪稱現(xiàn)代網(wǎng)絡(luò)“易容術(shù)”,是比PS強(qiáng)大很多的動(dòng)態(tài)換臉技術(shù)?!澳壳癉eepfake技術(shù)已經(jīng)很成熟了,主要技術(shù)分為兩個(gè)部分,自動(dòng)編碼器和生成對(duì)抗網(wǎng)絡(luò)?!碧旖虼髮W(xué)智能與計(jì)算學(xué)部教授翁仲銘介紹。
自動(dòng)編碼器是一種神經(jīng)網(wǎng)絡(luò)技術(shù),就是把一個(gè)人的照片特征抓取出來,然后用數(shù)字代表。但是抓取一個(gè)人的面部特征時(shí),不可能抓取所有狀態(tài)下的特征,比如說話、哭和笑等,那么就必須將沒有的表情用數(shù)字模擬的方式展現(xiàn)出來。通過訓(xùn)練,就可以找出一個(gè)最好的用數(shù)學(xué)方式來呈現(xiàn)照片特征的編碼器。
有編碼器就需要解碼器,解碼器會(huì)把一串串?dāng)?shù)字再還原成照片。不同解碼器可以在演員身上還原不同照片,比如史泰龍解碼器可以還原史泰龍照片,而還原施瓦辛格照片則需要施瓦辛格的解碼器。具體操作是先使用編碼器分別抽取小眾演員和史泰龍的特征,而后再使用史泰龍的解碼器還原,從而得到史泰龍的臉和小眾演員的表情。
“Deepfake就是在設(shè)計(jì)、訓(xùn)練精準(zhǔn)的編碼器和解碼器。”翁仲銘介紹,因?yàn)榫幋a器是抓取照片的特征,所以基本上只需要一套就可以了??墒墙獯a器就需要訓(xùn)練很久,因?yàn)榘岩贿B串的數(shù)字特征,拼接到小眾演員身上,而且要變得很像,就需要長(zhǎng)時(shí)間訓(xùn)練。以換成史泰龍的臉為例,這個(gè)過程需要輸入史泰龍600—3000張照片并經(jīng)過48—72小時(shí)來訓(xùn)練深度模型。
“自動(dòng)編碼器做出的照片是否自然真實(shí)還需要去判別把關(guān),這就需要生成對(duì)抗網(wǎng)絡(luò)技術(shù)?!蔽讨巽懡忉?,這包括兩個(gè)機(jī)器學(xué)習(xí)模型,分別為生成網(wǎng)絡(luò)和辨別網(wǎng)絡(luò)。生成網(wǎng)絡(luò)扮演“造假者”,在模型訓(xùn)練后產(chǎn)生偽造影片;而辨別網(wǎng)絡(luò)則扮演“檢測(cè)者”,不斷地檢視假影片,直至它再辨別不了結(jié)果是假的。數(shù)據(jù)越多,效果越理想,假影片越真實(shí)。
換臉門檻越來越低
其實(shí)這種動(dòng)態(tài)換臉技術(shù)最早是被用于影視后期制作,但是以前影視作品中的人臉交換操作起來非常復(fù)雜,只有專業(yè)視頻剪輯師和公共網(wǎng)關(guān)接口專家才能完成,并且需要花費(fèi)大量時(shí)間和精力。
但隨著Deepfake這樣公開且輕量化技術(shù)的出現(xiàn),這個(gè)技術(shù)的使用門檻也越來越低了。特別是設(shè)計(jì)架構(gòu)Deepfake技術(shù)的“大神”將代碼上傳到了一個(gè)自由共享代碼的網(wǎng)站Github,讓這項(xiàng)技術(shù)更容易獲得。
利用Deepfake技術(shù),即使是一個(gè)對(duì)視頻剪輯一竅不通的外行,也只需一個(gè)強(qiáng)大的GPU(圖形處理器)和上百?gòu)埲宋飿訄D,輸入至少一個(gè)算法,就能完成人臉交換,并且可以制作出非常逼真的視頻效果。“普通人在經(jīng)過一段時(shí)間的學(xué)習(xí)以后,完全能夠掌握這項(xiàng)技術(shù)。”翁仲銘感嘆。
“雖然現(xiàn)在這項(xiàng)技術(shù)操作起來簡(jiǎn)便,但是原來要用軟件實(shí)現(xiàn)這個(gè)過程是非常艱難的?!蔽讨巽懡忉?,視頻中人是動(dòng)態(tài)的,比如一個(gè)60幀(fps)的視頻中,每秒鐘畫面更新60次,如果是PS的話需要處理60張靜態(tài)圖片,然后將其前后連接起來形成一個(gè)動(dòng)態(tài)圖。一個(gè)短視頻動(dòng)輒數(shù)分鐘,甚至十多分鐘,如果按照一分鐘處理3600張計(jì)算,一個(gè)幾分鐘的短片也要處理多達(dá)上萬張照片,所以需要強(qiáng)大算力的GPU來支撐。
翁仲銘認(rèn)為,近些年隨著GPU的發(fā)展,其算力越來越強(qiáng)大,也使得Deepfake技術(shù)處理照片越來越輕松,使用越來越方便。這可能也是2018年12月以來,造假視頻成倍增長(zhǎng)的原因之一。
以技制技打假“李鬼”還不夠
如此強(qiáng)大的“黑科技”采用了最先進(jìn)的人工智能技術(shù),通過比較簡(jiǎn)單的運(yùn)算,就有可能生成以假亂真的視頻。但是Deepfake技術(shù)在運(yùn)行幾天之后,就遭到了唾棄,被全球封禁,還被世人稱為“最邪惡”的技術(shù)。
因?yàn)樘^以假亂真,其破壞力不可估量。事實(shí)證明,人們的擔(dān)心并非杞人憂天。Deepfake第一次亮相就是將《神奇女俠》蓋爾·加朵的臉,嫁接到了一部成人電影女主角身上。此外由Deepfake制作的假視頻已引發(fā)多起刑事案件,甚至卷入政治紛爭(zhēng)。
不過再完美的技術(shù)也不是無懈可擊的,專家們提出了幾種辨識(shí)Deepfake換臉視頻的方法:比如眨眼率,通過Deepfake制作的對(duì)象的眨眼率少于正常人;語音和嘴唇運(yùn)動(dòng)的同步狀況;情緒不符合;模糊的痕跡、畫面停頓或變色。不過翁仲銘表示,這些方法,Deepfake通過加強(qiáng)對(duì)樣本的學(xué)習(xí),都可以解決,遲早會(huì)有人可以通過Deepfake技術(shù)制造出人類用肉眼無法識(shí)別的“假臉”。
“也有不少人想到以AI對(duì)抗AI?!蔽讨巽懡榻B,美國(guó)國(guó)防部研發(fā)了全球首款“反AI變臉刑偵檢測(cè)工具”,專門用于檢測(cè)AI變臉或換臉造假技術(shù)。不過,人工智能基金會(huì)的研究副主席戴利普承認(rèn),現(xiàn)時(shí)Deepfake檢測(cè)算法的準(zhǔn)確率,即使可高達(dá)97%,但鑒于互聯(lián)網(wǎng)規(guī)模非常大,余下的3%仍然極具破壞力。
目前還有一個(gè)識(shí)別Deepfake換臉的新思路,叫作“活體取證”,該技術(shù)主要是根據(jù)分辨率、三維信息、眼動(dòng)等來區(qū)分真假,因?yàn)榉牡恼掌直媛屎椭苯訌恼嫒松喜杉恼掌谫|(zhì)量、分辨率上比都有差別。
“整個(gè)算法遵循的觀察規(guī)律是:生物信號(hào)還沒有保存在假視頻中,這些信號(hào)在生成噪聲時(shí)也產(chǎn)生了不同的標(biāo)識(shí)。”翁仲銘解釋,換句話說,假視頻中顯示的“人”不會(huì)表現(xiàn)出與真實(shí)視頻中的人相似的心跳模式,通過這種方法可以找到每個(gè)生成模型的唯一簽名(標(biāo)識(shí))。值得一提的是,無論遮擋、照明條件如何變化,這些標(biāo)識(shí)在真實(shí)視頻中是不存在的。利用這些標(biāo)識(shí)可以找到假視頻背后的生成模型,然后反過來提高整體的假視頻檢測(cè)精度。
“道高一尺魔高一丈,利用Deepfake技術(shù)的人也在不斷改進(jìn)換臉的水平,因此從長(zhǎng)遠(yuǎn)來看,我們必須尋求更有力的方法來維護(hù)和證明社交媒體信息的真實(shí)性。目前幾乎沒有任何工具可以幫助讀者確信其在網(wǎng)上看到的信息來源可靠,且沒有被篡改?!蔽讨巽憦?qiáng)調(diào),改善這種情況需要從視頻發(fā)布源頭進(jìn)行管理,比如實(shí)名制,同時(shí)加強(qiáng)立法,增加網(wǎng)絡(luò)警察巡邏等,嚴(yán)厲打擊這種造假行為。
(《科技日?qǐng)?bào)》2020年12月9日第 5 版。)