《富春山居圖》,畫中之蘭亭。
這幅出自元代畫家黃公望筆下的紙本水墨畫,被譽(yù)為中國(guó)十大傳世名畫之一,主要記載了江南秀美的山川景色。但遺憾的是,畫作幾經(jīng)易手,又因當(dāng)時(shí)的收藏者“焚畫殉葬”險(xiǎn)些被毀,導(dǎo)致作品一分為二,斷為一大一小兩段,也就是后來(lái)人們所熟知的前半卷“剩山圖”和后半卷“無(wú)用師卷”。
合璧聯(lián)展固然是一種讓畫作穿越歷史、合體呈現(xiàn)的方式,但是否有更好的形式能讓更多人可以一睹傳世藝術(shù)品的全貌?
這個(gè)難題最終在百度世界大會(huì)上得到了解答。
7月21日百度世界大會(huì)活動(dòng)現(xiàn)場(chǎng),百度只用了“1秒”就瞬間復(fù)原了《富春山居圖》殘卷,背后依托的正是人工智能技術(shù)中的AIGC能力(人工智能自主生成內(nèi)容)。
復(fù)原《富春山居圖》到底是“工匠的技術(shù)”還是“畫家的藝術(shù)”,殊難定義。這背后其實(shí)關(guān)聯(lián)著一個(gè)更大的話題——在內(nèi)容創(chuàng)作領(lǐng)域,人工智能已經(jīng)展現(xiàn)出了相當(dāng)?shù)膶?shí)力,但它真正能夠像人類藝術(shù)家一樣真正的、富有靈性的“原創(chuàng)”?還是惟妙惟肖的模擬、仿效人類的創(chuàng)作?這一點(diǎn)至今尚無(wú)定論。
基于此,百度創(chuàng)始人李彥宏提出了一個(gè)全新的觀點(diǎn)——未來(lái)十年,AIGC(人工智能自主生成內(nèi)容)將顛覆現(xiàn)有內(nèi)容生產(chǎn)模式,可以實(shí)現(xiàn)“十分之一的成本和以百倍千倍的生產(chǎn)速度,生成AI原創(chuàng)內(nèi)容”。
AIGC的出現(xiàn)到底意味著什么?是一次新的文藝復(fù)興還是整個(gè)人類內(nèi)容消費(fèi)方式的徹底改變,這些,都沒(méi)有確定的答案。
關(guān)于AI最終是否具有自我意識(shí),乃至于是否具有人格這件事,已經(jīng)展開過(guò)激烈且漫長(zhǎng)的辯論。
近來(lái),在硅谷掀起的又一次「AI是否有人格」討論同樣如此。谷歌人工智能倫理團(tuán)隊(duì)的一名工程師堅(jiān)持認(rèn)為,在經(jīng)過(guò)了一段時(shí)間的測(cè)試后發(fā)現(xiàn),一個(gè)用人工智能算法搭建出的智能聊天機(jī)器人程序 LaMDA 有了類似于7、8歲兒童的“自主情感”,也就是人們所謂的人格。
但最終的結(jié)果是,谷歌方面駁回了這一說(shuō)法,并稱公司數(shù)百個(gè)研究人員和工程師均與該程序進(jìn)行了對(duì)話,發(fā)現(xiàn)LaMDA根本不具備自主情感。該名工程師也被強(qiáng)制要求帶薪休假。
看來(lái),盡管AI是否真正具備人格的還沒(méi)有定論,但在一些領(lǐng)域,AI驅(qū)動(dòng)的數(shù)字人已經(jīng)做到了讓人們的肉眼真假難辨的地步。
例如,2021年英偉達(dá)曾經(jīng)放出消息,稱在其舉辦的GPU大會(huì)上人們看到的英偉達(dá)CEO黃仁勛實(shí)際上是個(gè)“假人”。消息一出輿論嘩然,因?yàn)樵谝曨l中人們的確看到的是黃仁勛本人,標(biāo)志性的皮衣,甚至是動(dòng)作、表情、頭發(fā)都與他本人并無(wú)二致。據(jù)英偉達(dá)后來(lái)透露,這的確是AI生成的內(nèi)容。
不過(guò)這一次大膽嘗試同樣耗費(fèi)巨大:英偉達(dá)動(dòng)用了34個(gè)3D美術(shù)師、15個(gè)軟件研究人員,做了21個(gè)版本的黃仁勛,最終才呈現(xiàn)出這樣一個(gè)真假難辨的“數(shù)字人”。
僅僅是6個(gè)月后,百度就聯(lián)合央視新聞推出了AI手語(yǔ)主播,同樣有著真人般的皮膚、頭發(fā)、眼睛,而且形象更親近自然,可以24小時(shí)不間斷為觀眾播報(bào)奧運(yùn)情況。
朱廣權(quán)還和這位手語(yǔ)主播來(lái)了一次現(xiàn)場(chǎng)battle,主持人妙語(yǔ)連珠,但手語(yǔ)主播同樣對(duì)答的有來(lái)有回,且可以根據(jù)播報(bào)實(shí)時(shí)調(diào)整手語(yǔ)手勢(shì)。后來(lái)?yè)?jù)百度方面分享,想要打造如此高質(zhì)量的手語(yǔ)數(shù)字人,需要的是語(yǔ)音、視覺(jué)與自然語(yǔ)言處理等AI技術(shù)的共同發(fā)力。
在這之后,今年夏天,百度推出的數(shù)字人度曉曉開始挑戰(zhàn)更多我們過(guò)往對(duì)AI的能力認(rèn)知。
度曉曉先是用平均1秒的時(shí)間嘗試了多篇高考作文,圍繞圍棋中的本手、妙手和俗手,在40秒時(shí)間里創(chuàng)作了40多篇文章。而后她又“親自”創(chuàng)作了藝術(shù)畫作——“無(wú)界”系列,后者在百度App上線24小時(shí)內(nèi)實(shí)現(xiàn)了17萬(wàn)元的銷售額,創(chuàng)下數(shù)字藏品領(lǐng)域的新紀(jì)錄。
這顯然已經(jīng)不是個(gè)例,在今年百度世界大會(huì)期間,全新數(shù)字人希加加又一次亮相,首次挑戰(zhàn)登上央視新聞演播廳,成為大會(huì)AI策劃官和主持人。
作為AI驅(qū)動(dòng)的數(shù)字人,希加加的能力更勝一籌,可以秀出主持、對(duì)話、跳舞等才藝,還利用AI技術(shù)修復(fù)了《富春山居圖》殘卷,在更加復(fù)雜的環(huán)境中實(shí)現(xiàn)對(duì)人工智能技術(shù)的應(yīng)用。
這和AIGC又有什么關(guān)系呢?
事實(shí)上,傳統(tǒng)的所謂的數(shù)字虛擬偶像,只不過(guò)是具備3D視覺(jué)效果的“動(dòng)畫人”,他或者她表現(xiàn)的一切,是人類加工的結(jié)果。而希加加這樣的數(shù)字人,它的面部表情、形體表達(dá)、語(yǔ)音表述、回答內(nèi)容、肢體反應(yīng)、情緒反饋等外在表現(xiàn)和交互內(nèi)容,都是由AI實(shí)時(shí)生成的。而如果我們把一個(gè)表情、一句對(duì)話、一個(gè)手勢(shì)都看做是包含有信息量的“內(nèi)容”的話,那么希加加則可以認(rèn)為具備了AIGC能力。
百度AI數(shù)字人希加加現(xiàn)場(chǎng)作畫
人們對(duì)于具有獨(dú)立意識(shí)的AI的一切想象,大多呈現(xiàn)在科幻電影和小說(shuō)中。
1968年,斯坦利·庫(kù)布里克用四年的時(shí)間制作出一部屬于哲學(xué)意味的科幻巨制——科幻電影《2001太空漫游》。片中,人類進(jìn)行了一場(chǎng)木星登陸計(jì)劃,而為了進(jìn)行漫長(zhǎng)的星際漂流,他們?cè)陲w船中使用了一部名為“HAL9000”的高智能電腦,它是一個(gè)典型的具有一定自主意識(shí)的智能化系統(tǒng)的雛形。
電影《her》的步子邁的更大,片中的人工智能擁有獨(dú)立的意識(shí),和人類開始了真實(shí)的戀愛(ài);《銀翼殺手2049》中,復(fù)制人與真人無(wú)異;《機(jī)械姬》更是直白的表現(xiàn)了“圖靈測(cè)試”,從而進(jìn)一步探討,當(dāng)AI擁有自我意識(shí)后會(huì)給人類帶來(lái)怎樣的影響。
為了讓這種暢想可以更進(jìn)一步投射進(jìn)現(xiàn)實(shí)世界,來(lái)自全球的科學(xué)家開啟了眾多前沿探索。
時(shí)間來(lái)到2022年,圍繞弱人工智能的探索已經(jīng)涉及千行百業(yè),我們的每一次搜索、拿起手機(jī)的每一次拍照、和小度音箱的每一次對(duì)話,都來(lái)自AI的加持。由此我們開始基于現(xiàn)實(shí)而非文藝作品開始認(rèn)真的討論,當(dāng)人工智能越來(lái)越能讓機(jī)器像人一樣思考和行動(dòng)時(shí),是否有一個(gè)奇點(diǎn),會(huì)出現(xiàn)真正具有意識(shí)和人格的強(qiáng)人工智能,以及這到底是人類的福祉還是挑戰(zhàn)。
在很多單一閉環(huán)內(nèi)的智力比對(duì)已經(jīng)顯示了人工智能的潛質(zhì),早期如2016年,Google旗下的DeepMind智能系統(tǒng)——AlphaGo一次又一次的擊敗了人類頂級(jí)棋手;而在2019年,DeepMind打造的另一個(gè)人工智能——AlphaStar AI,通過(guò)大量的算法演練,在《星際爭(zhēng)霸》這款游戲中打敗了歐洲的頂尖職業(yè)選手。游戲的環(huán)境比圍棋更加復(fù)雜,這也使得更多的研究人員認(rèn)為,AlphaStar的勝利宣告著AI發(fā)展道路上的又一個(gè)里程碑誕生了。
但是,以上的里程碑事件大多是一個(gè)單一閉環(huán)里,人工智能用有目的性的“窮舉”、監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等方式來(lái)和人類進(jìn)行有條件、有前提的較量,這種“智能”有太多的前提條件。
下一個(gè)里程碑何時(shí)出現(xiàn)?在一些人士看來(lái),AIGC的大規(guī)模應(yīng)用可以看作是另一個(gè)節(jié)點(diǎn)。
根據(jù)李彥宏的判斷,AIGC將走過(guò)三個(gè)發(fā)展階段:第一個(gè)階段,被稱之為AIGC的“助手階段”,AIGC用來(lái)輔助人類進(jìn)行內(nèi)容生產(chǎn),比如生產(chǎn)有聲書、賦能視頻創(chuàng)作等等;第二個(gè)階段,被稱之為AIGC的“協(xié)作階段”,AIGC以虛實(shí)并存的虛擬人形態(tài)出現(xiàn),形成人機(jī)共生的局面。第三個(gè)階段,即AIGC的“原創(chuàng)階段”,AIGC將獨(dú)立完成內(nèi)容創(chuàng)作。
正如百度創(chuàng)始人李彥宏在大會(huì)現(xiàn)場(chǎng)所言,“AIGC(人工智能自主生成內(nèi)容)是PGC、UGC之后,全新的內(nèi)容生產(chǎn)方式。它不僅會(huì)提升內(nèi)容生產(chǎn)的效率,也會(huì)創(chuàng)造出有獨(dú)特價(jià)值和獨(dú)立視角的內(nèi)容?!?/p>
百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官 李彥宏
AIGC話題的終極挑戰(zhàn)在于,人類還沒(méi)有完全理順AIGC第三階段的原理。
從某種程度上,任何一個(gè)人類在幼年時(shí)的學(xué)習(xí)都是從模仿開始的,在“模仿”這一點(diǎn)上,人工智能已經(jīng)做的很不錯(cuò);當(dāng)人類經(jīng)受了一定的訓(xùn)練后,則會(huì)開始嘗試初級(jí)的創(chuàng)作,比如一篇作文,就可以看做是不同語(yǔ)素在語(yǔ)法規(guī)范下的有條件窮舉和組合,而對(duì)此人工智能也頗為擅長(zhǎng)。所以,用人工智能生產(chǎn)一些標(biāo)準(zhǔn)化、消費(fèi)級(jí)的內(nèi)容,是完全可以實(shí)現(xiàn)的。
問(wèn)題的關(guān)鍵在于,真正的、具有獨(dú)特風(fēng)格、促進(jìn)人類文明發(fā)展的創(chuàng)作,譬如達(dá)芬奇的《蒙娜麗莎》、比如貝多芬的《命運(yùn)交響曲》、比如李白的《將進(jìn)酒》,這些能夠讓人類產(chǎn)生靈魂震顫的、依賴我們至今尚未完全了解其原理的“靈感”所產(chǎn)生的曠世佳作,是否是人工智能在原創(chuàng)內(nèi)容上的終極挑戰(zhàn)呢?
如果人工智能不能挑戰(zhàn)這些,我們還將抱有人類的某種優(yōu)越感;而如果人工智能能夠?qū)崿F(xiàn)這些,我們將迎來(lái)一個(gè)精神文明極大豐富的超文藝復(fù)興時(shí)代。
而如果這些和元宇宙結(jié)合起來(lái)的話,那么,每個(gè)人都會(huì)擁有自己的日升月落、每個(gè)人都可以訂制自己的巴比倫花園、每個(gè)人都可以設(shè)定自己的精神伴侶的人格與氣質(zhì)……這些亦真亦幻的沉浸式體驗(yàn),將把人類文明帶向什么方向,是我們無(wú)法預(yù)測(cè)的。
也許,到了那一天,我們每個(gè)人都會(huì)沉浸在自己內(nèi)化的世界里——這或許也解釋了為什么我們至今沒(méi)有遇見(jiàn)外星的高級(jí)文明——一部分科學(xué)家認(rèn)為,如果人類創(chuàng)造顱內(nèi)高潮的方式可以由外而內(nèi),而不是由內(nèi)而外的實(shí)現(xiàn)的話,高級(jí)文明將不再有探索宇宙的動(dòng)力,而把動(dòng)力放在探索內(nèi)生世界的滿足上,而在這個(gè)世界里,一切的一切都是內(nèi)容,都需要AI即時(shí)的生產(chǎn),這幾乎已經(jīng)是關(guān)于人類文明演進(jìn)的終極暢想。
這種幻想讓人興奮,但也讓人恐懼。幸好,我們還在一個(gè)非常初級(jí)的階段里探索AIGC的革命,那么一個(gè)小問(wèn)題是,為什么率先登上這艘戰(zhàn)艦的是百度?以及百度到底能用其改變什么?
過(guò)去多年,百度在人工智能領(lǐng)域的投入有目共睹,其連續(xù)多年保持著超過(guò)15%比例的研發(fā)投入金額,2021年,百度核心研發(fā)投入比例達(dá)到23%。
作為堅(jiān)定的技術(shù)至上論者,李彥宏曾經(jīng)有過(guò)一番著名的言論,“我曾經(jīng)說(shuō)過(guò)一句話,有1塊錢的時(shí)候,我們會(huì)投進(jìn)技術(shù)里;有1個(gè)億,我們會(huì)投進(jìn)技術(shù)里;有100個(gè)億,我們還是會(huì)投進(jìn)技術(shù)里。最前沿的技術(shù)浪潮是等不來(lái)的,我們必須提前10年、20年去投入和布局?!?/p>
正是在這樣的背景之下,百度醞釀出了多個(gè)核心產(chǎn)品。
百度文心大模型,作為真正的產(chǎn)業(yè)級(jí)大模型,其作用正是不斷降低AI的應(yīng)用門檻,實(shí)現(xiàn)AI的真正普惠。
文心全景圖
百度開源深度學(xué)習(xí)平臺(tái)飛槳,具備深厚的技術(shù)積累,愈發(fā)完善的體系,因?yàn)榘俣纫恢痹诨陂_發(fā)者更大的支持力度,也使得飛槳的落地應(yīng)用越來(lái)越豐富。根據(jù)IDC報(bào)告,作為深度學(xué)習(xí)框架,飛槳在國(guó)內(nèi)的市場(chǎng)份額排名位居首位。
事實(shí)上,正因此也讓百度有了更強(qiáng)的規(guī)?;涞貙?shí)力。不久之前,百度集團(tuán)副總裁袁佛玉也介紹,“隨著百度AI算法的突破,我們能讓數(shù)字人制作成本十倍、百倍地下降,還能讓數(shù)字人生產(chǎn)周期,從動(dòng)輒幾個(gè)月,縮短到小時(shí)級(jí)別。數(shù)字人的制作成本,將從百萬(wàn)級(jí)降低到萬(wàn)元級(jí)別。”
并且,隨著大模型技術(shù)的不斷突破,百度正在加速AIGC向原創(chuàng)階段發(fā)展演進(jìn)。
目前,AI數(shù)字人對(duì)話能力,使用的便是對(duì)話生成大模型-文心PLATO;數(shù)字人畫畫能力,使用的是文心大模型-跨模態(tài)圖文生成模型ERNIE-ViLG。隨著大模型技術(shù)的不斷成熟演進(jìn),人工智能將更加具備創(chuàng)造性,也就是說(shuō),由技術(shù)創(chuàng)造的數(shù)字人們也會(huì)朝著更具人格的形態(tài)靠近。
“熟讀唐詩(shī)三百首,不會(huì)作詩(shī)也會(huì)吟”,人的學(xué)習(xí)和記憶能力始終是有限的,但對(duì)于大模型而言,永遠(yuǎn)不會(huì)有這種限制。在未來(lái)的某一天,當(dāng)技術(shù)跨越某個(gè)奇點(diǎn),真正意義上的AI原創(chuàng)內(nèi)容終究會(huì)出現(xiàn)。
現(xiàn)如今,技術(shù)、趨勢(shì)無(wú)一不在朝著全新的方向演進(jìn),或許沒(méi)有人能拒絕這樣一場(chǎng)激動(dòng)人心的探索與嘗試。
以一種創(chuàng)新者的姿態(tài),百度正在給行業(yè)帶來(lái)越來(lái)越多改變。屆時(shí),放眼更加廣闊的領(lǐng)域,經(jīng)過(guò)越來(lái)越多成規(guī)模的創(chuàng)作探索,一個(gè)真正的元宇宙世界終將呈現(xiàn)在人們眼前。
聯(lián)系客服