在許多人眼中,AIGC的元年已經(jīng)來(lái)臨了。
風(fēng)從AI繪畫開始刮起。2022年8月31日,一幅名為《太空歌劇院》的繪畫作品在美國(guó)科羅拉多州博覽會(huì)的美術(shù)比賽中斬獲了一等獎(jiǎng),隨即引發(fā)了輿論風(fēng)暴,其創(chuàng)作者游戲設(shè)計(jì)師Jason Allen更是被推上了風(fēng)口浪尖。
某種程度上,《太空歌劇院》代表的是一個(gè)時(shí)代的奇點(diǎn)——AI創(chuàng)作的內(nèi)容,擁有了擊敗人類作品的實(shí)力。沒(méi)錯(cuò),實(shí)際上,Jason Allen并不是作品嚴(yán)格意義上的創(chuàng)作者,他利用AI繪圖軟件MidJourney創(chuàng)作了《太空歌劇院》,經(jīng)過(guò)近千次的調(diào)整和嘗試,才將這幅宏大的科幻作品呈現(xiàn)到了無(wú)數(shù)人面前。
AIGC初露端倪,隨即便席卷了全球,很快,“擁有靈魂的人工智能”ChatGPT橫空出世,在一場(chǎng)場(chǎng)對(duì)話與互動(dòng)中,人們驚嘆著,屬于AI的時(shí)代似乎真正來(lái)臨了。
在國(guó)內(nèi)外,一場(chǎng)AIGC的內(nèi)容創(chuàng)作革命也旋即開始,在谷歌、微軟大步向前的同時(shí),百度、騰訊等國(guó)內(nèi)玩家也進(jìn)一步加緊了布局。2023年1月10日,2022百度Create大會(huì)正式舉辦,在百度息壤元宇宙中,10萬(wàn)人同屏共同見證了過(guò)去一年百度在新技術(shù)領(lǐng)域?qū)崿F(xiàn)的突破,而AIGC則是其中最重要的部分之一。
這再度印證了許多人對(duì)于這一賽道的判斷:AIGC必將成為時(shí)代的下一個(gè)風(fēng)口。
為何此前一直在公眾領(lǐng)域默默無(wú)聞的AI繪圖能夠突然爆火?
事實(shí)上,在過(guò)去一年里AI繪圖的迭代堪稱恐怖。自2015年開始,AI繪圖就在GAN(生成式對(duì)抗網(wǎng)絡(luò))概念模型迎來(lái)了較為快速的發(fā)展,但始終難以突破技術(shù)的瓶頸,實(shí)現(xiàn)高效率又低門檻的圖片生成,彼時(shí)的AI繪圖,不僅需要輸入復(fù)雜的參數(shù),生成時(shí)間也較長(zhǎng),最終的結(jié)果也往往不能盡如人意。
但與此同時(shí),NLP(自然語(yǔ)言處理)技術(shù)在架構(gòu)升級(jí)中不斷向前演進(jìn),預(yù)訓(xùn)練模型的使用進(jìn)一步提升了AI的深度學(xué)習(xí)能力。這為繪圖技術(shù)的突破提供了新的想象力,2022年,另一個(gè)計(jì)算機(jī)視覺生成技術(shù)擴(kuò)散模型(Diffusion model)被廣泛使用。
在NLP與視覺生成技術(shù)的雙重進(jìn)化下,AI繪圖終于突破了臨界點(diǎn),迎來(lái)了爆發(fā)。標(biāo)志性就在于,只要輸入關(guān)鍵詞組,每一個(gè)用戶都能利用AI繪圖技術(shù)創(chuàng)作出足夠精美的圖畫,并且創(chuàng)作效率是秒級(jí)的。
AI繪畫讓人工智能生成內(nèi)容廣為人知,而ChatGPT的出現(xiàn)則讓人們看到了AI的“恐怖實(shí)力”。ChatGPT是人工智能巨頭OpenAI推出的對(duì)話式AI產(chǎn)品,聊天式AI似乎早在幾年前就非常常見了,但ChatGPT的魅力在于,它似乎能夠真正“理解”使用者的語(yǔ)義,并給出相對(duì)合理的反饋。
更重要的是,ChatGPT不僅是一個(gè)對(duì)話式AI,它還融合了檢索等功能,真正能通過(guò)對(duì)話生成、創(chuàng)作文本內(nèi)容,且這些內(nèi)容擁有相對(duì)較高的質(zhì)量。你可以讓它作一首詩(shī),解答一個(gè)哲學(xué)意味的問(wèn)題,甚至幫你做一些創(chuàng)作類型的工作,比如寫劇本,或者編程。
ChatGPT背后是OpenAI推出的AI模型產(chǎn)品GPT-3.5,基于對(duì)超大規(guī)模數(shù)據(jù)的深度學(xué)習(xí),GPT-3.5的性能已經(jīng)實(shí)現(xiàn)了飛躍式的進(jìn)展,這才為ChatGPT賦予了“靈魂”。
在AI繪圖與ChatGPT等產(chǎn)品的多重震撼下,人們終于注意到了一個(gè)新的名詞——AIGC,即AI生成內(nèi)容。2022年12月16日,Science雜志發(fā)布了2022年度科學(xué)十大突破,AIGC正是其中之一,在不少人看來(lái),AIGC是下一個(gè)科技革命的開端,新的時(shí)代正在來(lái)臨。
放眼世界,Stability AI、OpenAI群星閃耀,而在國(guó)內(nèi)AIGC領(lǐng)域,同樣也有一批企業(yè)抓準(zhǔn)了時(shí)代科技的脈搏,而百度絕對(duì)能成為其中最具代表性一家企業(yè)。
早從十年前開始,百度就已經(jīng)入局人工智能領(lǐng)域,是國(guó)內(nèi)最早一批進(jìn)駐AI賽道的玩家,在多年的深度耕耘中,百度在人工智能領(lǐng)域的投入超千億,始終引領(lǐng)著國(guó)內(nèi)AI技術(shù)的發(fā)展,也是世界AI領(lǐng)域最杰出的企業(yè)之一。
早從幾年前開始,百度就已經(jīng)在AIGC領(lǐng)域展開布局,在今年A繪圖迎來(lái)技術(shù)突破之時(shí),百度就推出了基于文心大模型的AI繪圖產(chǎn)品文心一格,其也是國(guó)內(nèi)最早出現(xiàn)、技術(shù)力最強(qiáng)的AI繪圖產(chǎn)品之一。
ChatGPT以對(duì)話反饋與生成式搜索驚艷全球,百度也早已將AI技術(shù)深度植入了搜索引擎匯總,同樣基于文心大模型,百度搜索已經(jīng)進(jìn)行了一輪AIGC化升級(jí),通過(guò)搜索就能生成圖表、文本等內(nèi)容,用戶的開放型搜索需求進(jìn)一步得到了滿足。從某種角度來(lái)說(shuō),中國(guó)的ChatGPT或許正在來(lái)臨的路上,基于百度搜索的強(qiáng)大數(shù)據(jù)基礎(chǔ),在準(zhǔn)確度與時(shí)效性上,百度的生成式搜索或許能夠更加強(qiáng)大。
產(chǎn)品及應(yīng)用已初見成效,對(duì)于百度來(lái)說(shuō),這一次的Create大會(huì)就是一個(gè)重要的節(jié)點(diǎn),其第一次系統(tǒng)地對(duì)自身的AIGC成果進(jìn)行了展示。那么,在元年來(lái)臨的時(shí)刻,百度是如何理解AIGC的,又將打出什么差異化的玩法?
科技、反饋、創(chuàng)新
這已經(jīng)是百度Create大會(huì)的第五年,一直以來(lái),Create大會(huì)都是全國(guó)乃至全世界AI開發(fā)者的一場(chǎng)盛會(huì),但在2022年之后,Create大會(huì)也正在發(fā)生著變化,而契機(jī)正是AIGC。
對(duì)于李彥宏和百度來(lái)說(shuō),AIGC在2022年的爆發(fā),代表的是新時(shí)代的開始。
“讓我來(lái)判斷第四次科技革命的標(biāo)志,我認(rèn)為是深度學(xué)習(xí)算法。這個(gè)技術(shù)能夠帶來(lái)的效率提升、能夠驅(qū)動(dòng)的經(jīng)濟(jì)增長(zhǎng),是比很多人想象的要更大的?!痹谘葜v中,李彥宏給出了這樣一個(gè)判斷,過(guò)去一年AIGC的技術(shù)突破與強(qiáng)應(yīng)用更是為AI領(lǐng)域發(fā)展提供了新的視角。
“技術(shù)層面,AI從理解內(nèi)容,走向了自動(dòng)生成內(nèi)容,這包括AIGC用于作畫、用于圖文、視頻等多類型的內(nèi)容創(chuàng)作?!痹诶顝┖昕磥?lái),方向的轉(zhuǎn)變是清晰可見的,從在過(guò)去各個(gè)巨頭對(duì)真正實(shí)現(xiàn)AGI(通用人工智能)的“執(zhí)念”,到現(xiàn)在AI在創(chuàng)作領(lǐng)域的廣泛應(yīng)用,AI正在實(shí)踐化、實(shí)用化的路上飛速狂奔著,同時(shí)在實(shí)踐的過(guò)程中,通過(guò)最真實(shí)的反饋驅(qū)動(dòng)創(chuàng)新。
這也是李彥宏的核心觀點(diǎn)之一,即“反饋驅(qū)動(dòng)創(chuàng)新”。他在演講中提到了一個(gè)例子,即一位盲人在沒(méi)有外部反饋的條件下需要用137億年才能還原魔方,而在有及時(shí)反饋的情況下只需要兩分半鐘,“閉門造車”永遠(yuǎn)不能帶來(lái)真正的創(chuàng)新發(fā)展。
百度正在這條“反饋”驅(qū)動(dòng)創(chuàng)新的路上前行著。以百度AIGC的基石文心大模型為例,作為百度在NLP等領(lǐng)域布局的預(yù)訓(xùn)練大模型產(chǎn)品,文心大模型能有效集成自然語(yǔ)言處理、計(jì)算機(jī)視覺、智能語(yǔ)音等多模態(tài)能力,并在實(shí)踐中推進(jìn)深度學(xué)習(xí)技術(shù)的發(fā)展,以及大模型產(chǎn)品的調(diào)優(yōu)。目前為止百度文心已經(jīng)累計(jì)發(fā)布了11個(gè)行業(yè)大模型,深入科技、金融、創(chuàng)作等多個(gè)領(lǐng)域,作為技術(shù)底座,文心大模型能夠適應(yīng)多業(yè)務(wù)場(chǎng)景與行業(yè)需求,同時(shí)在實(shí)踐中不斷進(jìn)化。
百度將AIGC的實(shí)踐同樣融入在了整個(gè)大會(huì)之中。
2022百度Create大會(huì)也是首屆“人機(jī)共創(chuàng)大會(huì)”,最直接的表現(xiàn)即為,整個(gè)大會(huì)中深度應(yīng)用了AIGC技術(shù),在宣講百度及行業(yè)的技術(shù)發(fā)展的同時(shí),通過(guò)AIGC創(chuàng)造、搭建數(shù)字化演講場(chǎng)景,比如在大會(huì)開場(chǎng)視頻里,數(shù)字人希加加即開展一場(chǎng)Create世界的多維度跑酷,帶領(lǐng)與會(huì)者深度參與進(jìn)未來(lái)之中;在大會(huì)之中,數(shù)字人樂(lè)隊(duì)還演繹了了AI作詞作曲的歌曲,展現(xiàn)了AI超強(qiáng)的創(chuàng)作能力。
值得關(guān)注的是,數(shù)字人正在成為百度展現(xiàn)AIGC實(shí)力的最佳窗口。一直以來(lái),數(shù)字人都被認(rèn)為是AIGC技術(shù)的集大成者,以百度的度曉曉為例,2022年,度曉曉發(fā)布了MV《啟航星》,無(wú)論是詞曲還是MV內(nèi)容,都完全由AI創(chuàng)作;度曉曉還在世界大會(huì)上挑戰(zhàn)了實(shí)時(shí)創(chuàng)作高考作文,四十秒內(nèi)完成了四十篇,并且獲得了較好的得分反饋。
百度數(shù)字人融入了計(jì)算視覺技術(shù)、智能交互、語(yǔ)言生成等多種先進(jìn)技術(shù),能夠最直接地將AIGC融入其中。在大會(huì)的宣講環(huán)節(jié)里,百度還展示了他們?cè)谥腔鄢鲂?、智能搜索、元宇宙解決方案、量子計(jì)算機(jī)、AI異構(gòu)計(jì)算平臺(tái)等技術(shù)突破,在每一個(gè)宣講的背后,都有度曉曉、希加加、林悠悠等數(shù)字人的參與,他們不僅深度參與了大會(huì)內(nèi)容的創(chuàng)作過(guò)程,還在宣講場(chǎng)景、演講腦圖展開實(shí)時(shí)生成,從某種角度來(lái)說(shuō),AI成為了這場(chǎng)大會(huì)最重要的幕后創(chuàng)造者之一。
在2021年的Create大會(huì)上,李彥宏曾下過(guò)一個(gè)判斷,“隨著技術(shù)應(yīng)用門檻不斷降低,創(chuàng)造者們將迎來(lái)屬于人工智能的黃金10年”,事實(shí)證明,這句話無(wú)疑是正確的。2022年開始,AIGC的黃金時(shí)代正在來(lái)臨,人機(jī)共創(chuàng)Create大會(huì)或許只是個(gè)起點(diǎn)。
我們?cè)俣葘⒁暯腔貧wAIGC本身,百度所理解、踐行的AIGC到底是什么樣的?又將如何抓住“元年”的機(jī)遇?
正如“人機(jī)共創(chuàng)大會(huì)”這一名稱一樣,百度認(rèn)為AIGC是一種“人機(jī)共創(chuàng)”的新模式。在2022年6月的世界大會(huì)上,李彥宏就曾直言,未來(lái)十年,AIGC將會(huì)顛覆現(xiàn)有內(nèi)容生產(chǎn)模式。其并不僅是AI生成內(nèi)容那么簡(jiǎn)單,AIGC代表的是內(nèi)容生產(chǎn)力的一種解放,在效率、精細(xì)度以及數(shù)據(jù)采樣等領(lǐng)域,AI都擁有極強(qiáng)的優(yōu)勢(shì),用更低的成本創(chuàng)造出更多元獨(dú)特的內(nèi)容。
“人機(jī)共創(chuàng)“也同樣需要更深層次的理解。在AIGC漸起之時(shí),“取代人類創(chuàng)作者”的論調(diào)甚囂塵上,甚至在繪畫領(lǐng)域掀起了一場(chǎng)大論戰(zhàn),而在百度看來(lái),AIGC代表的是一種更先進(jìn)的生產(chǎn)方式,而不是AI將人類“取而代之”。
這主要關(guān)乎三方面,一方面是輔助內(nèi)容創(chuàng)作,以文本創(chuàng)作和美術(shù)設(shè)計(jì)為例,AIGC能夠完成許多較為基礎(chǔ)的工作,大大提升創(chuàng)作者的效率;另一方面,AIGC是真正需要貼近用戶需求的,以更低門檻、更便捷的方式為人們提供創(chuàng)作相關(guān)的服務(wù),掌握基本的技術(shù),人人都能通過(guò)AIGC成為創(chuàng)作者;最后,AI也并不是“完美”的,只有與人類創(chuàng)作者的結(jié)合中,在不斷地反饋、糾錯(cuò)之下,才能產(chǎn)生更優(yōu)質(zhì)的內(nèi)容產(chǎn)品。
我們可以以百度的文心大模型驅(qū)動(dòng)的AIGC產(chǎn)品為例,其衍生出了三個(gè)內(nèi)容生成模型,百度大模型負(fù)責(zé)人吳華將它們稱為三個(gè)能力超群的天才創(chuàng)作者。
首先是“天才編劇”文心 ERNIE 3.0 Zeus,其是基于文本創(chuàng)作的內(nèi)容生成模型,它能夠從包括詩(shī)歌、劇本、小說(shuō)等多類型數(shù)據(jù)中進(jìn)行深度學(xué)習(xí),同時(shí)通過(guò)多樣的任務(wù)學(xué)習(xí)知識(shí),從而更好的應(yīng)對(duì)多樣的文本生成任務(wù)。例如寫劇本,文心 ERNIE 3.0 Zeus可以在創(chuàng)作者輸入總綱及分集要求的情況下撰寫劇本,實(shí)現(xiàn)高效率的創(chuàng)作。文心 ERNIE 3.0 Zeus在幾十類自然語(yǔ)言理解和生成公開權(quán)威任務(wù)上,以及零樣本和小樣本學(xué)習(xí)任務(wù)上處于世界領(lǐng)先水平。
文心 ERNIE-ViLG 2.0則針對(duì)的是當(dāng)前的風(fēng)口AI繪圖。在百度文心一格平臺(tái)上,你就能體驗(yàn)到大模型生成圖片內(nèi)容的實(shí)力。通過(guò)一句話或者一段描述文本,文心 ERNIE-ViLG 2.0就能生成你想要的視覺畫面,堪稱天才美術(shù)師、設(shè)計(jì)師。文心一格作為國(guó)內(nèi)領(lǐng)先的繪圖產(chǎn)品,其核心優(yōu)勢(shì)在于在擴(kuò)散模型的基礎(chǔ)上進(jìn)行了知識(shí)增強(qiáng),引入語(yǔ)言、視覺等多源知識(shí),指引模型更加關(guān)注文本和圖像中的核心語(yǔ)義元素,實(shí)現(xiàn)更精準(zhǔn)的語(yǔ)義控制。
最后即是視頻內(nèi)容生成與編輯技術(shù),百度基于大模型給出了一整套視覺內(nèi)容生成與剪輯的技術(shù)方案。簡(jiǎn)單來(lái)說(shuō),用戶可以通過(guò)一個(gè)視覺畫面或者一段描述文本,生成視頻內(nèi)容,同時(shí)這一內(nèi)容是高清、流暢的。在視頻編輯方面,AIGC技術(shù)的運(yùn)用也更加?jì)故?,無(wú)論是視頻修復(fù),還是提升質(zhì)感,文心大模型都已經(jīng)實(shí)現(xiàn)了落地,大大提升了這一領(lǐng)域的創(chuàng)作效率。
從文本到圖像再到視頻,我們能看到,百度的AIGC內(nèi)容生產(chǎn)工具是非常清晰的,借由這三位幫手,創(chuàng)作者能夠?qū)崿F(xiàn)更高效率的生產(chǎn)工作,普通人也能借由工具成為內(nèi)容創(chuàng)作者,這無(wú)疑是對(duì)未來(lái)內(nèi)容生產(chǎn)的一次革新。
百度也同樣有著獨(dú)屬于自身的優(yōu)勢(shì),一方面是知識(shí)增強(qiáng)、小型化等技術(shù)優(yōu)勢(shì),能夠幫助國(guó)內(nèi)AI領(lǐng)域?qū)崿F(xiàn)彎道超車,通過(guò)差異化打法中推動(dòng)AIGC的迅速發(fā)展;另一方面,百度對(duì)于AI的布局是產(chǎn)業(yè)級(jí)的,“百度是全球?yàn)閿?shù)不多的、進(jìn)行全棧布局的人工智能公司。我們所做的事情可以分為四層:芯片層、框架層、模型層和應(yīng)用層?!崩顝┖暝谘葜v中提到。在這樣的產(chǎn)業(yè)鏈路之下,百度能夠?qū)IGC真正運(yùn)用進(jìn)產(chǎn)業(yè)場(chǎng)景中,再度實(shí)現(xiàn)實(shí)踐中反饋,反饋中創(chuàng)新的循環(huán)鏈路。
值得一提的是,百度沒(méi)有忽視人才的重要性。AI領(lǐng)域,人才是最核心的資源之一,百度已經(jīng)在三年間培養(yǎng)了超過(guò)300萬(wàn)AI人才,距離500人才的目標(biāo)距離不遠(yuǎn),在這一次的百度Create大會(huì)上,百度也再提人才戰(zhàn)略,宣布未來(lái)百度會(huì)投入更多資源,通過(guò)高校合作、競(jìng)賽等方式推動(dòng)創(chuàng)新實(shí)踐型AI人才的培養(yǎng)。
在演講的最后,李彥宏展示了一幅用文心一格平臺(tái)創(chuàng)作的畫作,以“危機(jī)和希望”為關(guān)鍵詞,為AIGC乃至AI領(lǐng)域的發(fā)展作“序”?!吧鷻C(jī)勃勃的新生命已經(jīng)破冰而出,然而寒冷還沒(méi)有完全褪去。”在黑暗中摸索,走無(wú)人走過(guò)的路,百度正在開啟一個(gè)屬于AI的嶄新時(shí)代。
聯(lián)系客服