2023
文 / 焦李成
本報(bào)告內(nèi)容分三個(gè)方面,一是AI為什么會(huì)成為大家關(guān)注的焦點(diǎn);二是它到底帶來(lái)的機(jī)遇和挑戰(zhàn)是什么;三是我們應(yīng)該怎樣面對(duì)它。
1 AI新焦點(diǎn)
2022年11月OpenAI公司開(kāi)發(fā)的智能聊天機(jī)器人ChatGPT成為全球熱議話(huà)題,讓大眾見(jiàn)識(shí)到了人工智能的力量。那么,它到底給大眾帶來(lái)了什么?人工智能影響了人類(lèi)生活的哪些方面?這個(gè)熱潮不僅是簡(jiǎn)單聊天機(jī)器人帶給我們生活的改變,更重要的是新一輪技術(shù)革新和產(chǎn)業(yè)革命是否在新浪潮到來(lái)的前夜,這是值得我們思考的問(wèn)題。
ChatGPT引發(fā)了產(chǎn)業(yè)界“大咖”的熱議和關(guān)注(見(jiàn)圖 1),它不僅是一場(chǎng)技術(shù)的創(chuàng)新與應(yīng)用,為人工智能注入了新的活力,更重要的是它為人工智能的發(fā)展帶來(lái)的機(jī)遇和挑戰(zhàn),這是我們需要關(guān)注的。ChatGPT在帶來(lái)了人工智能商業(yè)化契機(jī)的同時(shí),也將刺激更多的技術(shù)創(chuàng)新。ChatGPT為人機(jī)交互注入了新的活力,但要做出真正的“類(lèi)人”的人工智能應(yīng)用,其技術(shù)還有待提升。因此,ChatGPT一定會(huì)帶來(lái)更深、更多、更寬廣的技術(shù)創(chuàng)新浪潮,這才是推動(dòng)社會(huì)向前發(fā)展的動(dòng)力,所以各領(lǐng)域的科學(xué)家都很重視它。
圖1 產(chǎn)業(yè)界“大咖”的熱議
從ChatGPT到GPT-4經(jīng)過(guò)了一段很長(zhǎng)的歷史,它是科學(xué)研究和技術(shù)積累的結(jié)果,從這個(gè)意義上來(lái)講,2018年GPT到2023年的GPT-4每一步都有技術(shù)的革新和技術(shù)的長(zhǎng)進(jìn)(見(jiàn)圖2),但ChatGPT還處于初級(jí)階段,目前只能作為工具輔助人類(lèi)工作不能代替人類(lèi),所以從現(xiàn)在開(kāi)始還會(huì)有技術(shù)的革新,我們更需要去面對(duì)。對(duì)學(xué)術(shù)界來(lái)說(shuō),更多的是要重新再認(rèn)識(shí),要更多地思考下一步大模型技術(shù)創(chuàng)新的突破點(diǎn)在哪里。
圖2 GPT到GPT-4的發(fā)展歷程
人工智能技術(shù)下一次突破點(diǎn)在哪里,深度學(xué)習(xí)的理論和技術(shù)會(huì)怎么影響這個(gè)進(jìn)程。
吳飛教授指出,ChatGPT是一個(gè)現(xiàn)象級(jí)創(chuàng)新產(chǎn)品,它的本質(zhì)仍是以深度學(xué)習(xí)為代表的人工智能技術(shù)長(zhǎng)期發(fā)展、積累的結(jié)果,距真正模擬人類(lèi)的思維還非常遙遠(yuǎn)。所以,GPT-4不完整、不完善是必然的,大家感興趣是客觀的,說(shuō)明我們?nèi)沃氐肋h(yuǎn),尤其是學(xué)術(shù)界要有清醒的頭腦,記住這個(gè)技術(shù)還需要我們不斷的努力去完善。
ChatGPT是一場(chǎng)“虛火”,還是顛覆性技術(shù)革命?2023年的“兩會(huì)”上科技部王志剛部長(zhǎng)說(shuō)到,ChatGPT 從源頭來(lái)看是自然語(yǔ)言理解、自然語(yǔ)言處理兩個(gè)技術(shù),引發(fā)大家關(guān)注,在于它是一個(gè)大模型,對(duì)應(yīng)大數(shù)據(jù)、強(qiáng)計(jì)算、好算法。因此,雖然 ChatGPT帶來(lái)的變革如此迅猛,但它僅是大模型技術(shù),而推動(dòng)技術(shù)產(chǎn)業(yè)的更新不僅只有大模型的技術(shù),所以它并不代表人工智能的全部,也不代表人工智能的將來(lái)。
沒(méi)有理論的突破就不會(huì)有今天的技術(shù),ChatGPT的成功源于自然語(yǔ)言處理領(lǐng)域70 年發(fā)展的長(zhǎng)期積累。Foundation models,我更認(rèn)為它是一個(gè)基礎(chǔ)模型。人工智能技術(shù)基礎(chǔ)理論發(fā)展的重要突破,最先是在自然語(yǔ)言處理領(lǐng)域,它能夠讓機(jī)器像人一樣非常自然地和人類(lèi)進(jìn)行對(duì)話(huà),但對(duì)聲音、語(yǔ)言、文字、圖像這些人類(lèi)交流最自然的信息處理起來(lái)相當(dāng)困難,從而促使了人工智能第三次浪潮的興起。
大模型具有大量的參數(shù)和復(fù)雜的結(jié)構(gòu),通常在強(qiáng)大的算力支撐下利用海量數(shù)據(jù)集下進(jìn)行訓(xùn)練,表現(xiàn)出強(qiáng)大的通用性,在各個(gè)領(lǐng)域展現(xiàn)出了強(qiáng)大的生命力。當(dāng)然我們要清醒的認(rèn)識(shí)到,人有智能、聰明,也絕對(duì)不靠大數(shù)據(jù)、大訓(xùn)練、大模型解決問(wèn)題。
在人的知識(shí)處理中,有一部分是計(jì)算,但更多的是知識(shí)啟發(fā)的推理,包括決策、邏輯的處理等功能在大模型中還遠(yuǎn)遠(yuǎn)不夠,更多要體現(xiàn)為Foundation models。擁有兩個(gè)特性:一個(gè)是它的涌現(xiàn),一個(gè)是它的同質(zhì)。深度大模型的涌現(xiàn)能力強(qiáng),能夠?qū)崿F(xiàn)從量變到質(zhì)變。因?yàn)橛楷F(xiàn)是非線(xiàn)性深度網(wǎng)絡(luò),深度網(wǎng)絡(luò)是由許多神經(jīng)元相互連接組成的一個(gè)大系統(tǒng),涌現(xiàn)是它的基本特征,是大模型的固有特征;同時(shí)也是群體智能行為和復(fù)雜思維的基本機(jī)理和表征,也是人腦感知和認(rèn)知,或者類(lèi)腦感知和認(rèn)知的基本特征。所有這些才構(gòu)成了感知和認(rèn)知。因此它是本質(zhì)性的,對(duì)于大模型來(lái)說(shuō)更是如此,因?yàn)樗歉叨葟?fù)雜的非線(xiàn)性網(wǎng)絡(luò)。而我們多數(shù)人關(guān)注的是它的訓(xùn)練,很少人關(guān)注它的動(dòng)力學(xué)過(guò)程。所以,從因果到涌現(xiàn)再到下一代人工智能,需要我們?nèi)ニ伎歼@些本質(zhì)性的東西。既然是一個(gè)Fundamental,這時(shí)你就會(huì)思考本質(zhì)性的非線(xiàn)性現(xiàn)象和動(dòng)力學(xué)帶來(lái)的問(wèn)題。
ChatGPT成功從技術(shù)上來(lái)講,既然是大模型技術(shù)就離不開(kāi)兩個(gè)核心方面,第一個(gè)是Transformer模型。Transformer最早來(lái)源于電力系統(tǒng)中的變壓器,今天的 Transformer已沒(méi)有變壓器的含義,“大變活人”或者叫做“變形金剛”也不足以形容其本身具有的能力,是ChatGPT突破的關(guān)鍵技術(shù)之一。另外一個(gè)是基于類(lèi)人反饋的強(qiáng)化學(xué)習(xí)(RLHF)方法,一定要有反饋、溝通才去做。
上述技術(shù)的成功主要有下述四個(gè)關(guān)鍵技術(shù)。
關(guān)鍵技術(shù)1 Transformer的強(qiáng)大表征能力為GPT的成功起到了關(guān)鍵作用。GPT的本質(zhì),大模型技術(shù)的核心突破是自監(jiān)督的學(xué)習(xí),大語(yǔ)言模型的核心基礎(chǔ)同樣是 Transformer,這是自然語(yǔ)言處理能帶來(lái)突變性飛躍非常重要的特征。Transformer 強(qiáng)大的表征能力和學(xué)習(xí)能力,是以前的深度學(xué)習(xí)、方法、算法,或者深度學(xué)習(xí)模型所不具有的。
關(guān)鍵技術(shù)2 根據(jù)人類(lèi)偏好校準(zhǔn)生成獎(jiǎng)勵(lì)模型,并對(duì) GPT 模型的“回答”進(jìn)行評(píng)分。
關(guān)鍵技術(shù)3 強(qiáng)化學(xué)習(xí)的原理和基本思想。強(qiáng)化學(xué)習(xí)對(duì)開(kāi)放的環(huán)境、變化的環(huán)境有不斷交互學(xué)習(xí)的、舉一反三的能力,這是人類(lèi)能夠不斷成長(zhǎng)的最本質(zhì)特征之一。從這個(gè)意義上來(lái)講,對(duì)照我們處理的場(chǎng)景和問(wèn)題,恰恰是不謀而合的,所以它是大場(chǎng)景,自然強(qiáng)化學(xué)習(xí)得到了更好的關(guān)注。如果在AI for science模型恰恰描述了有空間、有時(shí)間的動(dòng)力學(xué)過(guò)程,它也同樣是核心的關(guān)鍵技術(shù)之一。
關(guān)鍵技術(shù)4 提示學(xué)習(xí)方法。提示學(xué)習(xí)就是你的經(jīng)驗(yàn)、知識(shí)怎樣能嵌入到訓(xùn)練過(guò)程中,實(shí)現(xiàn)最優(yōu)解。從這點(diǎn)來(lái)說(shuō),提示學(xué)習(xí)不是簡(jiǎn)單名詞意義上的,它更多是知識(shí)和經(jīng)驗(yàn)的運(yùn)用。
ChatGPT、GPT-4之所以能突破,是因?yàn)椴捎昧艘幌盗猩疃葘W(xué)習(xí)的新技術(shù),包括無(wú)監(jiān)督學(xué)習(xí)、有監(jiān)督學(xué)習(xí)、多任務(wù)學(xué)習(xí),以及基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí),所有這些發(fā)展是今天的必然結(jié)果。盡管ChatGPT取得了不錯(cuò)的進(jìn)展,但它仍然處于發(fā)展初期,依然存在一些技術(shù)特點(diǎn)和局限。比如訓(xùn)練時(shí)間長(zhǎng)、資源消耗高、準(zhǔn)確性有待提高、容易存在誤導(dǎo)性等10個(gè)問(wèn)題,因此它還需要不斷研究、改進(jìn)、解決和完善。
2 挑戰(zhàn)與機(jī)遇
ChatGPT認(rèn)為認(rèn)知智能的發(fā)展分為五個(gè)階段,即知覺(jué)和感知階段、表示和推理階段、自主學(xué)習(xí)階段、創(chuàng)造性思維階段、自然交互和社會(huì)化階段。ChatGPT自我評(píng)分只達(dá)到了中間的自主學(xué)習(xí)階段,這個(gè)階段距人類(lèi)真正學(xué)習(xí)的模式和模型還有相當(dāng)大的距離,還需要進(jìn)一步研究和工作。自然語(yǔ)言處理和ChatGPT技術(shù),只是中國(guó)人工智能學(xué)會(huì)論證人工智能領(lǐng)域眾多研究方向中的一個(gè),只是人工智能技術(shù)理論和基礎(chǔ)技術(shù)主要研究的、所要發(fā)展中的一條,而不是人工智能的全部。從這個(gè)意義上來(lái)講,我們還需要更多、更全面地發(fā)展人工智能。記住,離不開(kāi)ChatGPT,當(dāng)然也不能只靠ChatGPT,所以我們需要更深的去思考。
目前,ChatGPT還沒(méi)有通過(guò)人工智能圖靈測(cè)試(當(dāng)然,迄今為止還沒(méi)有人工智能模型真正通過(guò)圖靈測(cè)試),針對(duì)實(shí)際變化場(chǎng)景仍有很多工作要做,我們要努力去研究它、發(fā)展它、應(yīng)用它?;A(chǔ)不牢,地動(dòng)山搖。ChatGPT 的數(shù)理邏輯計(jì)算能力薄弱,對(duì)基礎(chǔ)數(shù)學(xué)和邏輯思維等的處理能力、辨?zhèn)未嬲婺芰Χ加写訌?qiáng)。此外,ChatGPT 代碼生成存在局限性。ChatGPT促進(jìn)了 AIGC 與代碼生成的碰撞融合,可進(jìn)行代碼生成、代碼錯(cuò)誤檢測(cè)修復(fù)、代碼優(yōu)化、代碼理解等任務(wù),但是也依然存在一些局限。
GPT-4促使了通用式人工智能,以前大家認(rèn)為有數(shù)據(jù)就夠了,而數(shù)據(jù)再多在大數(shù)據(jù)同樣也是小樣本,同樣也是不完整的。從表征來(lái)講還只是系統(tǒng)一部分功能和既定的表征,從這個(gè)意義上來(lái)講我們更需要去做。實(shí)際中,數(shù)據(jù)感知獲取時(shí)只是一部分,不夠怎么辦,生成;經(jīng)驗(yàn)知識(shí)不夠怎么辦,生成。所以,生成智能、生成知識(shí)變成了未來(lái)人工智能發(fā)展非常重要的一部分。
如果回到創(chuàng)新源頭,數(shù)據(jù)和知識(shí)協(xié)同學(xué)習(xí)、推理、聯(lián)想、記憶,以及情景感知到認(rèn)知才是人工智能的本質(zhì)和基礎(chǔ)。其實(shí)ChatGPT對(duì)詩(shī)的理解、對(duì)情景的理解、對(duì)情緒的理解、對(duì)情感的理解應(yīng)該與我們相差相當(dāng)大的距離,這就代表了現(xiàn)在人工智能大模型技術(shù)和我們還有相當(dāng)大的距離。
我們離不開(kāi)搜索,但我們的生活、我們的創(chuàng)新、我們的思想、我們的情感不能緊緊依靠搜索。人人都能搜索到這種情感,那你的感情、真摯程度可能就要提出一些懷疑和疑問(wèn);如果感情都能這樣重復(fù)的,那它的真摯度有多少。另外有倫理的問(wèn)題、道德的問(wèn)題,偏見(jiàn)的問(wèn)題,我們需要面對(duì)它,而不是因?yàn)檫@是負(fù)面的就排斥它。
波士頓動(dòng)力從1982年開(kāi)始到現(xiàn)在經(jīng)過(guò)40年還在發(fā)展。2022年,給機(jī)器人手里拎兩個(gè)袋子都不行,今天它就有自己找工具遞給上面的人這樣的智能出現(xiàn),但它缺乏環(huán)境的感知、認(rèn)知、推理和決策的能力。40年彈指一揮間,但40年對(duì)人工智能來(lái)講,大腦和運(yùn)動(dòng)裝配仍在路上。
ChatGPT發(fā)展的十大公開(kāi)問(wèn)題有先進(jìn)性、自主學(xué)習(xí)性、體驗(yàn)性、普及性、可擴(kuò)展性、可解釋性、安全性、推理性、創(chuàng)新性和生態(tài)穩(wěn)定性,也包括其他信任、倫理、道德、法律等方面的問(wèn)題,值得我們研究,也值得我們期待,更說(shuō)明這個(gè)基礎(chǔ)還有待于進(jìn)一步加強(qiáng)。
GPT-4是一個(gè)大型多模態(tài)模型,可以準(zhǔn)確地解決難題,雖然在許多現(xiàn)實(shí)世界場(chǎng)景中的能力不如人類(lèi),但在相關(guān)專(zhuān)業(yè)和學(xué)術(shù)基準(zhǔn)上展現(xiàn)出類(lèi)人的水平。比如,相對(duì)前面ChatGPT在文本、圖像處理方面是一個(gè)新的里程碑。我還要特別強(qiáng)調(diào)的是,GPT-4的成功離不開(kāi)OpenAI研究的團(tuán)隊(duì),團(tuán)隊(duì)的合理分工、協(xié)同、清晰的構(gòu)架,以及堅(jiān)實(shí)的研究方向和明確的目標(biāo)任務(wù)是他們成功的關(guān)鍵,而且是堅(jiān)持一直把它做成。從這個(gè)意義上來(lái)講,它對(duì)我們的研究和技術(shù)的應(yīng)用也提出了相應(yīng)的啟示。GPT-4有它的優(yōu)勢(shì),也有它的問(wèn)題和局限,就像剛才我講ChatGPT一樣,同樣需要我們?nèi)プ觥?br>
面對(duì)人工智能和大模型技術(shù)的來(lái)臨,我們要熱情的擁抱它,我們要有三個(gè)變革,一是用平常的心去對(duì)待它,更要有敬畏的心對(duì)待它,這樣才能把所有問(wèn)題的負(fù)面影響減少到最小。同樣在教育界,我們需要擁抱它,以平常心和創(chuàng)新的能力去做。
目前,自然語(yǔ)言處理還是不完整的、不完善的,因此也是有發(fā)展空間和潛力的,況且整個(gè)人工智能領(lǐng)域。自然語(yǔ)言處理仍然面臨很多風(fēng)險(xiǎn),這時(shí)應(yīng)對(duì)的策略首先應(yīng)該是心態(tài),心態(tài)會(huì)決定一切。
大模型的技術(shù)同樣對(duì)大模型多模態(tài)學(xué)習(xí)帶來(lái)了新機(jī)遇,因?yàn)樗且曨l技術(shù)發(fā)展的動(dòng)力,這里同樣需要去做。一個(gè)是微軟在做的Visual ChatGPT也希望擴(kuò)展到影像,因此有了以擴(kuò)散模型為代表的視覺(jué)模型,從文本到視覺(jué)。Google的VIT模型,也是在做視覺(jué),大家不要僅看參數(shù)有多少,要看它的功能擴(kuò)展。Meta發(fā)布的SAM 大模型也在關(guān)注視覺(jué)任務(wù)。而用一個(gè)模型打遍天下是不可能的,尤其是在影像和視覺(jué)領(lǐng)域、一個(gè)模型就能把所有問(wèn)題都解決是天方夜譚。盤(pán)古大模型是華為在努力做的事情,百度也在做文心一言的模型,阿里和商湯在做跨語(yǔ)言、圖像多模態(tài)大模型,都在路上。此外,清華也做出了一個(gè)多模態(tài)擴(kuò)散模型;我們也在做遙感的大模型和醫(yī)學(xué)領(lǐng)域的大模型,效果還不錯(cuò)。
另外,ChatGPT 對(duì)教育的沖擊很大,教育版的ChatGPT 怎么做,我們要守正和創(chuàng)新;醫(yī)療領(lǐng)域?qū)ξ覀儊?lái)講是挑戰(zhàn)的領(lǐng)域,又是充滿(mǎn)魅力的領(lǐng)域,也是需要我們?nèi)プ龅念I(lǐng)域。所以,大模型是通用的計(jì)算機(jī),比爾·蓋茨說(shuō)它可以和通用的計(jì)算機(jī)相比較。這時(shí)候邊界在哪兒、腦子在哪兒,腦子和手怎么并用,手和大腦怎么嵌套,這是解決從語(yǔ)言到影像再到視覺(jué)模型的基礎(chǔ)。當(dāng)然在政、產(chǎn)、學(xué)、研、用、商各領(lǐng)域更需要我們?nèi)プ龊芏嗍虑?,?duì)企業(yè)的機(jī)遇是不言而喻的。
3 思考與展望
從圖靈測(cè)試到人工智能經(jīng)歷了很多事情,例如,老三論是系統(tǒng)論、控制論和信息論,這里講的模型包括耗散論、突變論和協(xié)同論,一直到現(xiàn)在的本體論、三世界和小世界,所有這些都是非線(xiàn)性動(dòng)力學(xué)現(xiàn)象和群體智能現(xiàn)象的一個(gè)體現(xiàn),而感知、認(rèn)知、學(xué)習(xí)、推理和決策永遠(yuǎn)是人工智能的核心。我們要計(jì)算、要感知、要認(rèn)知,從感知到認(rèn)知還有漫長(zhǎng)的道路要去走,所以說(shuō)離不開(kāi)人工智能。人工智能圖靈獎(jiǎng)的獲得者在思考如何進(jìn)行推理,腦科學(xué)諾貝爾獎(jiǎng)的獲得者在考慮“人如何思考”,生物進(jìn)化類(lèi)諾貝爾獎(jiǎng)的獲得者也在考慮“生物是如何優(yōu)化和進(jìn)化”的,物理領(lǐng)域諾貝爾獎(jiǎng)的獲得者啟發(fā)了我們?cè)谒伎既斯ぶ悄苌疃葘W(xué)習(xí)、深度網(wǎng)絡(luò)大模型物理本質(zhì)是什么,所以說(shuō)下一代人工智能是我們的主題??山忉?、魯棒、安全、自適應(yīng)、創(chuàng)造性、遷移性,我們?cè)趺慈?yīng)對(duì)這樣的挑戰(zhàn)才剛剛開(kāi)始。
深度學(xué)習(xí)也不是一天就有的,下一代深度學(xué)習(xí)講了一個(gè)可解釋、可通用還遠(yuǎn)遠(yuǎn)不夠。這時(shí)候我們?cè)趺慈プ?,基金委最近下發(fā)的十大重點(diǎn)培育項(xiàng)目所列題目就表明了下一代該怎么做;機(jī)器人領(lǐng)域有工信部17個(gè)部門(mén)提出的要求;在場(chǎng)景創(chuàng)新領(lǐng)域,六部委提出了10個(gè)場(chǎng)景示范,這些都是國(guó)家層面的考慮。所以突破在哪里、問(wèn)題在哪里,技術(shù)我們還需要去發(fā)展,從這個(gè)意義上來(lái)講,從感知到認(rèn)知涉及到方方面面,心理、哲學(xué)、語(yǔ)言、人類(lèi)工程包括到神經(jīng),我們更需要協(xié)同發(fā)展。所以,源頭創(chuàng)新一定是圍繞本質(zhì)性問(wèn)題,我們還在路上。
(參考文獻(xiàn)略)
選自《中國(guó)人工智能學(xué)會(huì)通訊》
2023年第13卷 第4期
聯(lián)系客服