有人說(shuō),新技術(shù)的迭代周期已經(jīng)是一年一屆。從2021年10月扎克伯格將公司改名為Meta宣布進(jìn)入元宇宙元年,僅僅一年,全世界跟風(fēng)掀起的All in元宇宙熱浪似乎已被ChatGPT澆滅。
ChatGPT是什么
簡(jiǎn)單說(shuō),ChatGPT是一種專注于對(duì)話生成的大型語(yǔ)言模型。它被比喻為“搜索 社交”的智能結(jié)合體,引入了核心技術(shù)RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí)),以獲得持續(xù)進(jìn)步、天天向上的更好效果。我們每一次使用都在幫助它的進(jìn)化,某種意義上說(shuō),我們是機(jī)器學(xué)習(xí)的助手。
從本質(zhì)上看,ChatGPT還是程序,盡管它看起來(lái)好像具備人的心智,但與真正的人類“心智”有著根本區(qū)別,兩者運(yùn)作機(jī)制完全不同——只是我們把它“想象”成了人類。
ChatGPT了不起的突破是,可以自主生成創(chuàng)造性的答案,甚至像理想中的“人類”那樣能“主動(dòng)”承認(rèn)錯(cuò)誤、優(yōu)化答案;質(zhì)疑你提問的差錯(cuò),甚至敢于承認(rèn)自己的“無(wú)知”——這是一個(gè)非常大的跨越。它踩在了弱智能與強(qiáng)智能的邊界,讓我們對(duì)AGI(通用人工智能)重燃希望——但它依然不是AGI,即使它正在成為一個(gè)新的起點(diǎn),這一步仍然天差地別。
AGI被描述為可以完成甚至超越人類完成所有的任務(wù)。從特定屬性到環(huán)境的一般屬性,它都能提供完整的解決方案。AGI的終極目標(biāo)是實(shí)現(xiàn)自主的感知、認(rèn)知、學(xué)習(xí)、決策、執(zhí)行和社會(huì)協(xié)作,符合人類的情感、倫理與道德觀念。換句話說(shuō),它至少要滿足四個(gè)關(guān)鍵條件:(1)能夠像人類那樣自主產(chǎn)生任務(wù);(2)能處理在復(fù)雜動(dòng)態(tài)的物理和社會(huì)環(huán)境中沒有預(yù)先定義的任何任務(wù);(3)具備辨別是非的價(jià)值系統(tǒng);(4)具備人類那樣的情緒感知與審美能力。
也就是說(shuō),能做到不僅擁有完成目標(biāo)的能力,還能享受過(guò)程中的主觀體驗(yàn),是由感知與價(jià)值認(rèn)知架構(gòu)所驅(qū)動(dòng)的通用智能體——而ChatGPT既沒有自我“體驗(yàn)”,也不能“自我”審視和理解自身的作為——這就是那關(guān)鍵的一步。
ChatGPT為什么火
ChatGPT引起全球關(guān)注,不應(yīng)忽視其在商業(yè)上的成功。國(guó)內(nèi)外雖有很多科技巨頭在研究聊天機(jī)器人,也布局了多年,但2022年的最后關(guān)頭,只有ChatGPT脫穎而出。這不是因?yàn)檫\(yùn)氣,而是它準(zhǔn)確地把握住了自身技術(shù)特征與人性需求的契合點(diǎn),并且恰逢其時(shí)——這一點(diǎn)很像喬布斯“美學(xué)”,盡管看上去它和諾基亞做的都是“手機(jī)”一樣。
ChatGPT有一件事做得很關(guān)鍵,就是建立起真實(shí)的用戶調(diào)用和模型迭代之間的互動(dòng)。在充滿不確定性的時(shí)代,尋求來(lái)自神秘力量的“答案”迎合了人類對(duì)未知的迷茫與恐懼,也滿足了人們對(duì)未來(lái)的好奇與渴望。
其實(shí),ChatGPT的成功靠的不是單一環(huán)節(jié),而是系統(tǒng)化的整體突破。在這里,被答案化的不僅是知識(shí),還包含人的身體、行為甚至靈魂。
與迫不及待炮制“元宇宙”概念的Facebook不同,ChatGPT給產(chǎn)業(yè)帶來(lái)的影響是實(shí)質(zhì)性的。政策制定者和社會(huì)治理的研究者們必須馬上給出回應(yīng),因?yàn)镃hatGPT可以與其他AIGC模型聯(lián)合使用,獲得產(chǎn)業(yè)落地的場(chǎng)景,呈現(xiàn)各種酷炫而實(shí)用的功能——激蕩變局中的企業(yè)從中看到了希望,競(jìng)相奔跑在還未設(shè)立規(guī)則的賽道上。
比爾·蓋茨說(shuō)過(guò),人們總是高估新技術(shù)出現(xiàn)的第一個(gè)五年,低估第二個(gè)五年。如今,ChatGPT似乎讓人無(wú)法忍耐“讓子彈飛”的寂寞。風(fēng)口之下,科技巨頭們紛紛提前推出相似產(chǎn)品——Google、Meta的聊天機(jī)器人Bard和BlenderBot,百度、阿里、京東、科大訊飛等也相繼發(fā)布了ChatGPT產(chǎn)品計(jì)劃。
科技創(chuàng)新背后,盡顯企業(yè)對(duì)未來(lái)產(chǎn)業(yè)的激烈市場(chǎng)爭(zhēng)奪戰(zhàn)。
差距在哪里
有文章說(shuō),ChatGPT研發(fā)團(tuán)隊(duì)里10%是華人,說(shuō)明海外華人是全球科技創(chuàng)新的重要力量。那么,類似的AI突破會(huì)發(fā)生在我們身邊嗎?如果有差距,我們從中可以獲得哪些啟示?
首先,ChatGPT讓我們更深刻地意識(shí)到,任何科技創(chuàng)新成功絕不可能是單點(diǎn)突破,一定是系統(tǒng)性和生態(tài)級(jí)別——算法編程、硬件材料、數(shù)據(jù)思維與能力、機(jī)制模式甚至文化綜合作用的結(jié)果。以至于復(fù)旦大學(xué)張軍平教授說(shuō),想超越ChatGPT,至少編程、硬件、數(shù)據(jù)這三方面都要同時(shí)使力。
在物聯(lián)網(wǎng)語(yǔ)境里,“硬件”的重要性尤其不能忽視。美國(guó)對(duì)頂級(jí)計(jì)算芯片有限制,比如ChatGPT用的Nvidia A100,國(guó)內(nèi)就無(wú)法獲取,這導(dǎo)致算力上會(huì)有差距。要突破卡脖子環(huán)節(jié),我們從芯片到顯卡都需要實(shí)現(xiàn)徹底突破。
其次,巨大成本令人咋舌。我們顯性看得到的是直接的經(jīng)費(fèi)投入,比如大模型的訓(xùn)練成本。目前ChatGPT知識(shí)更新頻率還無(wú)法與現(xiàn)實(shí)發(fā)展同步,知識(shí)訓(xùn)練庫(kù)只停留在2021年。即便為了達(dá)到當(dāng)前的效果,ChatGPT大概用了285000個(gè)CPU和10000多顆GPU,24小時(shí)不間斷輸入數(shù)據(jù),用45TB的文本數(shù)據(jù)量、近萬(wàn)億個(gè)單詞(相當(dāng)于1351萬(wàn)本牛津詞典)來(lái)訓(xùn)練模型。據(jù)小冰機(jī)器人研發(fā)專家估算,訓(xùn)練這樣一個(gè)包含1750億參數(shù)的語(yǔ)言大模型,至少需要每天3億、一年近千億元人民幣的對(duì)話成本。
那么,隱性的成本呢?OpenAI從成立到推出ChatGPT用了7年時(shí)間,直到去年還處于虧損狀態(tài),也曾飽受質(zhì)疑。沒有誰(shuí)能夠輕輕松松地成功,科技創(chuàng)新尤其需要較長(zhǎng)時(shí)間的積累?,F(xiàn)在市場(chǎng)驟熱群起跟風(fēng),那些模仿功能的產(chǎn)品在創(chuàng)新上的意義在哪里?
能否耐得住寂寞,不只是財(cái)力投入的持久,還有賴于對(duì)科技發(fā)展趨勢(shì)與人類演化的洞察。“人工智能”可視作人機(jī)智能的融合,這是一條布滿荊棘又極為艱險(xiǎn)的道路。趨勢(shì)判斷力決定了我們對(duì)技術(shù)孵化的態(tài)度,能否從國(guó)家戰(zhàn)略的高度對(duì)目標(biāo)設(shè)定、節(jié)奏把握、資源投入以及評(píng)價(jià)機(jī)制進(jìn)行總體布局和科學(xué)決策,決定了未來(lái)若干年的結(jié)果,而國(guó)內(nèi)智庫(kù)在這方面的貢獻(xiàn)實(shí)在乏善可陳。
此外,教育理念僵化、學(xué)科邊界固守、學(xué)術(shù)風(fēng)氣腐敗等現(xiàn)象,都造成了科研的功利性和實(shí)事求是的科學(xué)精神匱缺。毫無(wú)疑問,在重大科技創(chuàng)新實(shí)踐中,扎實(shí)培育原創(chuàng)力是保持民族發(fā)展活力與國(guó)家強(qiáng)大競(jìng)爭(zhēng)力的核心要素。
機(jī)會(huì)在哪里
只要能夠感知趨勢(shì),那么ChatGPT帶來(lái)的就不僅是啟示,也有機(jī)會(huì)。
首先,“真相”和無(wú)限接近真相的可能。在收購(gòu)?fù)铺貢r(shí),埃隆·馬斯克就說(shuō),成為一個(gè)最大限度被信任的數(shù)字公共廣場(chǎng)是非常重要的。清華大學(xué)黃民烈教授提到,在GPT-3之后,OpenAI所有的模型都沒有開源,但提供了API調(diào)用,且非常重視真實(shí)世界數(shù)據(jù)的調(diào)用以及這些數(shù)據(jù)對(duì)模型的迭代。沒有前提的真實(shí),再優(yōu)秀的算法模型也只能產(chǎn)生錯(cuò)誤。
2月8日,Google聊天機(jī)器人Bard首秀犯下事實(shí)性錯(cuò)誤,加深了人們對(duì)于GPT的不信任感。事實(shí)上,公開場(chǎng)合面臨的是最苛刻和專業(yè)的審查,而更多的翻車則是在無(wú)法核驗(yàn)或者普通人不具備知識(shí)優(yōu)勢(shì)的尋常場(chǎng)合。
這正是ChatGPT飽受詬病之處。大家公認(rèn),它善于一本正經(jīng)地胡說(shuō)八道。而對(duì)于公眾而言,這比一眼可見的虛假和騙術(shù)更危險(xiǎn)。
目前,ChatGPT還是一個(gè)黑盒計(jì)算,在內(nèi)容的可信性和可控性上都有較大局限。這既是研發(fā)可以深化的角度,也是產(chǎn)業(yè)機(jī)會(huì)和市場(chǎng)空間。盡可能準(zhǔn)確的信息、通過(guò)核驗(yàn)優(yōu)化的知識(shí),與知識(shí)圖譜這類知識(shí)管理和信息注入技術(shù)結(jié)合,在特定的數(shù)據(jù)范圍和應(yīng)用場(chǎng)景內(nèi),就可能獲得更為可靠的結(jié)果。這也是2018年以來(lái)我們的研發(fā)團(tuán)隊(duì)研發(fā)“源數(shù)據(jù)”的初衷。
我一直認(rèn)為,傳媒業(yè)是上蒼給人類的一個(gè)用于揭示真相的最好“禮物”。
其次,行業(yè)數(shù)據(jù)及信息安全保護(hù)。對(duì)于國(guó)內(nèi)的科研與產(chǎn)業(yè)而言,這都是一個(gè)有限的窗口期。一方面,ChatGPT沒有開源,需要重建這個(gè)系統(tǒng)的話難度比較高。另一方面,數(shù)據(jù)規(guī)模達(dá)到如此大的量級(jí)可能會(huì)比較困難,ChatGPT收集的數(shù)據(jù)都來(lái)自互聯(lián)網(wǎng),大部分是英文,比較容易拿到。而在國(guó)內(nèi),有數(shù)據(jù)安全法等一系列政策,行業(yè)與產(chǎn)業(yè)數(shù)據(jù)的收集是很困難的事情,即便拿到的數(shù)據(jù)也因?yàn)榘踩L(fēng)險(xiǎn)難以共享。當(dāng)然,這對(duì)于在特定環(huán)境內(nèi)加快研發(fā)、補(bǔ)齊短板無(wú)疑是有利的。
另一個(gè)被忽略的問題是,要高度重視AI進(jìn)化與社會(huì)治理、技術(shù)倫理的研究,而且到了刻不容緩的地步。制度建設(shè)往往落后于現(xiàn)實(shí)變革,但AI的到來(lái)需要我們有預(yù)見性和治理模型的預(yù)設(shè)能力,否則類人智能甚至新“物種”的出現(xiàn)將令人類悔之晚矣。
目前,國(guó)內(nèi)的人文社會(huì)學(xué)科與理工學(xué)科還存在相互割裂的狀況,嚴(yán)重影響了我國(guó)人工智能整體發(fā)展水平的提升。簡(jiǎn)單地把人工智能當(dāng)作計(jì)算機(jī)學(xué)科或某一學(xué)科的專屬領(lǐng)地,甚至排斥腦認(rèn)知、神經(jīng)學(xué)、心理學(xué)、醫(yī)學(xué)與法學(xué)、倫理學(xué)、哲學(xué)的融合,其后果很快將顯現(xiàn)出來(lái)。
應(yīng)該說(shuō),商業(yè)狂歡與產(chǎn)業(yè)應(yīng)用的突飛猛進(jìn),無(wú)法補(bǔ)償我們?cè)谖磥?lái)因匆忙無(wú)知所付出的代價(jià)。今天,人機(jī)智能融合的探索已很難預(yù)言結(jié)局,只能在跋涉中不斷反思、自省,因?yàn)闁|西方文明所面對(duì)的是人類共同的命運(yùn),這也是人類科技文明走向光明未來(lái)的唯一選擇。
聯(lián)系客服