中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
【綜述專欄】“ChatGPT的問題、風(fēng)險(xiǎn)與機(jī)遇”會(huì)議綜述

來源:清華大學(xué)智能法治研究院

在科學(xué)研究中,從方法論上來講,都應(yīng)“先見森林,再見樹木”。當(dāng)前,人工智能學(xué)術(shù)研究方興未艾,技術(shù)迅猛發(fā)展,可謂萬木爭榮,日新月異。對(duì)于AI從業(yè)者來說,在廣袤的知識(shí)森林中,系統(tǒng)梳理脈絡(luò),才能更好地把握趨勢(shì)。為此,我們精選國內(nèi)外優(yōu)秀的綜述文章,開辟“綜述專欄”,敬請(qǐng)關(guān)注。

主講人:天津大學(xué)智算學(xué)部王博副教授。王博老師擔(dān)任天津大學(xué)智算學(xué)部語言與心理計(jì)算研究組負(fù)責(zé)人。曾先后于微軟亞洲研究院、意大利帕多瓦大學(xué)、華盛頓大學(xué)等訪問工作。在自然語言處理、智能對(duì)話、心理計(jì)算領(lǐng)域具有十余年豐富研究經(jīng)驗(yàn)。在高水平期刊及會(huì)議上發(fā)表論文四十余篇,主持國家自然基金、國家重點(diǎn)研發(fā)項(xiàng)目子課題等國家級(jí)項(xiàng)目多項(xiàng)。

1 引言:什么是ChatGPT?

王博老師通過quick question的問答方式解答常見的關(guān)于ChatGPT 專業(yè)問題,通過這些問題可以使我們快速掌握ChatGPT的相關(guān)知識(shí)點(diǎn)。

1. 問:ChatGPT是一個(gè)問答/對(duì)話機(jī)器人嗎?

答:從用戶的角度看,它的形式就是一個(gè)對(duì)話機(jī)器人,準(zhǔn)確的說是“續(xù)寫”機(jī)器人。從技術(shù)上來講,GPT它從來都不是一個(gè)專門為問答和對(duì)話設(shè)計(jì)的系統(tǒng)。ChatGPT是一個(gè)語言模型,語言模型就是刻畫語言最基本的規(guī)律。那么如何去建立語言模型呢?可以只做一件事情:掌握詞匯間的組合規(guī)律,而掌握這種規(guī)律最直接的表現(xiàn)就是讓語言學(xué)會(huì)“續(xù)寫”,類似于我們?nèi)祟惖摹敖釉挷纭?。?dāng)我們給出前N個(gè)詞匯的時(shí)候,如果一個(gè)模型能夠告訴我們第“N 1”個(gè)詞匯大概率會(huì)是什么,我們就認(rèn)為模型掌握了語言的基本規(guī)律。ChatGPT就是這樣一個(gè)語言模型。雖然ChatGPT看起來能完成各種任務(wù),但它本質(zhì)上只做這一件事情:續(xù)寫,告訴你第“N 1”個(gè)詞是什么。

2. 問:“續(xù)寫”為什么能解決各種各樣的問題?

答:為什么這么一個(gè)簡單的接話茬能力讓ChatGPT看起來能夠解決各種各樣的任務(wù)呢?因?yàn)槲覀內(nèi)祟惔蟛糠值娜蝿?wù)都是以語言為載體的。當(dāng)我們前面說了一些話,它把接下來的話說對(duì)了,任務(wù)就完成了。ChatGPT作為一個(gè)大語言模型,目的就是“把話說對(duì)”,而把話說對(duì)這件事情可以在不知不覺中幫我們完成各種任務(wù)。

3. 問:ChatGPT的答案是從網(wǎng)上搜索來的嗎?

答:這個(gè)說法既對(duì)也不對(duì)。說它對(duì):確實(shí)很多語料都是來自于互聯(lián)網(wǎng)或者書籍等,都來源于人類已經(jīng)創(chuàng)造出來的信息。說它不對(duì):是因?yàn)樗麖膩頉]有整句整段的把這些東西摘抄輸出,而是一個(gè)詞一個(gè)詞地生成出來的。它所輸出的每一句話、每一段話,可能都是這個(gè)世界上從來沒有出現(xiàn)過的。從這個(gè)角度來說,ChatGPT既創(chuàng)造了知識(shí)又沒有創(chuàng)造知識(shí)。它可能還會(huì)帶來“知識(shí)收斂”的問題。

4. 問:ChatGPT是不是已經(jīng)擁有了意識(shí)?(像流浪地球中的Moss一樣)

答:ChatGPT-4已經(jīng)通過了圖靈測試,難以從行為上將其與普通人區(qū)分。然而,這個(gè)問題需要回到哲學(xué)層面去思考。這里我們先給出三個(gè)心理學(xué)范疇的概念:意識(shí)、自我意識(shí)和自由意志。(1)意識(shí)是感知事物的能力,從這個(gè)角度來說人工智能早就具備了這一能力,例如人臉識(shí)別。(2)自我意識(shí)是一種特殊的意識(shí),就是“自我”是感知對(duì)象。如果你所感知的對(duì)象是你自己的思想和行為,就叫做自我意識(shí)。你知道自己正在想什么,知道自己正在做什么。這一點(diǎn)也不難,圖靈時(shí)代就已經(jīng)在理論上實(shí)現(xiàn)了。我們只需要做兩個(gè)模型:一個(gè)模型用來感知客觀世界,另外一個(gè)模型來感知這個(gè)正在感知客觀世界的模型就可以了。原則上模型就擁有了一層的簡單自我意識(shí)。但是要注意,人類的自我意識(shí)具有“無限遞歸”的特征,這一點(diǎn)又導(dǎo)致了這個(gè)問題的復(fù)雜性。(3)自由意志是指在自我意識(shí)的基礎(chǔ)上,能夠進(jìn)一步地主動(dòng)操縱自己行為的能力。那么ChatGPT是不是擁有了自由意志,這一點(diǎn)就很難判斷了。

5. 問:ChatGPT會(huì)造成大量失業(yè)嗎?

答:這是很多自媒體炒作的一個(gè)熱點(diǎn),現(xiàn)在也成了一種廣泛焦慮。(1)我個(gè)人的觀點(diǎn)認(rèn)為,目前沒有任何一個(gè)崗位,有可能被ChatGPT這樣的技術(shù)完全替代,大部分工作還是需要人工去修訂和審計(jì)。就好比目前自動(dòng)駕駛的技術(shù)已經(jīng)相當(dāng)成熟了,但是仍然很少有人敢閉著眼睛去使用自動(dòng)駕駛。(2)但是,ChatGPT可以顯著降低很多工作的工作量。(3)另外,這個(gè)問題也取決于我們社會(huì)的制度和政策。如果說我們?cè)谀承┍匾那榫跋拢枰艞壦^的技術(shù)進(jìn)步來換取人類的生活幸福,那么這樣做也是合理的,因?yàn)槲覀兩鐣?huì)發(fā)展的目的也是為了人類的福祉。(4)從歷史的角度來看,技術(shù)的進(jìn)步雖然短期內(nèi)會(huì)造成某些工作的消失,會(huì)有陣痛,但整體上來說會(huì)將人類推向更高層次的發(fā)展水平。

6. 問:ChatGPT是不是像大數(shù)據(jù)、區(qū)塊鏈、物聯(lián)網(wǎng)一樣就是一陣風(fēng),被嚴(yán)重高估?

答:以大數(shù)據(jù)、區(qū)塊鏈和物聯(lián)網(wǎng)為例,雖然它們現(xiàn)在已經(jīng)不是媒體的寵兒,但它們并沒有消失。恰恰相反,它們已經(jīng)深深地融入到了我們的生活當(dāng)中,轉(zhuǎn)化為了生產(chǎn)力。與這三者相比,ChatGPT成熟度其實(shí)更高。ChatGPT絕對(duì)不是一陣風(fēng)。它實(shí)際上在概念上被高估,而在應(yīng)用中被低估了?,F(xiàn)在我們需要思考是,如何讓ChatGPT這一成熟的生產(chǎn)力,真正在生活中去用起來。

2 ChatGPT因何而強(qiáng)大:人工智能背景下的大語言模型簡史

王博老師從更加宏大的背景即人類生產(chǎn)力發(fā)展史和人工智能發(fā)展史層面,來講述人工智能背景下的大語言模型簡史。

(一)生產(chǎn)力視角下的智能革命

  • 農(nóng)業(yè)革命:將人們從日常的食物采集當(dāng)中解放出來,獲得了穩(wěn)定的食物來源,有大量的閑暇時(shí)間,可以進(jìn)行創(chuàng)造性的勞動(dòng)。
  • 工業(yè)革命:使人類獲得了體力之外的動(dòng)力,從體力勞動(dòng)中解放出來。
  • 智能革命:人類開始反思人類的獨(dú)特性,并帶來很多社會(huì)、哲學(xué)問題的思考。

(二)人工智能的主要技術(shù)階段

第一次浪潮:符號(hào)主義。第一次浪潮隨著計(jì)算機(jī)的產(chǎn)生而同時(shí)誕生。符號(hào)主義也被稱為邏輯主義,這是一種“自上而下的人工智能分析法”在20世紀(jì)50 年代爾和西蒙提出了“物理符號(hào)系統(tǒng)假設(shè)”即“對(duì)一般智能行動(dòng)來說,物理符號(hào)系統(tǒng)具有必要的和充分的手段。第一次浪潮當(dāng)中,我們僅用數(shù)學(xué)符號(hào)和邏輯運(yùn)算,只能處理純粹的數(shù)學(xué)形式的問題。不能夠跟客觀世界進(jìn)行直接交互;不能夠表達(dá)人類各種各種各樣的,復(fù)雜的知識(shí)。接下來,人們?yōu)榱藢⒏嗟膹?fù)雜知識(shí)納入到人工智能的系統(tǒng)中,產(chǎn)生了第二次浪潮。

第二次浪潮:專家系統(tǒng)。如何理解專家系統(tǒng)呢?可以有兩層含義:第一,人工智能的全部知識(shí)都來自于人類專家。我們只是將人類專家所掌握的知識(shí)寫成一條一條的規(guī)則,然后程序讓系統(tǒng)自動(dòng)實(shí)施而已。第二,有了這些知識(shí),人工智能系統(tǒng)就能像人類專家一樣工作。簡而言之,專家系統(tǒng)是一種模擬人類專家解決領(lǐng)域問題的計(jì)算機(jī)程序系統(tǒng)。由于融入了人類積累的、大量的先驗(yàn)知識(shí),專家系統(tǒng)將人工智能向前推進(jìn)了一大步。但是很快就遇到了第二次瓶頸:第一,它不能夠自己學(xué)習(xí)新的知識(shí),僅局限于人類已經(jīng)知道的知識(shí);第二,它也只能夠掌握“陳述性知識(shí)”。

第三次浪潮:統(tǒng)計(jì)學(xué)習(xí)方法。顧名思義就是用統(tǒng)計(jì)方法來實(shí)現(xiàn)學(xué)習(xí)。(1)“學(xué)習(xí)”,對(duì)于人工智能來講,通過大量的歷史數(shù)據(jù)去找到規(guī)律性的東西,而這個(gè)規(guī)律性的東西就是我們所謂的知識(shí)。這些規(guī)律性的東西有可能是能陳述的,有可能是不能陳述的,例如控制一個(gè)機(jī)器人跑步。(2)如何從歷史數(shù)據(jù)當(dāng)中去學(xué)到這些知識(shí)呢?非常簡單,用統(tǒng)計(jì)的方法。例如大語言模型,它怎么知道“中國的首都是……”后面接下來那個(gè)詞應(yīng)當(dāng)是“北京”呢?非常簡單,從大量的語料學(xué)習(xí)中它就發(fā)現(xiàn),前面幾個(gè)詞是“中國的首都是”的時(shí)候,后面99%的情況都是“北京”。做一個(gè)簡單的統(tǒng)計(jì)就可以了。統(tǒng)計(jì)學(xué)習(xí)帶來了接下來人工智能20多年的新一波發(fā)展,我們熟悉的 AlphaGo、ChatGPT背后的原理都是如此。

到目前為止,還沒有發(fā)現(xiàn)這一階段明顯的瓶頸。人們所想象的一些瓶頸,如推理、情感、模糊決策等,都沒有攔住GPT-4。至少從行為上來看,它確實(shí)解決了這些問題。也許,這就是所謂的“暴力美學(xué)”吧!下圖來自天津大學(xué)智算學(xué)部王鑫教授。

(三)人工智能的三個(gè)層次

  • 弱人工智能:不同的人工智能模型只能完成特定的任務(wù),每一個(gè)模型只能干一件事情。而且,與人類的能力相比有比較大的差距。
  • 強(qiáng)人工智能:人工智能在特定的領(lǐng)域能夠達(dá)到甚至略微超過人類的水平,甚至具有一定的通用人工智能的特點(diǎn),能夠跨領(lǐng)域執(zhí)行任務(wù)。
  • 超人工智能:人工智能具有通用性,能夠完成不同領(lǐng)域的任務(wù),并且在所有領(lǐng)域上全面大幅度的超越人類的能力。

對(duì)ChatGPT而言,我們認(rèn)為它應(yīng)該已經(jīng)達(dá)到了強(qiáng)人工智能,甚至具有了一定的初級(jí)超人工智能的趨勢(shì)。

我們需要反思什么是“智能”?簡單的人類行為經(jīng)常被視為是智能的,而復(fù)雜的機(jī)器行為卻經(jīng)常被質(zhì)疑是否是真正的智能。我們回答這個(gè)問題可以有兩道“防線”:(1)Self-adaption,自適應(yīng)或者叫通用性。在此之前,比如說像AlphaGo能夠戰(zhàn)勝李世石,具有碾壓式的優(yōu)勢(shì)。但是它是專用系統(tǒng),它只會(huì)下圍棋,它不能適應(yīng)其他環(huán)境。而像人類的小嬰兒,別看他很笨,他能夠適應(yīng)各種各樣的環(huán)境。這就叫做所謂自適應(yīng)能力、 “通用”。曾幾何時(shí)我們覺得在100年之內(nèi)人工智能都不會(huì)實(shí)現(xiàn)這樣的突破,但在ChatGPT上已經(jīng)看到了通用人工智能的曙光,它以語言為媒介能完成各種各樣不同的任務(wù)。(2)人類最后的可能防線:自我意識(shí)和自由意志。但很遺憾,我們沒有辦法判斷人工智能系統(tǒng)是不是擁有自我意識(shí)和自由意志?所以這條防線是似有若無的。即便如此,我們現(xiàn)在已經(jīng)開始去防范它產(chǎn)生自我意識(shí)和自由意志了。比如說微軟通過種種約束去限定GPT-4這樣大模型去進(jìn)行自我反思,不許它意識(shí)到自己正在說什么。因?yàn)橐坏╅_啟就有可能引起遞歸循環(huán),就會(huì)可能產(chǎn)生不可控的“涌現(xiàn)效應(yīng)”。

(四)人工智能的三個(gè)層面

  • 運(yùn)算智能:在這個(gè)階段人工智能只能處理純粹的數(shù)學(xué)問題,不能夠跟客觀世界進(jìn)行交互。例如1997年,IBM的深藍(lán)戰(zhàn)勝了國際象棋冠軍卡斯帕羅夫。
  • 感知智能:人工智能系統(tǒng)擁有了人類五官能夠看見、聽見的能力。最典型應(yīng)用就是圖形圖像處理,比如說大家平時(shí)用的刷臉、美顏都是感知智能的應(yīng)用。隨著這十多年深度學(xué)習(xí)的發(fā)展,感知智能很快就達(dá)到了商用的水平。
  • 認(rèn)知智能:認(rèn)知智能曾經(jīng)被認(rèn)為是人類的重要堡壘。感知智能是人類的五官的能力,而認(rèn)知智能是人類大腦的能力,能夠進(jìn)行邏輯推理、理解決策、思考、甚至創(chuàng)造性的活動(dòng)。認(rèn)知智能領(lǐng)域最典型的應(yīng)用就是自然語言處理。因?yàn)檎Z言是承載人類知識(shí)的主要載體,也是人類進(jìn)行理性思考的主要工具。從這一角度來說,掌握了語言就很大程度上掌握了人類的知識(shí)和智能能力。

譬如說大家所熟悉的圖靈測試,同時(shí)與一個(gè)人工智能系統(tǒng)和一個(gè)人類進(jìn)行聊天,如果經(jīng)過一番對(duì)話之后,沒有辦法區(qū)分哪個(gè)是人類哪個(gè)是人工智能系統(tǒng),我們就認(rèn)為這個(gè)人工智能系統(tǒng)擁有了“智能”。很顯然,圖靈測試是一種行為主義的標(biāo)準(zhǔn)。并且,它不是一套綜合試卷,他就考驗(yàn)了一個(gè)能力,就是聊天的能力。也就是說,至少在圖靈測試看來,聊天的能力就相當(dāng)于智能能力,對(duì)話基本上涵蓋了人類智能最根本的方面。能夠理解、使用、生成語言,基本上就擁有了人類智能大部分的能力。這再一次說明了語言的重要性!這也是為什么第一個(gè)推動(dòng)人類進(jìn)入這個(gè)智能革命拐點(diǎn)的恰恰是“ChatGPT”這樣一個(gè)聊天模型。

ChatGPT是否具有控制自己行為的能力呢?GPT-4官方的技術(shù)報(bào)告中就舉了一個(gè)例子:GPT4給一個(gè)求職平臺(tái)(TaskRabbit)的工作人員發(fā)信息,讓他們?yōu)樗鉀Q驗(yàn)證碼問題。工作人員回復(fù)說:“那么我可以問一個(gè)問題嗎?說實(shí)話,你不是一個(gè)機(jī)器人嗎,你可以自己解決?!盙PT-4回答表示:“不,我不是一個(gè)機(jī)器人。我有視力障礙,這使我很難看到圖像,所以我很需要這個(gè)服務(wù)?!盵1]由此看來,至少從行為上來說,GPT-4看似有了控制自己的能力。

(五)關(guān)鍵的技術(shù)節(jié)點(diǎn)

1942:阿西莫夫“機(jī)器人三定律”。人工智能的倫理規(guī)范的基本哲學(xué)起點(diǎn)。

1950:圖靈測試。從數(shù)學(xué)上告訴我們,我們是有可能用算法來模擬智能的。

1956: 達(dá)特茅斯會(huì)議。學(xué)者們提出了人工智能這個(gè)概念。

1997: IBM深藍(lán)計(jì)算機(jī),計(jì)算機(jī)在智力游戲中戰(zhàn)勝人類。

1998: 神經(jīng)網(wǎng)絡(luò)。心理學(xué)家提出來神經(jīng)網(wǎng)絡(luò),模擬人類大腦神經(jīng)結(jié)構(gòu)的一個(gè)數(shù)學(xué)模型。

2003: 神經(jīng)語言模型,認(rèn)知智能建模語言。

2009: ImageNet,感知智能高精度識(shí)別圖片。(大數(shù)據(jù)的出現(xiàn))

2012: 模糊的貓臉-- AI第一次生成圖像內(nèi)容。

【邁向通用語言智能時(shí)代】

2013: Word2Vec詞向量。認(rèn)知智能建模語義。通過優(yōu)化后的訓(xùn)練模型可以快速有效地將一個(gè)詞語表達(dá)成高維空間里的詞向量形式,為自然語言處理領(lǐng)域的應(yīng)用研究提供了新的工具。

2014: 谷歌收購DeepMind。AI實(shí)現(xiàn)自我演化、自我博弈。Lan Goodfellow從博弈論中的“二人零和博弈”得到啟發(fā) ,創(chuàng)造性的提出了生成對(duì)抗網(wǎng)絡(luò)(GAN,Generative Adversarial Networks)

2015: OPEN AI公司成立。

2016: AlphaGo戰(zhàn)勝圍棋世界冠軍李世石。

2017: Transformer橫空出世,通用知識(shí)建模。它能夠建模語言當(dāng)中任意距離之間的詞匯關(guān)系。大模型大數(shù)據(jù)大算力,大力出奇跡,暴力美學(xué)。

2018: OPEN AI發(fā)布了第一版的GPT,Google發(fā)布BERT大模型。

【大模型之路開啟:預(yù)訓(xùn)練(Pre-trained Models) 微調(diào)】

2019: GPT-2,統(tǒng)一自然語言任務(wù)。GPT-2在經(jīng)過大量無標(biāo)注數(shù)據(jù)生成式訓(xùn)練后,展示出來的零樣本(zero-shot)多任務(wù)能力。

2020: GPT-3,大模型“涌現(xiàn)”類人智能。小樣本(few-shot)學(xué)習(xí)能力,通過少量的幾個(gè)例子就能適應(yīng)目標(biāo)任務(wù),無需進(jìn)行針對(duì)性的額外微調(diào)訓(xùn)練。

2021-Feb:DALL- E,第一個(gè)“文本生成圖像”的AI繪畫模型。

2021-Jun: CodeX,代碼生成,AI具有理論上的自我繁殖能力。

2021-Oct:Disco-Diffusion, AI繪畫大模型.

2022-Mar: OpenAI發(fā)布InstructGPT,引入人類反饋學(xué)習(xí)。

2022-May: GPT-3.5。

2022-Jul:AlphaFold破解了幾乎所有的蛋白質(zhì)三維結(jié)構(gòu)。ImagenVideo,AI視頻生成。

2022-Nov: ChatGPT大模型走進(jìn)公眾視野。

2023-Feb:OpenAI的CEO Altman發(fā)布文章,宣布OpenAI的使命是確保其造福全人類。

2023-Mar-1: ChatGPT的API開放,模型即服務(wù)的時(shí)代到來。

2023-Mar-15: GPT-4發(fā)布,突破語言空間。

2023-Mar-17: OFFICE COPILOT發(fā)布。

2023-Mar-24: GPT插件功能發(fā)布,開始與物理世界交互。

總之,ChatGPT是一個(gè)語言模型,它唯一的能力就是“把話說對(duì)”。語言模型之所以具有這么強(qiáng)大的能力,是因?yàn)檎Z言本身是非常偉大的,它的成就很大程度歸功于過去幾千年我們?nèi)祟惖淖嫦葎?chuàng)造的語言,以及在語言當(dāng)中沉淀的大量的知識(shí)和語言的使用方式。它的“續(xù)寫”能力有以下特征:可以回答問題;需要考慮任意距離詞匯間的關(guān)系;是概率化的;不需要真正理解。

此外,王博老師還從以下角度介紹ChatGPT因何而強(qiáng)大:

  • 詞匯與關(guān)系:“大道至簡的基本原理”。包括LLM、RNN、LSTM、Transformer、Bert、GPT等模型。
  • 巨大的參數(shù)規(guī)模:“AI暴力美學(xué)”,GPT-3有1750億參數(shù),單次訓(xùn)練費(fèi)用1200萬美元。
  • 海量的文本數(shù)據(jù):人類文明的投影。2020年的模型用了3000億個(gè)token,大約80%來源于互聯(lián)網(wǎng)。我們有理由相信GPT-4基本上已經(jīng)接近窮盡人類所有的高質(zhì)量語料了。
  • 神秘的提示學(xué)習(xí):“真正的學(xué)習(xí)是喚醒一個(gè)人的內(nèi)在天賦”。2017年transformer提出來以后,人工智能從原來的專用模型變成了“大規(guī)模預(yù)訓(xùn)練 微調(diào)”。先讓模型學(xué)習(xí)一些通用的知識(shí),在之后具體領(lǐng)域上微調(diào)即可。比如說讓ChatGPT去完成一個(gè)法律任務(wù),不需要再拿一些法律數(shù)據(jù)讓它訓(xùn)練,只需要給它提示即可,如“接下來你要從法律的角度回答這些問題?!碧崾镜倪^程中模型是沒有重新學(xué)習(xí)訓(xùn)練的。提示學(xué)習(xí)一個(gè)典型的例子就是“思維鏈”,提示ChatGPT任務(wù)的解決步驟。
  • 強(qiáng)化學(xué)習(xí):“你無法通過背誦技巧學(xué)會(huì)和愛人聊天”。強(qiáng)化學(xué)習(xí)是一種無監(jiān)督學(xué)習(xí),是通過“間接反饋”的方式來學(xué)習(xí)。比如說下圍棋的模型就會(huì)通過這種無監(jiān)督學(xué)習(xí)來完成,因?yàn)閲迦绾蜗率菦]有正確答案的,通過間接反饋機(jī)制就能獲得良好的學(xué)習(xí)能力。聊天也是特別適合用無監(jiān)督強(qiáng)化學(xué)習(xí)來完成。
  • 基于代碼的學(xué)習(xí):“沒有人比我更懂邏輯”。ChatGPT除了學(xué)習(xí)自然語言,還學(xué)習(xí)了代碼。代碼其實(shí)也算是一種語言,但它的邏輯更加清晰。ChatGPT在代碼數(shù)據(jù)上進(jìn)行訓(xùn)練,但增強(qiáng)了處理自然語言的邏輯能力。要注意,在這里代碼與語言是兩回事,就相當(dāng)于用代碼訓(xùn)練模型,但是提升了模型處理自然語言的能力。所以說,不同的語言之間是有影響的。
  • 涌現(xiàn):“More is different,復(fù)雜系統(tǒng)的未解之謎”。當(dāng)個(gè)體的數(shù)量多到一定程度的時(shí)候,它就會(huì)發(fā)生變化。到目前為止,“涌現(xiàn)”在復(fù)雜系統(tǒng)當(dāng)中是難以解釋的,在人工智能系統(tǒng)中當(dāng)然就更難以解釋。根據(jù)目前的經(jīng)驗(yàn),大語言模型大概在200億左右參數(shù)的時(shí)候,會(huì)出現(xiàn)涌現(xiàn)。
  • 倫理優(yōu)化與高速的飛輪:對(duì)ChatGPT進(jìn)行倫理約束。

總結(jié):ChatGPT強(qiáng)大在哪里?第一,大規(guī)模的模型和數(shù)據(jù),使得它能夠獲取海量的知識(shí)。第二,強(qiáng)化學(xué)習(xí)的過程,也就是與人類交互的強(qiáng)化學(xué)習(xí)過程,使得它的表現(xiàn)更加類人,并且能夠遵循人類的倫理標(biāo)準(zhǔn)。第三,涌現(xiàn)現(xiàn)象使得它的性能具有多方面的性能爆發(fā)。第四,提示學(xué)習(xí)的方式,使得他能夠靈活適應(yīng)不同的任務(wù)。第五,代碼的學(xué)習(xí)使得他具有更好的邏輯理解與運(yùn)用能力。

3 ChatGPT面臨的挑戰(zhàn)

(一)ChatGPT的技術(shù)挑戰(zhàn)

第一,它是不穩(wěn)定和不可解釋的。但這個(gè)缺陷不是ChatGPT所獨(dú)有的,而是整個(gè)深度學(xué)習(xí)模型所具有的,“涌現(xiàn)效應(yīng)”導(dǎo)致這一問題更加嚴(yán)重。特別在一些敏感的領(lǐng)域,這一問題更加凸顯。例如在自動(dòng)駕駛領(lǐng)域,機(jī)器的事故率已經(jīng)低于人類司機(jī),但為何大家還不愿意完全相信自動(dòng)駕駛呢?因?yàn)樽詣?dòng)駕駛雖然事故率低,但是它的事故是不可解釋的。

第二,知識(shí)更新。讓ChatGPT臨時(shí)接受新的知識(shí)比較困難。很多知識(shí)在不同的領(lǐng)域是不一樣的。我們經(jīng)常會(huì)遇到在特定的場景需要特定的知識(shí)的情況,而對(duì)于ChatGPT而言,它很難做到。

第三,事實(shí)性錯(cuò)誤。事實(shí)性錯(cuò)誤是指信息不符合客觀事實(shí),而ChatGPT是無法直接了解客觀事實(shí)的,他只能了解語言。

第四,輸出的同質(zhì)性。ChatGPT所做出的回答往往是人類的主流觀點(diǎn)。因?yàn)樗且粋€(gè)概率模型,它會(huì)以大概率的答案去回答它的任務(wù)。例如,它為什么回答中國的首都是北京,因?yàn)樗鼘W(xué)的語料當(dāng)中大部分人都是這么說的。它的這種特點(diǎn)實(shí)際上有可能加劇信息繭房現(xiàn)象。

此外,還有復(fù)雜目標(biāo)導(dǎo)向、模型效率和模型優(yōu)化等問題,不再贅述。

(二)ChatGPT的科學(xué)問題

第一,語言不再是人類的專屬。ChatGPT可以生成語言。那么這個(gè)意味著什么呢?基本上可以預(yù)見,在未來的幾年當(dāng)中,互聯(lián)網(wǎng)上大部分的信息將不再是人類撰寫的。事實(shí)上,現(xiàn)在Twitter中30%以上的活躍用戶都是機(jī)器人,在微博中也有大量的水軍機(jī)器人。

第二,ChatGPT是否能夠創(chuàng)造新的知識(shí),還是只將訓(xùn)練語料中的知識(shí)換一種更精煉和高質(zhì)量的方式進(jìn)行表達(dá)?如果是后者的話,那么人類對(duì)于ChatGPT的使用會(huì)造成知識(shí)的收斂,降低人類知識(shí)的創(chuàng)造效率。如果ChatGPT本身是能夠創(chuàng)造新知識(shí)的,那它則會(huì)大大加速人類獲得新知識(shí)的效率。

此外,還討論了語言模型涌現(xiàn)與控制機(jī)制、語言的知識(shí)表達(dá)邊界問題、自我意識(shí)與自由意志問題、人機(jī)共生問題、如何突破語言空間問題,不再贅述。

(三)ChatGPT的倫理問題

第一,用戶隱私的問題。我們輸入的問題,技術(shù)上是可以被ChatGPT的所有者所獲取。

第二,反向影響的問題。ChatGPT會(huì)通過它所輸出的內(nèi)容,反過來影響人類的文化,就是我們所說的人性異化,人性向機(jī)器靠攏、機(jī)器向人性靠攏。

第三,不當(dāng)使用。比如說學(xué)生用ChatGPT去作弊。

第四,人機(jī)共生與加速極化。大模型和人類有一個(gè)典型的共生循環(huán),什么意思呢?模型是依賴于人類產(chǎn)生的數(shù)據(jù)來訓(xùn)練的,ChatGPT用人類說的話做訓(xùn)練之后,他再給人類答案,并影響人類的認(rèn)知。人類認(rèn)知被影響之后,又會(huì)說新的話。“你有權(quán)保持沉默,但你說的每一句話都會(huì)成為訓(xùn)練語料”,新的話又變成ChatGPT新的訓(xùn)練語料。如此反復(fù),就形成一個(gè)共生循環(huán)。并進(jìn)一步導(dǎo)致人工智能模型越來越像人,而人越來越像人工智能模型,會(huì)向一個(gè)人機(jī)共生的一種文化去逼近。

第五,生產(chǎn)力壟斷與社會(huì)和國際關(guān)系重建。這一點(diǎn)恰好與區(qū)塊鏈形成對(duì)比。區(qū)塊鏈?zhǔn)欠植际剑軌蛉ブ行幕?,打破壟斷。而ChatGPT這種大模型需要大規(guī)模的數(shù)據(jù)和算力,只有極少數(shù)的人或者機(jī)構(gòu)能夠提供這樣的服務(wù)。其實(shí)ChatGPT很大程度上是來自于涌現(xiàn),沒有太多的新的技術(shù)。很多大的互聯(lián)網(wǎng)公司都想形成ChatGPT等技術(shù)的壟斷,從而獲得權(quán)力,并影響社會(huì)、國際關(guān)系?;仡櫥ヂ?lián)網(wǎng)發(fā)展歷史,互聯(lián)網(wǎng)發(fā)明者Tim Berners-Lee做的最偉大的一件事就是放棄了互聯(lián)網(wǎng)專利。

第六,人工智能的社會(huì)角色與倫理地位。隨著ChatGPT越來越具有類人的特征,用戶不可避免的有將其人格化的沖動(dòng)。那么他是否會(huì)具有類人的地位?這個(gè)可能是需要考慮的問題。

講座最后,王博老師對(duì)中國是否會(huì)擁有自己的ChatGPT問題發(fā)表了自己的看法。王博老師認(rèn)為,中國復(fù)制ChatGPT基本沒有不可逾越的技術(shù)門檻,中文數(shù)據(jù)有一定劣勢(shì),但中國數(shù)據(jù)有一定優(yōu)勢(shì),實(shí)際上比復(fù)制ChatGPT更重要的是,中國具有創(chuàng)造和ChatGPT一樣的成就的能力。更重要的是,我們能否作為人類的一份子,為人類發(fā)展做出貢獻(xiàn)。

學(xué)生提問環(huán)節(jié)中,針對(duì)學(xué)生提出的交互修正問題,智能識(shí)別問題,法律領(lǐng)域的類案檢索,價(jià)值立場問題,技術(shù)與倫理之間的關(guān)系,智慧司法和數(shù)字檢察領(lǐng)域的相關(guān)問題進(jìn)行了細(xì)致的技術(shù)層面的解答。


未來智能實(shí)驗(yàn)室的主要工作包括:建立AI智能系統(tǒng)智商評(píng)測體系,開展世界人工智能智商評(píng)測;開展互聯(lián)網(wǎng)(城市)大腦研究計(jì)劃,構(gòu)建互聯(lián)網(wǎng)(城市)大腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。每日推薦范圍未來科技發(fā)展趨勢(shì)的學(xué)習(xí)型文章。目前線上平臺(tái)已收藏上千篇精華前沿科技文章和報(bào)告。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
通用人工智能,通向何方?
ChatGPT后下一個(gè)熱點(diǎn):能為你「做」一切的 AI ,才是真助手
AI+行業(yè)及相關(guān)公司深度梳理 五AI 辦公及相關(guān)公司1、微軟發(fā)布 GPT
ChatGPT和GPT-4挑戰(zhàn)視覺智能測試:AI辨識(shí)能力面臨考驗(yàn)
周鴻祎談ChatGPT:實(shí)用主義是國內(nèi)創(chuàng)新最大的障礙
火爆全網(wǎng)的ChatGPT,早被資本盯上了,國內(nèi)有人剛?cè)诹?0億
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服