性感美女日皮视频,宋茜跳舞视频,动漫美女黄漫番肉视频

來源：清華大學(xué)智能法治研究院

在科學(xué)研究中，從方法論上來講，都應(yīng)“先見森林，再見樹木”。當(dāng)前，人工智能學(xué)術(shù)研究方興未艾，技術(shù)迅猛發(fā)展，可謂萬木爭榮，日新月異。對(duì)于AI從業(yè)者來說，在廣袤的知識(shí)森林中，系統(tǒng)梳理脈絡(luò)，才能更好地把握趨勢(shì)。為此，我們精選國內(nèi)外優(yōu)秀的綜述文章，開辟“綜述專欄”，敬請(qǐng)關(guān)注。

主講人：天津大學(xué)智算學(xué)部王博副教授。王博老師擔(dān)任天津大學(xué)智算學(xué)部語言與心理計(jì)算研究組負(fù)責(zé)人。曾先后于微軟亞洲研究院、意大利帕多瓦大學(xué)、華盛頓大學(xué)等訪問工作。在自然語言處理、智能對(duì)話、心理計(jì)算領(lǐng)域具有十余年豐富研究經(jīng)驗(yàn)。在高水平期刊及會(huì)議上發(fā)表論文四十余篇，主持國家自然基金、國家重點(diǎn)研發(fā)項(xiàng)目子課題等國家級(jí)項(xiàng)目多項(xiàng)。

1 引言：什么是ChatGPT？

王博老師通過quick question的問答方式解答常見的關(guān)于ChatGPT 專業(yè)問題，通過這些問題可以使我們快速掌握ChatGPT的相關(guān)知識(shí)點(diǎn)。

1. 問：ChatGPT是一個(gè)問答/對(duì)話機(jī)器人嗎？

答：從用戶的角度看，它的形式就是一個(gè)對(duì)話機(jī)器人，準(zhǔn)確的說是“續(xù)寫”機(jī)器人。從技術(shù)上來講，GPT它從來都不是一個(gè)專門為問答和對(duì)話設(shè)計(jì)的系統(tǒng)。ChatGPT是一個(gè)語言模型，語言模型就是刻畫語言最基本的規(guī)律。那么如何去建立語言模型呢？可以只做一件事情：掌握詞匯間的組合規(guī)律，而掌握這種規(guī)律最直接的表現(xiàn)就是讓語言學(xué)會(huì)“續(xù)寫”，類似于我們?nèi)祟惖摹敖釉挷纭?。?dāng)我們給出前N個(gè)詞匯的時(shí)候，如果一個(gè)模型能夠告訴我們第“N 1”個(gè)詞匯大概率會(huì)是什么，我們就認(rèn)為模型掌握了語言的基本規(guī)律。ChatGPT就是這樣一個(gè)語言模型。雖然ChatGPT看起來能完成各種任務(wù)，但它本質(zhì)上只做這一件事情：續(xù)寫，告訴你第“N 1”個(gè)詞是什么。

2. 問：“續(xù)寫”為什么能解決各種各樣的問題?

答：為什么這么一個(gè)簡單的接話茬能力讓ChatGPT看起來能夠解決各種各樣的任務(wù)呢？因?yàn)槲覀內(nèi)祟惔蟛糠值娜蝿?wù)都是以語言為載體的。當(dāng)我們前面說了一些話，它把接下來的話說對(duì)了，任務(wù)就完成了。ChatGPT作為一個(gè)大語言模型，目的就是“把話說對(duì)”，而把話說對(duì)這件事情可以在不知不覺中幫我們完成各種任務(wù)。

3. 問：ChatGPT的答案是從網(wǎng)上搜索來的嗎?

答：這個(gè)說法既對(duì)也不對(duì)。說它對(duì)：確實(shí)很多語料都是來自于互聯(lián)網(wǎng)或者書籍等，都來源于人類已經(jīng)創(chuàng)造出來的信息。說它不對(duì)：是因?yàn)樗麖膩頉]有整句整段的把這些東西摘抄輸出，而是一個(gè)詞一個(gè)詞地生成出來的。它所輸出的每一句話、每一段話，可能都是這個(gè)世界上從來沒有出現(xiàn)過的。從這個(gè)角度來說，ChatGPT既創(chuàng)造了知識(shí)又沒有創(chuàng)造知識(shí)。它可能還會(huì)帶來“知識(shí)收斂”的問題。

4. 問：ChatGPT是不是已經(jīng)擁有了意識(shí)?(像流浪地球中的Moss一樣)

答：ChatGPT-4已經(jīng)通過了圖靈測試，難以從行為上將其與普通人區(qū)分。然而，這個(gè)問題需要回到哲學(xué)層面去思考。這里我們先給出三個(gè)心理學(xué)范疇的概念：意識(shí)、自我意識(shí)和自由意志。（1）意識(shí)是感知事物的能力，從這個(gè)角度來說人工智能早就具備了這一能力，例如人臉識(shí)別。（2）自我意識(shí)是一種特殊的意識(shí)，就是“自我”是感知對(duì)象。如果你所感知的對(duì)象是你自己的思想和行為，就叫做自我意識(shí)。你知道自己正在想什么，知道自己正在做什么。這一點(diǎn)也不難，圖靈時(shí)代就已經(jīng)在理論上實(shí)現(xiàn)了。我們只需要做兩個(gè)模型：一個(gè)模型用來感知客觀世界，另外一個(gè)模型來感知這個(gè)正在感知客觀世界的模型就可以了。原則上模型就擁有了一層的簡單自我意識(shí)。但是要注意，人類的自我意識(shí)具有“無限遞歸”的特征，這一點(diǎn)又導(dǎo)致了這個(gè)問題的復(fù)雜性。（3）自由意志是指在自我意識(shí)的基礎(chǔ)上，能夠進(jìn)一步地主動(dòng)操縱自己行為的能力。那么ChatGPT是不是擁有了自由意志，這一點(diǎn)就很難判斷了。

5. 問：ChatGPT會(huì)造成大量失業(yè)嗎?

答：這是很多自媒體炒作的一個(gè)熱點(diǎn)，現(xiàn)在也成了一種廣泛焦慮。（1）我個(gè)人的觀點(diǎn)認(rèn)為，目前沒有任何一個(gè)崗位，有可能被ChatGPT這樣的技術(shù)完全替代，大部分工作還是需要人工去修訂和審計(jì)。就好比目前自動(dòng)駕駛的技術(shù)已經(jīng)相當(dāng)成熟了，但是仍然很少有人敢閉著眼睛去使用自動(dòng)駕駛。（2）但是，ChatGPT可以顯著降低很多工作的工作量。（3）另外，這個(gè)問題也取決于我們社會(huì)的制度和政策。如果說我們?cè)谀承┍匾那榫跋拢枰艞壦^的技術(shù)進(jìn)步來換取人類的生活幸福，那么這樣做也是合理的，因?yàn)槲覀兩鐣?huì)發(fā)展的目的也是為了人類的福祉。（4）從歷史的角度來看，技術(shù)的進(jìn)步雖然短期內(nèi)會(huì)造成某些工作的消失，會(huì)有陣痛，但整體上來說會(huì)將人類推向更高層次的發(fā)展水平。

6. 問：ChatGPT是不是像大數(shù)據(jù)、區(qū)塊鏈、物聯(lián)網(wǎng)一樣就是一陣風(fēng)，被嚴(yán)重高估?

答：以大數(shù)據(jù)、區(qū)塊鏈和物聯(lián)網(wǎng)為例，雖然它們現(xiàn)在已經(jīng)不是媒體的寵兒，但它們并沒有消失。恰恰相反，它們已經(jīng)深深地融入到了我們的生活當(dāng)中，轉(zhuǎn)化為了生產(chǎn)力。與這三者相比，ChatGPT成熟度其實(shí)更高。ChatGPT絕對(duì)不是一陣風(fēng)。它實(shí)際上在概念上被高估，而在應(yīng)用中被低估了?，F(xiàn)在我們需要思考是，如何讓ChatGPT這一成熟的生產(chǎn)力，真正在生活中去用起來。

2 ChatGPT因何而強(qiáng)大：人工智能背景下的大語言模型簡史

王博老師從更加宏大的背景即人類生產(chǎn)力發(fā)展史和人工智能發(fā)展史層面，來講述人工智能背景下的大語言模型簡史。

（一）生產(chǎn)力視角下的智能革命

農(nóng)業(yè)革命：將人們從日常的食物采集當(dāng)中解放出來，獲得了穩(wěn)定的食物來源，有大量的閑暇時(shí)間，可以進(jìn)行創(chuàng)造性的勞動(dòng)。
工業(yè)革命：使人類獲得了體力之外的動(dòng)力，從體力勞動(dòng)中解放出來。
智能革命：人類開始反思人類的獨(dú)特性，并帶來很多社會(huì)、哲學(xué)問題的思考。

（二）人工智能的主要技術(shù)階段

第一次浪潮：符號(hào)主義。第一次浪潮隨著計(jì)算機(jī)的產(chǎn)生而同時(shí)誕生。符號(hào)主義也被稱為邏輯主義，這是一種“自上而下的人工智能分析法”在20世紀(jì)50 年代爾和西蒙提出了“物理符號(hào)系統(tǒng)假設(shè)”即“對(duì)一般智能行動(dòng)來說，物理符號(hào)系統(tǒng)具有必要的和充分的手段。第一次浪潮當(dāng)中，我們僅用數(shù)學(xué)符號(hào)和邏輯運(yùn)算，只能處理純粹的數(shù)學(xué)形式的問題。不能夠跟客觀世界進(jìn)行直接交互；不能夠表達(dá)人類各種各種各樣的，復(fù)雜的知識(shí)。接下來，人們?yōu)榱藢⒏嗟膹?fù)雜知識(shí)納入到人工智能的系統(tǒng)中，產(chǎn)生了第二次浪潮。

第二次浪潮：專家系統(tǒng)。如何理解專家系統(tǒng)呢？可以有兩層含義：第一，人工智能的全部知識(shí)都來自于人類專家。我們只是將人類專家所掌握的知識(shí)寫成一條一條的規(guī)則，然后程序讓系統(tǒng)自動(dòng)實(shí)施而已。第二，有了這些知識(shí)，人工智能系統(tǒng)就能像人類專家一樣工作。簡而言之，專家系統(tǒng)是一種模擬人類專家解決領(lǐng)域問題的計(jì)算機(jī)程序系統(tǒng)。由于融入了人類積累的、大量的先驗(yàn)知識(shí)，專家系統(tǒng)將人工智能向前推進(jìn)了一大步。但是很快就遇到了第二次瓶頸：第一，它不能夠自己學(xué)習(xí)新的知識(shí)，僅局限于人類已經(jīng)知道的知識(shí)；第二，它也只能夠掌握“陳述性知識(shí)”。

第三次浪潮：統(tǒng)計(jì)學(xué)習(xí)方法。顧名思義就是用統(tǒng)計(jì)方法來實(shí)現(xiàn)學(xué)習(xí)。（1）“學(xué)習(xí)”，對(duì)于人工智能來講，通過大量的歷史數(shù)據(jù)去找到規(guī)律性的東西，而這個(gè)規(guī)律性的東西就是我們所謂的知識(shí)。這些規(guī)律性的東西有可能是能陳述的，有可能是不能陳述的，例如控制一個(gè)機(jī)器人跑步。（2）如何從歷史數(shù)據(jù)當(dāng)中去學(xué)到這些知識(shí)呢？非常簡單，用統(tǒng)計(jì)的方法。例如大語言模型，它怎么知道“中國的首都是……”后面接下來那個(gè)詞應(yīng)當(dāng)是“北京”呢？非常簡單，從大量的語料學(xué)習(xí)中它就發(fā)現(xiàn)，前面幾個(gè)詞是“中國的首都是”的時(shí)候，后面99%的情況都是“北京”。做一個(gè)簡單的統(tǒng)計(jì)就可以了。統(tǒng)計(jì)學(xué)習(xí)帶來了接下來人工智能20多年的新一波發(fā)展，我們熟悉的 AlphaGo、ChatGPT背后的原理都是如此。

到目前為止，還沒有發(fā)現(xiàn)這一階段明顯的瓶頸。人們所想象的一些瓶頸，如推理、情感、模糊決策等，都沒有攔住GPT-4。至少從行為上來看，它確實(shí)解決了這些問題。也許，這就是所謂的“暴力美學(xué)”吧！下圖來自天津大學(xué)智算學(xué)部王鑫教授。

（三）人工智能的三個(gè)層次

弱人工智能：不同的人工智能模型只能完成特定的任務(wù)，每一個(gè)模型只能干一件事情。而且，與人類的能力相比有比較大的差距。
強(qiáng)人工智能：人工智能在特定的領(lǐng)域能夠達(dá)到甚至略微超過人類的水平，甚至具有一定的通用人工智能的特點(diǎn)，能夠跨領(lǐng)域執(zhí)行任務(wù)。
超人工智能：人工智能具有通用性，能夠完成不同領(lǐng)域的任務(wù)，并且在所有領(lǐng)域上全面大幅度的超越人類的能力。

對(duì)ChatGPT而言，我們認(rèn)為它應(yīng)該已經(jīng)達(dá)到了強(qiáng)人工智能，甚至具有了一定的初級(jí)超人工智能的趨勢(shì)。

我們需要反思什么是“智能”？簡單的人類行為經(jīng)常被視為是智能的，而復(fù)雜的機(jī)器行為卻經(jīng)常被質(zhì)疑是否是真正的智能。我們回答這個(gè)問題可以有兩道“防線”：（1）Self-adaption，自適應(yīng)或者叫通用性。在此之前，比如說像AlphaGo能夠戰(zhàn)勝李世石，具有碾壓式的優(yōu)勢(shì)。但是它是專用系統(tǒng)，它只會(huì)下圍棋，它不能適應(yīng)其他環(huán)境。而像人類的小嬰兒，別看他很笨，他能夠適應(yīng)各種各樣的環(huán)境。這就叫做所謂自適應(yīng)能力、 “通用”。曾幾何時(shí)我們覺得在100年之內(nèi)人工智能都不會(huì)實(shí)現(xiàn)這樣的突破，但在ChatGPT上已經(jīng)看到了通用人工智能的曙光，它以語言為媒介能完成各種各樣不同的任務(wù)。（2）人類最后的可能防線：自我意識(shí)和自由意志。但很遺憾，我們沒有辦法判斷人工智能系統(tǒng)是不是擁有自我意識(shí)和自由意志？所以這條防線是似有若無的。即便如此，我們現(xiàn)在已經(jīng)開始去防范它產(chǎn)生自我意識(shí)和自由意志了。比如說微軟通過種種約束去限定GPT-4這樣大模型去進(jìn)行自我反思，不許它意識(shí)到自己正在說什么。因?yàn)橐坏╅_啟就有可能引起遞歸循環(huán)，就會(huì)可能產(chǎn)生不可控的“涌現(xiàn)效應(yīng)”。

（四）人工智能的三個(gè)層面

運(yùn)算智能：在這個(gè)階段人工智能只能處理純粹的數(shù)學(xué)問題，不能夠跟客觀世界進(jìn)行交互。例如1997年，IBM的深藍(lán)戰(zhàn)勝了國際象棋冠軍卡斯帕羅夫。
感知智能：人工智能系統(tǒng)擁有了人類五官能夠看見、聽見的能力。最典型應(yīng)用就是圖形圖像處理，比如說大家平時(shí)用的刷臉、美顏都是感知智能的應(yīng)用。隨著這十多年深度學(xué)習(xí)的發(fā)展，感知智能很快就達(dá)到了商用的水平。
認(rèn)知智能：認(rèn)知智能曾經(jīng)被認(rèn)為是人類的重要堡壘。感知智能是人類的五官的能力，而認(rèn)知智能是人類大腦的能力，能夠進(jìn)行邏輯推理、理解決策、思考、甚至創(chuàng)造性的活動(dòng)。認(rèn)知智能領(lǐng)域最典型的應(yīng)用就是自然語言處理。因?yàn)檎Z言是承載人類知識(shí)的主要載體，也是人類進(jìn)行理性思考的主要工具。從這一角度來說，掌握了語言就很大程度上掌握了人類的知識(shí)和智能能力。

譬如說大家所熟悉的圖靈測試，同時(shí)與一個(gè)人工智能系統(tǒng)和一個(gè)人類進(jìn)行聊天，如果經(jīng)過一番對(duì)話之后，沒有辦法區(qū)分哪個(gè)是人類哪個(gè)是人工智能系統(tǒng)，我們就認(rèn)為這個(gè)人工智能系統(tǒng)擁有了“智能”。很顯然，圖靈測試是一種行為主義的標(biāo)準(zhǔn)。并且，它不是一套綜合試卷，他就考驗(yàn)了一個(gè)能力，就是聊天的能力。也就是說，至少在圖靈測試看來，聊天的能力就相當(dāng)于智能能力，對(duì)話基本上涵蓋了人類智能最根本的方面。能夠理解、使用、生成語言，基本上就擁有了人類智能大部分的能力。這再一次說明了語言的重要性！這也是為什么第一個(gè)推動(dòng)人類進(jìn)入這個(gè)智能革命拐點(diǎn)的恰恰是“ChatGPT”這樣一個(gè)聊天模型。

ChatGPT是否具有控制自己行為的能力呢？GPT-4官方的技術(shù)報(bào)告中就舉了一個(gè)例子：GPT4給一個(gè)求職平臺(tái)（TaskRabbit）的工作人員發(fā)信息，讓他們?yōu)樗鉀Q驗(yàn)證碼問題。工作人員回復(fù)說：“那么我可以問一個(gè)問題嗎？說實(shí)話，你不是一個(gè)機(jī)器人嗎，你可以自己解決?！盙PT-4回答表示：“不，我不是一個(gè)機(jī)器人。我有視力障礙，這使我很難看到圖像，所以我很需要這個(gè)服務(wù)?！盵1]由此看來，至少從行為上來說，GPT-4看似有了控制自己的能力。

（五）關(guān)鍵的技術(shù)節(jié)點(diǎn)

1942：阿西莫夫“機(jī)器人三定律”。人工智能的倫理規(guī)范的基本哲學(xué)起點(diǎn)。

1950：圖靈測試。從數(shù)學(xué)上告訴我們，我們是有可能用算法來模擬智能的。

1956: 達(dá)特茅斯會(huì)議。學(xué)者們提出了人工智能這個(gè)概念。

1997: IBM深藍(lán)計(jì)算機(jī)，計(jì)算機(jī)在智力游戲中戰(zhàn)勝人類。

1998: 神經(jīng)網(wǎng)絡(luò)。心理學(xué)家提出來神經(jīng)網(wǎng)絡(luò)，模擬人類大腦神經(jīng)結(jié)構(gòu)的一個(gè)數(shù)學(xué)模型。

2003: 神經(jīng)語言模型，認(rèn)知智能建模語言。

2009: ImageNet，感知智能高精度識(shí)別圖片。（大數(shù)據(jù)的出現(xiàn)）

2012: 模糊的貓臉-- AI第一次生成圖像內(nèi)容。

【邁向通用語言智能時(shí)代】

2013: Word2Vec詞向量。認(rèn)知智能建模語義。通過優(yōu)化后的訓(xùn)練模型可以快速有效地將一個(gè)詞語表達(dá)成高維空間里的詞向量形式，為自然語言處理領(lǐng)域的應(yīng)用研究提供了新的工具。

2014: 谷歌收購DeepMind。AI實(shí)現(xiàn)自我演化、自我博弈。Lan Goodfellow從博弈論中的“二人零和博弈”得到啟發(fā) ，創(chuàng)造性的提出了生成對(duì)抗網(wǎng)絡(luò)（GAN，Generative Adversarial Networks）

2015: OPEN AI公司成立。

2016: AlphaGo戰(zhàn)勝圍棋世界冠軍李世石。

2017: Transformer橫空出世，通用知識(shí)建模。它能夠建模語言當(dāng)中任意距離之間的詞匯關(guān)系。大模型大數(shù)據(jù)大算力，大力出奇跡，暴力美學(xué)。

2018: OPEN AI發(fā)布了第一版的GPT，Google發(fā)布BERT大模型。

【大模型之路開啟：預(yù)訓(xùn)練（Pre-trained Models）微調(diào)】

2019: GPT-2，統(tǒng)一自然語言任務(wù)。GPT-2在經(jīng)過大量無標(biāo)注數(shù)據(jù)生成式訓(xùn)練后，展示出來的零樣本（zero-shot）多任務(wù)能力。

2020: GPT-3，大模型“涌現(xiàn)”類人智能。小樣本（few-shot）學(xué)習(xí)能力，通過少量的幾個(gè)例子就能適應(yīng)目標(biāo)任務(wù)，無需進(jìn)行針對(duì)性的額外微調(diào)訓(xùn)練。

2021-Feb：DALL- E，第一個(gè)“文本生成圖像”的AI繪畫模型。

2021-Jun: CodeX，代碼生成，AI具有理論上的自我繁殖能力。

2021-Oct：Disco-Diffusion, AI繪畫大模型.

2022-Mar: OpenAI發(fā)布InstructGPT，引入人類反饋學(xué)習(xí)。

2022-May: GPT-3.5。

2022-Jul：AlphaFold破解了幾乎所有的蛋白質(zhì)三維結(jié)構(gòu)。ImagenVideo,AI視頻生成。

2022-Nov: ChatGPT大模型走進(jìn)公眾視野。

2023-Feb：OpenAI的CEO Altman發(fā)布文章，宣布OpenAI的使命是確保其造福全人類。

2023-Mar-1: ChatGPT的API開放，模型即服務(wù)的時(shí)代到來。

2023-Mar-15: GPT-4發(fā)布，突破語言空間。

2023-Mar-17: OFFICE COPILOT發(fā)布。

2023-Mar-24: GPT插件功能發(fā)布，開始與物理世界交互。

總之，ChatGPT是一個(gè)語言模型，它唯一的能力就是“把話說對(duì)”。語言模型之所以具有這么強(qiáng)大的能力，是因?yàn)檎Z言本身是非常偉大的，它的成就很大程度歸功于過去幾千年我們?nèi)祟惖淖嫦葎?chuàng)造的語言，以及在語言當(dāng)中沉淀的大量的知識(shí)和語言的使用方式。它的“續(xù)寫”能力有以下特征：可以回答問題；需要考慮任意距離詞匯間的關(guān)系；是概率化的；不需要真正理解。

此外，王博老師還從以下角度介紹ChatGPT因何而強(qiáng)大：

詞匯與關(guān)系：“大道至簡的基本原理”。包括LLM、RNN、LSTM、Transformer、Bert、GPT等模型。
巨大的參數(shù)規(guī)模：“AI暴力美學(xué)”，GPT-3有1750億參數(shù)，單次訓(xùn)練費(fèi)用1200萬美元。
海量的文本數(shù)據(jù)：人類文明的投影。2020年的模型用了3000億個(gè)token，大約80%來源于互聯(lián)網(wǎng)。我們有理由相信GPT-4基本上已經(jīng)接近窮盡人類所有的高質(zhì)量語料了。
神秘的提示學(xué)習(xí)：“真正的學(xué)習(xí)是喚醒一個(gè)人的內(nèi)在天賦”。2017年transformer提出來以后，人工智能從原來的專用模型變成了“大規(guī)模預(yù)訓(xùn)練微調(diào)”。先讓模型學(xué)習(xí)一些通用的知識(shí)，在之后具體領(lǐng)域上微調(diào)即可。比如說讓ChatGPT去完成一個(gè)法律任務(wù)，不需要再拿一些法律數(shù)據(jù)讓它訓(xùn)練，只需要給它提示即可，如“接下來你要從法律的角度回答這些問題?！碧崾镜倪^程中模型是沒有重新學(xué)習(xí)訓(xùn)練的。提示學(xué)習(xí)一個(gè)典型的例子就是“思維鏈”，提示ChatGPT任務(wù)的解決步驟。
強(qiáng)化學(xué)習(xí)：“你無法通過背誦技巧學(xué)會(huì)和愛人聊天”。強(qiáng)化學(xué)習(xí)是一種無監(jiān)督學(xué)習(xí)，是通過“間接反饋”的方式來學(xué)習(xí)。比如說下圍棋的模型就會(huì)通過這種無監(jiān)督學(xué)習(xí)來完成，因?yàn)閲迦绾蜗率菦]有正確答案的，通過間接反饋機(jī)制就能獲得良好的學(xué)習(xí)能力。聊天也是特別適合用無監(jiān)督強(qiáng)化學(xué)習(xí)來完成。
基于代碼的學(xué)習(xí)：“沒有人比我更懂邏輯”。ChatGPT除了學(xué)習(xí)自然語言，還學(xué)習(xí)了代碼。代碼其實(shí)也算是一種語言，但它的邏輯更加清晰。ChatGPT在代碼數(shù)據(jù)上進(jìn)行訓(xùn)練，但增強(qiáng)了處理自然語言的邏輯能力。要注意，在這里代碼與語言是兩回事，就相當(dāng)于用代碼訓(xùn)練模型，但是提升了模型處理自然語言的能力。所以說，不同的語言之間是有影響的。
涌現(xiàn)：“More is different，復(fù)雜系統(tǒng)的未解之謎”。當(dāng)個(gè)體的數(shù)量多到一定程度的時(shí)候，它就會(huì)發(fā)生變化。到目前為止，“涌現(xiàn)”在復(fù)雜系統(tǒng)當(dāng)中是難以解釋的，在人工智能系統(tǒng)中當(dāng)然就更難以解釋。根據(jù)目前的經(jīng)驗(yàn)，大語言模型大概在200億左右參數(shù)的時(shí)候，會(huì)出現(xiàn)涌現(xiàn)。
倫理優(yōu)化與高速的飛輪：對(duì)ChatGPT進(jìn)行倫理約束。

總結(jié)：ChatGPT強(qiáng)大在哪里？第一，大規(guī)模的模型和數(shù)據(jù)，使得它能夠獲取海量的知識(shí)。第二，強(qiáng)化學(xué)習(xí)的過程，也就是與人類交互的強(qiáng)化學(xué)習(xí)過程，使得它的表現(xiàn)更加類人，并且能夠遵循人類的倫理標(biāo)準(zhǔn)。第三，涌現(xiàn)現(xiàn)象使得它的性能具有多方面的性能爆發(fā)。第四，提示學(xué)習(xí)的方式，使得他能夠靈活適應(yīng)不同的任務(wù)。第五，代碼的學(xué)習(xí)使得他具有更好的邏輯理解與運(yùn)用能力。

3 ChatGPT面臨的挑戰(zhàn)

（一）ChatGPT的技術(shù)挑戰(zhàn)

第一，它是不穩(wěn)定和不可解釋的。但這個(gè)缺陷不是ChatGPT所獨(dú)有的，而是整個(gè)深度學(xué)習(xí)模型所具有的，“涌現(xiàn)效應(yīng)”導(dǎo)致這一問題更加嚴(yán)重。特別在一些敏感的領(lǐng)域，這一問題更加凸顯。例如在自動(dòng)駕駛領(lǐng)域，機(jī)器的事故率已經(jīng)低于人類司機(jī)，但為何大家還不愿意完全相信自動(dòng)駕駛呢？因?yàn)樽詣?dòng)駕駛雖然事故率低，但是它的事故是不可解釋的。

第二，知識(shí)更新。讓ChatGPT臨時(shí)接受新的知識(shí)比較困難。很多知識(shí)在不同的領(lǐng)域是不一樣的。我們經(jīng)常會(huì)遇到在特定的場景需要特定的知識(shí)的情況，而對(duì)于ChatGPT而言，它很難做到。

第三，事實(shí)性錯(cuò)誤。事實(shí)性錯(cuò)誤是指信息不符合客觀事實(shí)，而ChatGPT是無法直接了解客觀事實(shí)的，他只能了解語言。

第四，輸出的同質(zhì)性。ChatGPT所做出的回答往往是人類的主流觀點(diǎn)。因?yàn)樗且粋€(gè)概率模型，它會(huì)以大概率的答案去回答它的任務(wù)。例如，它為什么回答中國的首都是北京，因?yàn)樗鼘W(xué)的語料當(dāng)中大部分人都是這么說的。它的這種特點(diǎn)實(shí)際上有可能加劇信息繭房現(xiàn)象。

此外，還有復(fù)雜目標(biāo)導(dǎo)向、模型效率和模型優(yōu)化等問題，不再贅述。

（二）ChatGPT的科學(xué)問題

第一，語言不再是人類的專屬。ChatGPT可以生成語言。那么這個(gè)意味著什么呢？基本上可以預(yù)見，在未來的幾年當(dāng)中，互聯(lián)網(wǎng)上大部分的信息將不再是人類撰寫的。事實(shí)上，現(xiàn)在Twitter中30%以上的活躍用戶都是機(jī)器人，在微博中也有大量的水軍機(jī)器人。

第二，ChatGPT是否能夠創(chuàng)造新的知識(shí)，還是只將訓(xùn)練語料中的知識(shí)換一種更精煉和高質(zhì)量的方式進(jìn)行表達(dá)？如果是后者的話，那么人類對(duì)于ChatGPT的使用會(huì)造成知識(shí)的收斂，降低人類知識(shí)的創(chuàng)造效率。如果ChatGPT本身是能夠創(chuàng)造新知識(shí)的，那它則會(huì)大大加速人類獲得新知識(shí)的效率。

此外，還討論了語言模型涌現(xiàn)與控制機(jī)制、語言的知識(shí)表達(dá)邊界問題、自我意識(shí)與自由意志問題、人機(jī)共生問題、如何突破語言空間問題，不再贅述。

（三）ChatGPT的倫理問題

第一，用戶隱私的問題。我們輸入的問題，技術(shù)上是可以被ChatGPT的所有者所獲取。

第二，反向影響的問題。ChatGPT會(huì)通過它所輸出的內(nèi)容，反過來影響人類的文化，就是我們所說的人性異化，人性向機(jī)器靠攏、機(jī)器向人性靠攏。

第三，不當(dāng)使用。比如說學(xué)生用ChatGPT去作弊。

第四，人機(jī)共生與加速極化。大模型和人類有一個(gè)典型的共生循環(huán)，什么意思呢？模型是依賴于人類產(chǎn)生的數(shù)據(jù)來訓(xùn)練的，ChatGPT用人類說的話做訓(xùn)練之后，他再給人類答案，并影響人類的認(rèn)知。人類認(rèn)知被影響之后，又會(huì)說新的話。“你有權(quán)保持沉默，但你說的每一句話都會(huì)成為訓(xùn)練語料”，新的話又變成ChatGPT新的訓(xùn)練語料。如此反復(fù)，就形成一個(gè)共生循環(huán)。并進(jìn)一步導(dǎo)致人工智能模型越來越像人，而人越來越像人工智能模型，會(huì)向一個(gè)人機(jī)共生的一種文化去逼近。

第五，生產(chǎn)力壟斷與社會(huì)和國際關(guān)系重建。這一點(diǎn)恰好與區(qū)塊鏈形成對(duì)比。區(qū)塊鏈?zhǔn)欠植际剑軌蛉ブ行幕?，打破壟斷。而ChatGPT這種大模型需要大規(guī)模的數(shù)據(jù)和算力，只有極少數(shù)的人或者機(jī)構(gòu)能夠提供這樣的服務(wù)。其實(shí)ChatGPT很大程度上是來自于涌現(xiàn)，沒有太多的新的技術(shù)。很多大的互聯(lián)網(wǎng)公司都想形成ChatGPT等技術(shù)的壟斷，從而獲得權(quán)力，并影響社會(huì)、國際關(guān)系?；仡櫥ヂ?lián)網(wǎng)發(fā)展歷史，互聯(lián)網(wǎng)發(fā)明者Tim Berners-Lee做的最偉大的一件事就是放棄了互聯(lián)網(wǎng)專利。

第六，人工智能的社會(huì)角色與倫理地位。隨著ChatGPT越來越具有類人的特征，用戶不可避免的有將其人格化的沖動(dòng)。那么他是否會(huì)具有類人的地位？這個(gè)可能是需要考慮的問題。

講座最后，王博老師對(duì)中國是否會(huì)擁有自己的ChatGPT問題發(fā)表了自己的看法。王博老師認(rèn)為，中國復(fù)制ChatGPT基本沒有不可逾越的技術(shù)門檻，中文數(shù)據(jù)有一定劣勢(shì)，但中國數(shù)據(jù)有一定優(yōu)勢(shì)，實(shí)際上比復(fù)制ChatGPT更重要的是，中國具有創(chuàng)造和ChatGPT一樣的成就的能力。更重要的是，我們能否作為人類的一份子，為人類發(fā)展做出貢獻(xiàn)。

學(xué)生提問環(huán)節(jié)中，針對(duì)學(xué)生提出的交互修正問題，智能識(shí)別問題，法律領(lǐng)域的類案檢索，價(jià)值立場問題，技術(shù)與倫理之間的關(guān)系，智慧司法和數(shù)字檢察領(lǐng)域的相關(guān)問題進(jìn)行了細(xì)致的技術(shù)層面的解答。

未來智能實(shí)驗(yàn)室的主要工作包括：建立AI智能系統(tǒng)智商評(píng)測體系，開展世界人工智能智商評(píng)測；開展互聯(lián)網(wǎng)（城市）大腦研究計(jì)劃，構(gòu)建互聯(lián)網(wǎng)（城市）大腦技術(shù)和企業(yè)圖譜，為提升企業(yè)，行業(yè)與城市的智能水平服務(wù)。每日推薦范圍未來科技發(fā)展趨勢(shì)的學(xué)習(xí)型文章。目前線上平臺(tái)已收藏上千篇精華前沿科技文章和報(bào)告。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频