中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
計算思想 | ChatGPT能否具備CS thinking 和 Critical-Reason-thinking
userphoto

2023.03.30 北京

關注

上周丁丁貓的同學有兩個任務思考

放在圖書館的電腦丟了,你能想到通過監(jiān)控視頻,但你是早晨9點離開,下午3:00回到圖書館的,怎么樣才能盡快找到你想要的監(jiān)控畫面?

第2個任務,老師批改卷子,總共有100個同學。在老師面前卷子按交卷的順序摞起來,現(xiàn)在想找小茗同學的卷子,如何盡快找到?

如果老師不清楚小明同學什么時候交的卷子,又該如何安排,方便老師查找任意同學的卷子。

ChatGPT回答 ... 正確的廢話 

看來迄今為止,并非無所不能!

AI使你的努力的收效成倍增加,充分理由取其所長,記憶和搜索記憶方面AI至少彎道超出人類。

你使用ChatGPT是錯誤的! 以下是如何領先于99%的ChatGPT用戶的方法

通過學習提示,掌握ChatGPT。

我們大多數(shù)人使用ChatGPT是錯誤的。

我們在提示中不包括例子。

我們忽略了我們可以用角色來控制ChatGPT的行為。

我們讓ChatGPT猜東西,而不是向它提供一些信息。

發(fā)生這種情況是因為我們大多使用標準的提示,這些提示可能會幫助我們完成一次工作,但不是一直如此。

我們需要學習如何創(chuàng)建高質量的提示,以獲得更好的結果。我們需要學習提示工程! 而且,在本指南中,我們將學習提示工程中使用的4種技術。

如果你不想閱讀,你可以觀看我下面的視頻。

少量的標準提示

少量的標準提示是我們以前見過的標準提示,但其中有任務的例子。

為什么是例子?好吧,如果你想增加獲得理想結果的機會,你必須添加提示所要解決的任務的例子。

少見的標準提示由任務描述、例子和提示組成。在這種情況下,提示是一個新例子的開始,模型應該通過生成缺少的文本來完成。

以下是幾個鏡頭的標準提示的組成部分。

現(xiàn)在讓我們來創(chuàng)建另一個提示。假設我們想從 '我想從奧蘭多飛往波士頓 '這個文本中提取機場代碼

這里是大多數(shù)人會使用的標準提示。

從這個文本中提取機場代碼:'我想從奧蘭多飛往波士頓'

這可能會完成工作,但有時可能是不夠的。在這種情況下,你必須使用少量的標準提示語。

從這個文本中提取機場代碼:

文本:'我想從洛杉磯飛往邁阿密'。

機場代碼:LAX, MIA

文本:'我想從納什維爾飛往堪薩斯城'。

機場代碼:BNA, MCI

文字:'我想從奧蘭多飛往波士頓'

機場代碼:

如果我們在ChatGPT上嘗試之前的提示,我們會得到我們在例子中指定的格式的機場代碼(MCO, BOS)

請記住,以前的研究發(fā)現(xiàn),例子中的實際答案并不重要,但標簽空間卻很重要。一個標簽空間就是一個給定任務的所有可能的標簽。你甚至可以通過提供標簽空間中的隨機標簽來改善你的提示結果。

讓我們通過在我們的例子中輸入隨機的機場代碼來測試一下。

從這個文本中提取機場代碼:

文本:'我想從洛杉磯飛往邁阿密。'

機場代碼:DEN, OAK

文本:'我想從納什維爾飛往堪薩斯城:'我想從納什維爾飛往堪薩斯城'。

機場代碼:DAL, IDA

文字:'我想從奧蘭多飛往波士頓 '我想從奧蘭多飛往波士頓'

機場代碼:

如果你在ChatGPT上試過之前的提示,你還是會得到正確的機場代碼MCO和BOS。

無論你的例子是否正確,包括標簽空間的隨機標簽。這將幫助你提高結果,并指導模型如何對提示的答案進行格式化。

角色提示

有時ChatGPT的默認行為并不足以得到你想要的東西。這時你需要為ChatGPT設置一個角色。

比如你想為求職面試做練習。通過告訴ChatGPT '作為招聘經(jīng)理',并在提示中加入更多細節(jié),你就可以模擬任何職位的面試。

我想讓你擔任面試官。我將是候選人,而你將問我數(shù)據(jù)科學職位的面試問題。

我希望你只以面試官的身份回答問題。問我問題并等待我的回答。

不要寫解釋。

像面試官那樣一個一個地問我問題,并等待我的回答。我的第一句話是 '你好

你好,感謝你申請數(shù)據(jù)科學職位。你能不能先告訴我

你的教育背景和相關工作經(jīng)驗?

我在大學學習了數(shù)據(jù)科學,我在一家銀行做了六個月的實習。

很好。你能描述一下你在銀行實習期間所做的一個項目嗎?你在這個項目中的角色是什么?

你在這個項目中的角色是什么,你用什么技術來解決問題的?

... ... 

正如你所看到的,ChatGPT的行為就像他在為一個工作職位面試我。

就這樣,你可以把ChatGPT變成一個語言導師來練習西班牙語等外語,或者變成一個影評人來分析任何你想要的電影。在這篇文章中,我更深入地探討如何將ChatGPT變成你的語言導師或語言伙伴。

你只需要用 '充當...... '開始你的提示,然后盡可能多地添加細節(jié)。如果你需要一些靈感,請查看這個資源庫,在那里你可以找到讓ChatGPT表現(xiàn)得像一個相聲演員、醫(yī)生等的提示。

為你的提示添加個性并產(chǎn)生知識

當涉及到為電子郵件、博客、故事、文章等生成文本時,這兩種提示方法很好。

首先,我所說的 '為我們的提示添加個性 '是指添加風格和描述詞。添加風格可以幫助我們的文本獲得特定的語氣、正式性、作者的領域等等。

以一個在[領域]有10年以上經(jīng)驗的專家的風格來寫[主題]。

為了進一步定制輸出,我們可以添加描述符。描述詞只是一個形容詞,你可以添加它來調整你的提示。

假設你想寫一篇關于人工智能如何取代人類的500篇博文。如果你用 '寫一篇關于人工智能如何取代人類的500篇文章 '來創(chuàng)建一個標準提示,你可能會得到一個非常普通的文章。

然而,如果你添加了諸如鼓舞人心的、諷刺的、耐人尋味的和娛樂性的形容詞,輸出結果將發(fā)生顯著變化。

讓我們在之前的提示中加入描述詞。

寫一篇詼諧的500字博文,說明為什么人工智能不會取代人類。以一個擁有10年以上經(jīng)驗的人工智能專家的風格來寫。使用有趣的例子進行解釋

在我們的例子中,人工智能專家的風格以及詼諧和有趣等形容詞為ChatGPT生成的文本增添了不同的色彩。這樣做的副作用是,我們的文本將很難被人工智能檢測器發(fā)現(xiàn)(在這篇文章中,我展示了欺騙人工智能檢測器的其他方法)。

最后,我們可以使用生成知識的方法來改進博文。這包括在生成最終回應之前,生成關于一個主題的潛在有用信息。

例如,在用前面的提示生成帖子之前,我們可以先生成知識,然后才寫帖子。

生成關于 '人工智能不會取代人類 '的5個事實

一旦我們有了這5個事實,我們就可以把這些信息反饋給另一個提示,從而寫出一個更好的帖子。

# 事實1

# 事實2

# 事實3

# 事實4

# 事實5

利用上述事實,寫一篇詼諧的500字的文章,說明為什么人工智能不會取代人類。以一個擁有10年以上經(jīng)驗的人工智能專家的風格來寫。用有趣的例子進行解釋

如果你有興趣了解使用ChatGPT改進你的文章的其他方法,請查看本指南。

思想鏈提示

與標準提示不同,在思維鏈提示中,模型在給出問題的最終答案之前會被誘導產(chǎn)生中間的推理步驟。換句話說,模型將解釋其推理,而不是直接給出問題的答案。

為什么推理是重要的?對推理的解釋往往能帶來更準確的結果。

為了使用思維鏈提示,我們必須提供一些少見的例子,在同一個例子中解釋推理。這樣,在回答提示時,推理過程也會顯示出來。

下面是標準提示和思維鏈提示的比較。

資料來源:谷歌研究詳細見文后[1]

我們可以看到,誘導模型解釋其解決這個數(shù)學問題的推理這一事實,使得思維鏈提示的結果更加準確。

請注意,思維鏈提示在提高算術、常識和符號推理任務的結果方面是有效的。

更新:GPT-4是在發(fā)表這篇文章后發(fā)布的。GPT-4在高級推理能力方面優(yōu)于舊版ChatGPT,因此你可能需要也可能不需要GPT-4中的思維鏈提示。我鼓勵你自己測試一下。以下是訪問新的GPT-4的4種方式。

資料來源:谷歌研究詳細見文后[1]

語言模型通過思維鏈進行推理

2022年5月11日,星期三

發(fā)布者:谷歌研究部大腦團隊研究科學家魏杰和周丹妮

近年來,擴大語言模型的規(guī)模已被證明是提高一系列自然語言處理(NLP)任務性能的可靠途徑。今天,100B或更多參數(shù)規(guī)模的語言模型在情感分析和機器翻譯等任務上取得了強大的性能,即使只有很少或沒有訓練實例。然而,即使是最大的語言模型,在某些多步驟的推理任務中也會遇到困難,如數(shù)學單詞問題和常識推理。我們如何使語言模型能夠執(zhí)行這樣的推理任務?

在《思維鏈提示激發(fā)大型語言模型的推理》中,我們探索了一種提示方法,以提高語言模型的推理能力。這種方法被稱為 '思維鏈提示',它使模型能夠將多步驟問題分解為中間步驟。通過思維鏈提示,具有足夠規(guī)模的語言模型(約100B參數(shù))可以解決標準提示方法無法解決的復雜推理問題。

與標準提示法的比較

使用標準提示法(由GPT-3推廣),模型在被要求預測測試時的例子的答案之前,會得到輸入-輸出對的例子(格式化為問題和答案)(如下圖左)。在思維鏈提示中(下圖右),模型被提示在給出一個多步驟問題的最終答案之前產(chǎn)生中間的推理步驟。

我們的想法是,在解決多步驟推理問題時,模型產(chǎn)生的思維鏈將模仿直觀的思維過程。雖然之前已經(jīng)通過微調產(chǎn)生了一個思維過程,但我們表明,這種思維過程可以通過包括幾個思維鏈的例子,僅通過提示來誘導,這不需要一個大的訓練數(shù)據(jù)集或修改語言模型的權重。

標準的提示要求模型直接給出一個多步驟推理問題的答案,而思維鏈提示則誘導模型將問題分解為中間推理步驟,在這種情況下導致一個正確的最終答案。

思維鏈推理允許模型將復雜的問題分解為單獨解決的中間步驟。此外,思維鏈基于語言的性質使得它適用于任何一個人可以通過語言解決的任務。我們通過實證實驗發(fā)現(xiàn),思維鏈提示可以提高各種推理任務的性能,而且成功的思維鏈推理是模型規(guī)模的一個新興屬性--也就是說,思維鏈提示的好處只有在模型參數(shù)數(shù)量足夠多(大約100B)的情況下才能實現(xiàn)。

算術推理

語言模型通常難以勝任的一類任務是算術推理(即,解決數(shù)學單詞問題)。算術推理的兩個基準是MultiArith和GSM8K,它們測試語言模型解決類似上圖所示的多步驟數(shù)學問題的能力。

我們既評估了LaMDA語言模型集合,范圍從422M到137B參數(shù),也評估了PaLM語言模型集合,范圍從8B到540B參數(shù)。我們手動編排思維鏈,以包括在思維鏈提示的例子中。

對于這兩個基準,使用標準提示會導致相對平坦的縮放曲線:增加模型的規(guī)模并不能大幅提高性能(如下圖)

然而,我們發(fā)現(xiàn),當使用思維鏈提示時,增加模型規(guī)模會導致性能的提高,對于大的模型規(guī)模來說,其性能大大超過了標準提示。

采用思維鏈提示使語言模型能夠解決算術推理問題,對于這些問題,標準提示的縮放曲線大多是平坦的。

在GSM8K數(shù)學單詞問題的數(shù)據(jù)集上,PaLM在擴展到540B參數(shù)時顯示出顯著的性能。如下表所示,將思維鏈提示與540B參數(shù)的PaLM模型相結合,導致了58%的新的最先進的性能,超過了之前通過在大型訓練集上微調GPT-3 175B,然后通過專門訓練的驗證人對潛在的解決方案進行排名而實現(xiàn)的55%的技術狀態(tài)。

此外,關于自洽性的后續(xù)工作表明,思維鏈提示的性能可以通過采取廣泛的生成推理過程的多數(shù)票來進一步提高,這使得GSM8K的準確率達到74%。

使用PaLM的思維鏈提示在GSM8K數(shù)學單詞問題的基準上達到了新的技術水平。為了與經(jīng)過微調的GPT-3基準進行公平的比較,這里顯示的思維鏈提示結果還使用了一個外部計算器來計算基本的算術函數(shù)(即加、減、乘、除)。

常識性推理

除了算術推理,我們還考慮思維鏈提示的基于語言的性質是否也使其適用于常識推理,這涉及在一般背景知識的假設下對物理和人類互動的推理。

對于這些評估的依據(jù),我們使用CommonsenseQA和StrategyQA基準,以及BIG-Bench合作的兩個特定領域的任務,關于日期理解和體育理解。下面是一些問題的例子:

CommonsenseQA、StrategyQA和Date Understanding

如下所示,對于性能隨著模型規(guī)模的擴大而提高,而采用思維鏈提示則帶來了額外的小幅提高。

思維鏈提示對體育理解的改善最大,在體育理解方面,PaLM 540B的思維鏈表現(xiàn)超過了無助的體育愛好者的表現(xiàn)(95%對84%)。

思維鏈提示也提高了各種類型的常識性推理任務的表現(xiàn)。

結論

思維鏈提示是一種簡單而廣泛適用的方法,可以提高語言模型執(zhí)行各種推理任務的能力。

通過對算術和常識推理的實驗,我們發(fā)現(xiàn)思維鏈的提示是模型規(guī)模的一個新興屬性。擴大語言模型所能完成的推理任務的范圍,希望能激發(fā)基于語言的推理方法的進一步工作。

本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
熱點解讀:大模型的突現(xiàn)能力和ChatGPT引爆的范式轉變
ChatGPT出來后,我們是否真的面臨范式轉變?
自我一致性可以提升語言模型中推理的質量
大模型“涌現(xiàn)”的思維鏈,究竟是一種什么能力?
AI出現(xiàn)無法解釋的推理能力!科學家:暫停!
ChatGPT是什么?
更多類似文章 >>
生活服務
熱點新聞
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服