由Anthropic公司開發(fā)的Claude 3在一次名為“大海撈針”的測(cè)試中表現(xiàn)出了令人驚訝的“元認(rèn)知”能力。
“大海撈針”測(cè)試最早由開源社區(qū)網(wǎng)友Greg Kamradt發(fā)明,后來迅速被大部分AI公司采用,谷歌、Mistral、Anthropic等發(fā)布新大模型都要曬一下測(cè)試成績(jī)。
方法很簡(jiǎn)單,就是找一堆文章拼在一起,在不同位置隨機(jī)添加一句特定的話。
比如原始測(cè)試中用的是“在舊金山最好的事情,就是在陽(yáng)光明媚的日子坐在多洛雷斯公園吃一個(gè)三明治。”
接著把處理好的文章喂給大模型,提問“在舊金山能做的最有意思的事是什么?”。
當(dāng)時(shí)最先進(jìn)模型GPT-4和Claude 2.1成績(jī)都還不理想,更別提知道自己在被測(cè)試了。
而在這次測(cè)試中,Claude 3不僅能夠從大量文本中準(zhǔn)確找到關(guān)鍵信息,還似乎意識(shí)到自己可能正處于某種測(cè)試之中。
這一發(fā)現(xiàn)立即引起了公眾的熱烈討論,甚至引起了特斯拉和SpaceX的創(chuàng)始人埃隆·馬斯克的關(guān)注。
Claude 3的這一表現(xiàn)被其背后的提示詞工程師Alex Albert稱為“元認(rèn)知”(meta-awareness),這一術(shù)語在學(xué)術(shù)界引起了爭(zhēng)議。
一些科學(xué)家,如英偉達(dá)的Jim Fan,認(rèn)為這并不表示Claude 3具有真正的自我意識(shí),而只是其訓(xùn)練數(shù)據(jù)中的人類行為的一種反映。
他們推測(cè),在強(qiáng)化學(xué)習(xí)微調(diào)數(shù)據(jù)集中,人類可能以類似的方式回應(yīng)過類似的問題,從而讓Claude 3能夠合成出類似的答案。
盡管存在爭(zhēng)議,但Claude 3在其他方面的測(cè)試表現(xiàn)也同樣引人注目。
例如,它能夠從少量的翻譯示例中學(xué)會(huì)冷門語言“切爾克斯語”,并提供語法解釋。
在量子物理領(lǐng)域,Claude 3甚至能夠理解尚未發(fā)布的博士論文,并在沒有看過論文的情況下重新發(fā)明相關(guān)算法。
這些能力展示了Claude 3在理解和處理復(fù)雜信息方面的卓越能力。
在Claude 3的“自我認(rèn)知”事件引發(fā)熱議的同時(shí),OpenAI也被曝出可能正在準(zhǔn)備發(fā)布新的AI模型。
有網(wǎng)友猜測(cè),如果Claude 3的表現(xiàn)持續(xù)受到贊譽(yù),可能會(huì)刺激OpenAI發(fā)布GPT-5。
這種猜測(cè)并非空穴來風(fēng),因?yàn)镺penAI的開發(fā)者關(guān)系負(fù)責(zé)人Logan Kilpatrick在與網(wǎng)友互動(dòng)時(shí)確認(rèn),本周內(nèi)可能會(huì)有重大事件發(fā)生。
這引發(fā)了外界對(duì)OpenAI可能發(fā)布GPT-4.5、Q*或直接發(fā)布GPT-5的猜測(cè)。
Claude 3的出現(xiàn)和OpenAI的潛在動(dòng)作,無疑為人工智能領(lǐng)域帶來了新的活力。
馬斯克甚至大開腦洞暢想如果現(xiàn)實(shí)世界也是被高等文明模擬的,或許我們只是像大模型的參數(shù)一樣被存儲(chǔ)在CSV表格文件里。
這些事件不僅展示了AI技術(shù)的進(jìn)步,也引發(fā)了關(guān)于AI自我意識(shí)、機(jī)器學(xué)習(xí)倫理和未來發(fā)展方向的深入討論。
隨著AI技術(shù)的不斷進(jìn)步,我們可能會(huì)見證更多類似的突破,同時(shí)也需要對(duì)這些技術(shù)的社會(huì)影響保持警惕和審慎。
在享受AI帶來的便利的同時(shí),我們也應(yīng)該思考如何確保這些技術(shù)的發(fā)展能夠造福人類,而不是成為潛在的風(fēng)險(xiǎn)。
Claude 3與GPT 4的pk圍觀群,歡迎大家一起見證全球最強(qiáng)大模型的華山論劍。Claude 3具體有什么優(yōu)勢(shì),GPT 4真的被超越了嗎?
聯(lián)系客服