1956年的夏天,一場在美國達特茅斯(Dartmouth)大學召開的學術會議,“人工智能”(artificialintelligence)第一次被提出,多年以后該會議也被認定為全球人工智能研究的起點。2016年的春天,一場AlphaGo與世界優(yōu)秀圍棋高手李世石的人機世紀對戰(zhàn),人工智能新浪潮來臨。
經(jīng)歷了兩次起伏,人工智能開始了新一輪的爆發(fā)。如今,隨著企業(yè)將人工智能集成到自己的系統(tǒng)中,科技人員將目光投向了人工智能創(chuàng)新的新領域。
即元學習領域。簡單來說,元學習就是學會學習。人類具有一種獨特的能力,可以在任何情況下或環(huán)境中學習。人們適應學習。人們會想辦法學習。人工智能要想擁有這種學習的靈活性,需要通用人工智能。
換句話說,人工智能需要一種有效且高效的方式來了解其學習過程。
人工智能的學習方式與人類大相徑庭
受限是人類與人工智能學習過程最主要的差異。
人類的能力受限。人類的腦力有限,時間也有限,因此,人腦的適應能力也是有限的。人腦充分利用接收到的每個信息,然后,發(fā)展了培養(yǎng)世界大量模型的能力。人類是通用學習者。如果人們的學習過程高效,那么就可以快速學習所有的學科。但并非所有人都學得很快。
相比之下,人工智能擁有更多的資源,例如計算能力。然而,人工智能學習的數(shù)據(jù)比人類大腦使用的數(shù)據(jù)要多得多。處理這些海量數(shù)據(jù)需要巨大的計算能力。
同時,隨著人工智能任務變得越來越復雜,計算能力也呈指數(shù)級增長。人工智能所做的每個推斷(跨越多個數(shù)據(jù)存儲庫)都依賴于算法在不同數(shù)據(jù)片段之間建立連接。如果算法對于給定的數(shù)據(jù)集不夠有效,那么計算能力將呈指數(shù)級增長。如今,無論計算能力多么爛大街,指數(shù)級增長都不是我們想要的方案。
這就是為什么,目前人們將人工智能用作特定用途的學習者。通過從相似的相關數(shù)據(jù)中學習,人工智能可以高效地處理數(shù)據(jù)并從中進行推斷,而無需花費太多成本。
人工智能學會學習的重要性
技術人員試圖解決計算能力的指數(shù)級增長時,出現(xiàn)了“學習型”問題,因為人工智能開始從越來越復雜的數(shù)據(jù)中做出推斷。
為了防止計算能力呈指數(shù)級增長,人工智能必須找出最有效的學習路徑,并記住該路徑。一旦算法能夠為不同類型的問題確定學習路徑,那么人工智能就可以通過選擇學習路徑,遵循學習路徑,根據(jù)變化調(diào)整學習路徑,從而進行自我調(diào)節(jié),并動態(tài)地引導自己找到解決方案。
這引出了人工智能的下一個問題:“多任務”。
隨著技術人員開始給人工智能提供相關但無序的任務,“多任務”應運而生。如果獨立任務可以同時執(zhí)行怎么辦?如果在人工智能執(zhí)行某些任務時,知識和數(shù)據(jù)可以幫助其執(zhí)行其他任務呢?
“多任務”問題將“學會學習”的問題提升到了一個新高度。
為了可以“多任務”運行,人工智能需要能夠并行評估獨立的數(shù)據(jù)集,還需要關聯(lián)數(shù)據(jù)片段并推斷該數(shù)據(jù)上的連接。當人工智能執(zhí)行一項任務的步驟時,需要不斷更新知識,以便可以在其他情況下應用和使用這些知識。由于任務是相互關聯(lián)的,因此對任務的評估將需要由整個網(wǎng)絡來完成。
谷歌的 MultiModel 就是一個人工智能系統(tǒng)的示例,該系統(tǒng)學會了同時執(zhí)行八項不同的任務。該系統(tǒng)模擬大腦感知信息的方式,可以檢測圖像中的物體、提供字幕、識別語音,在四對語言之間進行翻譯并執(zhí)行語法選區(qū)分析。該系統(tǒng)在多任務聯(lián)合訓練時表現(xiàn)優(yōu)異。神經(jīng)網(wǎng)絡也從不同領域的數(shù)據(jù)中學習。
為了使其適應性更強,人工智能將需要學習多任務處理。人工智能作為自適應學習者的一種應用,是在機器人領域,即機器人代替人類在危險情況下學習執(zhí)行任務。例如,當監(jiān)視或捕獲情況發(fā)生變化時,機械軍犬將能夠適應各種情況,而無需遵循人類的特定命令。
人工智能可以學會怎樣成為通用學習者嗎?
正如我們從谷歌的 MultiModel 中看到的那樣,人工智能當然可以通過學習,成為人類這樣的通用學習者。但是,實現(xiàn)仍然需要一段時間。這包括兩個部分:元推理和元學習。元推理著重于認知資源的有效利用。元學習側(cè)重于人類有效利用有限的認知資源和有限的數(shù)據(jù)進行學習的獨特能力。
在元推理中,其中一個關鍵要素是戰(zhàn)略思維。如果人工智能可以從不同類型的數(shù)據(jù)中得出推論,那么它是否也能在不同情況下采用高效的認知策略呢?
當前人們正在進行研究,以找出人類認知能力與人工智能學習方式之間的差距,例如對內(nèi)部狀態(tài)的認知、記憶的準確度或自信心。但是,歸根結(jié)底,元推理依賴于把握全局和戰(zhàn)略決策。戰(zhàn)略決策包括兩個部分:從現(xiàn)有的可用戰(zhàn)略中進行選擇,根據(jù)情況發(fā)現(xiàn)不同戰(zhàn)略。這些都是元推理的研究領域。
在元學習中,其中一個關鍵部分是彌合使用大量數(shù)據(jù)訓練模型和有限數(shù)據(jù)訓練模型之間的鴻溝。模型必須具有適應性,才能基于跨多個任務的少量信息來準確做出決策。
對此,有不同的解決辦法。有些模型是通過學習人類學習者的參數(shù)以找到一組可以在不同任務中正常工作的參數(shù)來實現(xiàn)。有些模型定義合適的學習空間,例如度量空間,在該空間中學習可能最行之有效。還有一些模型,例如少樣本元學習,其算法學習嬰兒的學習方式,通過模仿最少的數(shù)據(jù)量來進行學習。這些都是元學習的研究領域。
元推理和元學習只是人工智能成為通用學習者的一部分。將它們與來自運動和感覺處理的信息放在一起,可以使人工智能學習者更像人類。
人工智能仍在學習變得更像人類
成為像人類的廣泛學習者需要對人類的學習方式以及人工智能如何模仿人類的學習方式進行廣泛研究。
要適應新情況,例如具有“多任務”能力以及使用有限的資源做出“戰(zhàn)略決策”的能力,這是人工智能研究人員在研究過程中需要跨越的幾個障礙。
在人類的努力下,人工智能的學習能力正在不斷發(fā)展,雖然與人類相比仍有較大差距,但相信這種差距會隨著人類技術的不斷進步而逐漸縮小,最終達到一個令人震驚的高度,讓我們一起拭目以待~
責任編輯:ct
聯(lián)系客服