選自 Quora
作者:Oren Etzioni
機(jī)器之心編譯
參與:Chen Xiaoqing、紫薇、孫睿
Oren Etzioni, 艾倫人工智能機(jī)構(gòu) CEO,F(xiàn)arecast創(chuàng)始人, 華盛頓大學(xué)教授。本文是 Quora 上,他回答人工智能相關(guān)問(wèn)題的匯總。
你看到了深度學(xué)習(xí)的哪些缺點(diǎn)?
深度學(xué)習(xí)已經(jīng)成為了近些年最耀眼的成就,但是它仍然僅僅作為分類(或非線性回歸)的工具。
我們已經(jīng)看到了人工智能在圖像、語(yǔ)音片段、甚至棋盤(pán)布局上越發(fā)精確的分類結(jié)果,但是它需要擺脫分類和回歸的局限。讓我們來(lái)討論一下 AlphaGo 吧,它是 DeepMind 團(tuán)隊(duì)的一個(gè)引人注目的技術(shù)成就。
但是,對(duì)于 AlphaGo 成功的大肆吹捧,無(wú)異于一個(gè)人爬到了樹(shù)頂就宣稱「我馬上就能登上月球了!」
當(dāng)然,下面就是我要給出的原因:
AlphaGo 是基于海量的標(biāo)簽化數(shù)據(jù),這在游戲中是可以輕易實(shí)現(xiàn)的,但在其他的環(huán)境下很難做到。例如, 在 Semantic Scholar 網(wǎng)頁(yè)中將所有引述分類為「具有影響力」以及「不具有」——未標(biāo)簽化的數(shù)據(jù)實(shí)在太多——標(biāo)簽化數(shù)據(jù)難以實(shí)現(xiàn)。
我們不知道如何在深度學(xué)習(xí)系統(tǒng)內(nèi)植入復(fù)雜的背景知識(shí)或邏輯推導(dǎo)能力。
AlphaGo 基于一套手動(dòng)的神經(jīng)網(wǎng)絡(luò),并且各個(gè)應(yīng)用之間需要轉(zhuǎn)換。
AlphaGo 依賴人類去指定輸入表征以及輸出目標(biāo)類別——它不能自我指定。
在許多情況下,僅僅是指定適合的類別也會(huì)由于對(duì)象的細(xì)微和模糊性,變得十分困難。
我們底線在于:當(dāng)我們成功的定義了一個(gè)目標(biāo)方程,并將現(xiàn)實(shí)任務(wù)降維成一個(gè)優(yōu)化問(wèn)題的時(shí)候——我們的計(jì)算機(jī)科學(xué) 「肌肉」會(huì)高速運(yùn)轉(zhuǎn),然后通過(guò)足夠的數(shù)據(jù)和(遲早都會(huì))成功的表征,我們可以解決這個(gè)任務(wù)。然而,許多問(wèn)題并非結(jié)構(gòu)良好的,僅僅將它們形式化就可能需要額外的分析。例如,我們?cè)撊绾尾拍芤哉降姆绞綄?xiě)出一個(gè)句子的含義?
大部分這些評(píng)論都不僅僅針對(duì) AlphaGo 或深度學(xué)習(xí),而是適用于所有監(jiān)督式學(xué)習(xí)程序。正如 Alan Newell 所說(shuō):「你無(wú)法和大自然進(jìn)行智力競(jìng)猜然后獲得勝利!」
多虧了偉大的 Geoff Hinton ——思維并不是一個(gè)向量,人工智能也并不是一個(gè)統(tǒng)計(jì)學(xué)問(wèn)題。
艾倫人工智能機(jī)構(gòu)是一個(gè)怎樣的機(jī)構(gòu)?你關(guān)注的核心又是什么?
位于西雅圖的艾倫人工智能機(jī)構(gòu)(AI2)是一家非盈利研究機(jī)構(gòu)。我們的任務(wù)是通過(guò)具有高影響的人工智能研究與工程去造福人類?;蛘吒雍?jiǎn)潔點(diǎn):創(chuàng)造服務(wù)社會(huì)的人工智能。AI2 由 Paul Allen 在 2014 年創(chuàng)立,現(xiàn)在有 50 位研究人員與工程師,并還在迅速增長(zhǎng)之中。
因?yàn)槲覀儗㈤L(zhǎng)期的研究,同目標(biāo)驅(qū)動(dòng)并以團(tuán)隊(duì)為核心的創(chuàng)業(yè)思維相結(jié)合,來(lái)解決一些大學(xué)沒(méi)有足夠資源支撐的項(xiàng)目。我們沒(méi)有申請(qǐng)研究資金來(lái)完成研究的壓力,也不用擔(dān)心要為風(fēng)投機(jī)構(gòu)或股東們創(chuàng)造利潤(rùn)的問(wèn)題。
Jeff Hammerbacher 曾經(jīng)說(shuō)過(guò)一句著名的話:「我們這一代人最聰明的人都在絞盡腦汁地思考怎么讓人們點(diǎn)擊廣告,這糟透了。」
相反地,我們有研究員和工程師肩并肩去奮斗在類似 Semantic Scholar 這樣的項(xiàng)目上,它有潛力通過(guò)最精尖的人工智能和工程來(lái)造福人類。
這個(gè)項(xiàng)目的長(zhǎng)期愿景是:
「說(shuō)不定有一個(gè)不可治愈的癌癥的治愈方法,就隱藏在上千篇乏味的臨床醫(yī)學(xué)研究報(bào)告中呢?在 20 年之后,人工智能將可以閱讀——更加重要的是去理解——科學(xué)文章。這些人工智能讀者將會(huì)連接起不同研究的關(guān)鍵點(diǎn),識(shí)別出新奇的假設(shè),并從而提出一些可能會(huì)被錯(cuò)過(guò)的實(shí)驗(yàn)建議。」
「人工智能為基礎(chǔ)的探索引擎將會(huì)幫助找到科學(xué)界最復(fù)雜的問(wèn)題的答案?!?/p>
你怎樣看待 OpenAI ?
OpenAI 對(duì)于人工智能生態(tài)系統(tǒng)來(lái)說(shuō)是一個(gè)強(qiáng)力的輔助,并且擁有著 Deep Learning 相關(guān)研究者組成的優(yōu)秀團(tuán)隊(duì)。我希望我們能夠達(dá)成合作,并希望他們不需要放棄非盈利的最初愿望。
讓我很高興的是,他們啟用了由艾倫人工智能機(jī)構(gòu)所激發(fā)的使命宣言,也就是「為了人類共同利益的人工智能」。
對(duì)于 Elon Musk 針對(duì)人工智能所稱的「釋放了惡魔」,但依然在許多人工智能公司,諸如 OpenMind、Vicarious、以及現(xiàn)在的 OpenAI 人工智能研究這一事實(shí),我其實(shí)非常困惑。接著,又有了特斯拉公司....
人工智能對(duì)于人類是存在意義上的威脅嗎?
Andrew Ng 曾經(jīng)說(shuō)過(guò)有名的一句話:「擔(dān)心人工智能會(huì)變成邪惡的事物,就像擔(dān)心火星將會(huì)人滿為患一樣,為時(shí)過(guò)早」。
好萊塢(以及媒體)一直都沉浸在「人工智能的存在威脅」,但忽視了下面的事實(shí):
產(chǎn)生一個(gè)「真正」的人工智能系統(tǒng)——而不是像 AlphaGo 和深藍(lán)這樣狹隘意義上的「學(xué)者」——所面對(duì)的技術(shù)挑戰(zhàn)是難以想象的。
人工智能在預(yù)防車(chē)輛事故、醫(yī)療誤診等等方面給社會(huì)帶來(lái)的巨大潛力。
實(shí)際上,沉浸在對(duì)不切實(shí)際的遙遠(yuǎn)未來(lái)的擔(dān)心,導(dǎo)致人們忽略了人工智能可能在近期帶來(lái)的真正問(wèn)題:它對(duì)于就業(yè)或武器制度的影響。
此外,要記住,未來(lái)不會(huì)只單獨(dú)出現(xiàn)一個(gè)人工智能——多個(gè)人工智能系統(tǒng)可以實(shí)現(xiàn)「相互制衡」。
除了語(yǔ)言 視覺(jué)之外,艾倫人工智能機(jī)構(gòu)是否對(duì)于純粹的計(jì)算機(jī)視覺(jué)問(wèn)題也很感興趣?
沒(méi)錯(cuò),我們正在 AI2 積極地研究幾個(gè)核心的計(jì)算機(jī)視覺(jué)問(wèn)題,并且有厲害的 Ali Farhadi 指導(dǎo)我們。
除了我們?cè)诳茖W(xué)問(wèn)題的視覺(jué)化理解上的努力之外,我們還在關(guān)注許多其它的視覺(jué)問(wèn)題,諸如常識(shí)的獲取、物理學(xué)知識(shí)、高效的深度學(xué)習(xí)解決方案、場(chǎng)景理解以及目標(biāo)探測(cè)。
我們研究的一個(gè)重點(diǎn)就是理解場(chǎng)景內(nèi)目標(biāo)的物理特征。能夠理解作用力與物體之間的互動(dòng),是視覺(jué)邏輯推導(dǎo)的一個(gè)重要組成部分。
最近,我們提出了一個(gè)二叉(binary)的深度學(xué)習(xí)框架,將網(wǎng)絡(luò)的規(guī)模降低了接近32倍,提供了在有限容量的可移動(dòng)設(shè)備加載深度學(xué)習(xí)網(wǎng)絡(luò)的可能性。
我們?cè)谀繕?biāo)探測(cè)和場(chǎng)景理解上有許多研究。例如,就在最近的一個(gè)研究中,我們以每秒155幀的速度處理場(chǎng)景,同時(shí)仍然維持了超出其他實(shí)時(shí)目標(biāo)探測(cè)器的兩倍的優(yōu)秀表現(xiàn)。
你最期待看到了哪一個(gè)工業(yè)被人工智能所影響?
人工智能能夠在下面幾個(gè)行業(yè)中挽救人們的生命:
交通業(yè):人工智能會(huì)預(yù)防許多許多的事故。
醫(yī)療健康:人工智能可以幫助醫(yī)療診斷的錯(cuò)誤,幫助創(chuàng)造新的革新性的治療手段。
礦業(yè)與消防行業(yè):機(jī)器人將會(huì)有一天接手這些危險(xiǎn)的職業(yè)。
當(dāng)然,我們現(xiàn)在必須要問(wèn)一下自己:這對(duì)于人類的職業(yè)會(huì)又怎樣的影響?我們?nèi)绾未_保這些行業(yè)中被取代的人們不會(huì)成為人工智能成功的犧牲品。
為什么相比于深度學(xué)習(xí),艾倫人工智能機(jī)構(gòu)更加關(guān)注 GOFAI(Good Old-Fashioned Artificial Intelligence,有效的老式人工智能)?
GOFAI 由一套問(wèn)題和一套技術(shù)解決方案組成。領(lǐng)域的基礎(chǔ)問(wèn)題并沒(méi)有改變,仍需要被解決。GOFAI 技術(shù)解決方案并沒(méi)有被證明有擴(kuò)展性,因此我們希望用包括深度學(xué)習(xí)、其他形式的機(jī)器學(xué)習(xí),ILP 以及更多的現(xiàn)代化的方案取代它們。
在建立 Semantic Scholar 上有哪些特殊的人工智能問(wèn)題需要被解決?
Semantic Scholar 利用 NLP(自然語(yǔ)言處理)、文本挖掘、信息提取和視覺(jué)技術(shù)去幫助科學(xué)家對(duì)抗過(guò)度載荷的信息,將更多精力放在核心論文與重要的結(jié)果上。通過(guò)這些方法,我們能夠提供下列獨(dú)一無(wú)二的特征:
為論文識(shí)別最具影響力的引用——可以超過(guò)10倍的數(shù)量減少你需要的考慮的論文。
自動(dòng)生成因子去過(guò)濾論文結(jié)果,包括所利用的數(shù)據(jù)庫(kù)、關(guān)鍵詞與論文元數(shù)據(jù)例如作者與會(huì)議。
我們可以自動(dòng)獲取與一篇論文有關(guān)的數(shù)字與圖表。
所有這些問(wèn)題都具有挑戰(zhàn)性,因?yàn)槲覀儚奶幚碚撐牡?PDF 版本,這意味著要展示出論文,但通常不包含關(guān)鍵的語(yǔ)義信息。
四年級(jí)或八年級(jí)的科學(xué)測(cè)驗(yàn)對(duì)如今的人工智能來(lái)說(shuō),難道不是一個(gè)成功率極低的嘗試嗎?為什么不從一些簡(jiǎn)單的任務(wù)開(kāi)始,比如說(shuō)從視頻里的對(duì)世界的基本理解?
科學(xué)問(wèn)題十分具有挑戰(zhàn)性,因?yàn)樗鼈兒w了巨大種類的話題,常常從商業(yè)運(yùn)作跨度到科學(xué)知識(shí),也頻繁的充斥著各種圖標(biāo)及其文字。
舉個(gè)例子,一個(gè)小學(xué)四年級(jí)的問(wèn)題如下:
四年級(jí)的同學(xué)們正打算舉行一場(chǎng)滑旱冰比賽。下列哪一種表面最適合比賽?
(A) 石子路
(B) 沙子路
(C) 柏油路
(D) 草坪
這道題要求你掌握關(guān)于滑旱冰和不同材料的基本知識(shí),還有關(guān)于運(yùn)動(dòng)的科學(xué)知識(shí)。
從我們?cè)?AI2 的實(shí)際操作來(lái)看,四年級(jí)科學(xué)確實(shí)看起來(lái)可以觸及。我們的 Aristo 系統(tǒng)現(xiàn)今能在紐約校務(wù)委員會(huì)的四年級(jí)科學(xué)測(cè)驗(yàn)中得到接近 50% 的得分,并繼續(xù)提高著(65% 算及格),而我們的工作包括解決問(wèn)題上的進(jìn)步:對(duì)解決一些需要簡(jiǎn)單的道理論證和圖像理解(對(duì)某些種類圖像)的提升。基礎(chǔ)科學(xué)十分適合作為發(fā)展人工智能的一個(gè)領(lǐng)域,因?yàn)樗梢员磺逦挠?jì)量,并且為各種任務(wù)——從一些簡(jiǎn)單的到一些需求深度理解的——提供循序漸進(jìn)的推進(jìn)。這之前已經(jīng)有幾個(gè)人工智能帶來(lái)巨大進(jìn)步的例子了:它通過(guò)選取那個(gè)正好的問(wèn)題來(lái)進(jìn)行專攻。我們相信基礎(chǔ)科學(xué)很適合被運(yùn)用在這件事上。
八年級(jí)科學(xué)比四年級(jí)科學(xué)難了許多。問(wèn)題更長(zhǎng)、包含了更多復(fù)雜的圖表、還對(duì)更深層的推理有要求。然而就算這樣,也有證據(jù)表明我們可以達(dá)到進(jìn)步。舉個(gè)例子,在 2015 年的艾倫人工智能八年級(jí)科學(xué)挑戰(zhàn)上,最優(yōu)秀的系統(tǒng)在無(wú)圖表、多選問(wèn)題上取得了 60%的成績(jī),而能夠運(yùn)用更高等數(shù)學(xué)和幾何來(lái)進(jìn)行推理的系統(tǒng)也取得了良好的表現(xiàn)。不論需要花多長(zhǎng)時(shí)間才能及格,這些挑戰(zhàn)為激發(fā)在這一領(lǐng)域的顯著的、新新的進(jìn)步創(chuàng)造了一個(gè)美好的背景。
要深度閱讀請(qǐng)見(jiàn)論文:http://www.allenai.org/papers.html我們的公共數(shù)據(jù)庫(kù):: http://www.allenai.org/data.html
在運(yùn)用神經(jīng)網(wǎng)絡(luò)來(lái)達(dá)到信息提取的過(guò)程中,有什么有趣的研究問(wèn)題和方向嗎?
許多的信息提取的核心有一套概念學(xué)習(xí)方法。舉個(gè)例子,TextRunner (在 Open Information Extraction 可以看到相關(guān)演示)依賴于一個(gè) CRF 從一句話里提取各類關(guān)系。我們很自然的會(huì)考慮:如果我們用一種 LSTM 為基礎(chǔ)的解決方法來(lái)代替 CRF 會(huì)怎么樣?
具體實(shí)例請(qǐng)見(jiàn)論文:Semantic Scholar (https://www.semanticscholar.org/paper/End-to-end-Relation-Extraction-using-LSTMs-on-Miwa-Bansal/23d1e3436ec530185be1fd067eba150fd9802be9)
一個(gè)巨大的問(wèn)題則變成:我們?nèi)绾稳ド晒勺邤?shù)量的被標(biāo)記了的數(shù)據(jù)。
當(dāng)然了,我們就會(huì)想到「遠(yuǎn)程監(jiān)控」(distant supervision),而遠(yuǎn)程監(jiān)控(它生成各類嘈雜的標(biāo)簽)和深度學(xué)習(xí)(它合理而強(qiáng)大的對(duì)應(yīng)噪聲)的結(jié)合也變得十分有趣......
對(duì)于一個(gè)初級(jí)研究者來(lái)說(shuō),為艾倫學(xué)院工作和為一個(gè)大學(xué)實(shí)驗(yàn)室工作不同嗎?
在 AI2 工作意味著你不需要寫(xiě)那些宏大的提議(因?yàn)槲覀冇腥~的資助),你也不需要教書(shū)。相反,你能夠全身心地專注于前沿的研究上。除此之外,你將會(huì)近距離的與頂尖的工程師、研究人員們一起團(tuán)隊(duì)協(xié)作。人們熱愛(ài) AI2 里要解決的難題、團(tuán)隊(duì)的熱情、還有進(jìn)展速度。
見(jiàn):在艾倫人工智能機(jī)構(gòu)工作( Working at Allen Institute for Artificial Intelligence)見(jiàn):什么事艾倫學(xué)院?你的專攻是什么?(What is the Allen Instiute? What are you focused on?)
怎么用平常人的話來(lái)描述「Semantic Scholar」?
這是一個(gè)通過(guò)人工智能實(shí)現(xiàn)高級(jí)篩選的用于科學(xué)論文搜索的搜索引擎。
見(jiàn):為了建造「Semantic Scholar」,有哪些具體的人工智能問(wèn)題必須被解決?( What are some specific AI problems that had to be solved to build semantic scholar? )
「Semantic Scholar」怎樣是使用機(jī)器學(xué)習(xí)的?
見(jiàn):為了建造「Semantic Scholar」,有哪些具體的人工智能問(wèn)題必須被解決?( What are some specific AI problems that had to be solved to build semantic scholar?)
本文由機(jī)器之心編譯,轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)。
------------------------------------------------
加入機(jī)器之心(全職記者/實(shí)習(xí)生):hr@almosthuman.cn
投稿或?qū)で髨?bào)道:editor@almosthuman.cn
廣告&商務(wù)合作:bd@almosthuman.cn
聯(lián)系客服