來源:dupress.com,新智元
譯者:胡祥杰 張冬君 聞菲
我們理解并能衡量原因
有大量可用的歷史數(shù)據(jù)
預(yù)測(cè)本身不會(huì)影響要預(yù)測(cè)的事
從某種程度上看,未來于過去有一定的相似度
物聯(lián)網(wǎng)傳感器源源不斷產(chǎn)生的數(shù)據(jù)、云計(jì)算以及機(jī)器學(xué)習(xí)的發(fā)展,引起了人工智能的復(fù)興。而人工智能將有可能重塑人與計(jì)算機(jī)的關(guān)系。有句話說得好——數(shù)據(jù)是新的石油。計(jì)算機(jī)科學(xué)家Jon Kleinberg對(duì)此評(píng)論說,“這個(gè)詞本身是含糊的,但是它指代的事情是真的……大數(shù)據(jù)指的是將會(huì)改變一切事物的過程?!?br>
一個(gè)基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的典型AI應(yīng)用就是谷歌翻譯。谷歌翻譯工具的開發(fā),不是將語言的基本規(guī)則編碼為計(jì)算機(jī)算法,而是從無數(shù)先前翻譯的文檔中提取詞語的關(guān)聯(lián)。隨著訓(xùn)練該算法的文本語料庫(kù)的增長(zhǎng),該算法也得到不斷的改進(jìn)。在他們的影響力的文章“數(shù)據(jù)的有效性不合理,”谷歌的研究員Alon Halevy、Peter Norvig和Fernando Pereira在他們頗具影響力的論文“The unreasonable effectiveness of data”中評(píng)論道:
簡(jiǎn)單的模型和大量的數(shù)據(jù)總是勝過基于較少數(shù)據(jù)的復(fù)雜的模型……目前,統(tǒng)計(jì)翻譯模型主要包括大量的記憶短語表,這些短語表給出具體的源語言和目標(biāo)語言短語之間的可能映射。
他們的評(píng)論也與近年來公布的在AI取得的突破相關(guān)。計(jì)算機(jī)科學(xué)家 Kris Hammond說:“AI的核心技術(shù)并沒有發(fā)生重大改變,現(xiàn)在的核心技術(shù)幾乎與多年前的一樣。昔日的技術(shù)達(dá)不到要求,不是因?yàn)樵O(shè)計(jì)不足,而是因?yàn)樯形淳邆渌璧幕A(chǔ)和環(huán)境。”總之,AI過去與現(xiàn)在的最大區(qū)別是,必須的計(jì)算能力、原始數(shù)據(jù)和處理速度現(xiàn)在都有了,因此AI技術(shù)現(xiàn)在能大放異彩。
過去與現(xiàn)在共同的一個(gè)主題是,將模式識(shí)別技術(shù)應(yīng)用于用戶生成內(nèi)容的海量數(shù)據(jù)庫(kù)。拼寫檢查工具是在用戶自我更正的海量數(shù)據(jù)庫(kù)中訓(xùn)練的;能識(shí)別照片中人臉的深度學(xué)習(xí)算法是在數(shù)以百萬計(jì)的數(shù)字化存儲(chǔ)照片中訓(xùn)練的;擊敗了《危險(xiǎn)邊緣》游戲節(jié)目的冠軍Ken Jennings和 Brad Rutter的計(jì)算機(jī)系統(tǒng)整合了大量適用于數(shù)字存儲(chǔ)文本的信息檢索算法。認(rèn)知科學(xué)家Gary Marcus指出,最后一個(gè)應(yīng)用之所以是可行的,那是因?yàn)榛卮稹段kU(xiǎn)邊緣》出的題目的大多數(shù)知識(shí)都被電子存儲(chǔ)于其中。維基百科上說:“這主要是在數(shù)據(jù)檢索上的運(yùn)用,而大數(shù)據(jù)非常適合這一用途?!?/span>
這些發(fā)展數(shù)量之多、速度之快已經(jīng)引起一些人的推測(cè)——我們即將進(jìn)入一個(gè)新時(shí)代,那時(shí)機(jī)器的智能將超過人類的智能。雖然這個(gè)話題很大,但是我們需要弄清楚“智能”的本質(zhì)。如今的大數(shù)據(jù)和機(jī)器學(xué)習(xí)使得“智能”成為可能。AI的標(biāo)準(zhǔn)定義是“能夠完成通常由人類完成的任務(wù)的機(jī)器”。注意,這個(gè)定義適用于較為熟悉的數(shù)據(jù)科學(xué)應(yīng)用(比如,能夠自動(dòng)承保貸款或簽立簡(jiǎn)單的保險(xiǎn)合同的評(píng)分模型)、能夠進(jìn)行語音翻譯和標(biāo)記照片的算法,以及自動(dòng)駕駛汽車。
還有一件事也很突出:所有已經(jīng)發(fā)明的AI技術(shù),以及預(yù)計(jì)在未來有可能出現(xiàn)的,都是狹義的AI。例如,旨在翻譯文件的算法將無法標(biāo)記照片,反之亦然。而二者都不能用于駕駛汽車。這與Marvin Minsky、HerbertSimon等AI界先驅(qū)的最初目標(biāo)不同。他們想要制造通用AI:能像人類一樣理解的計(jì)算機(jī)系統(tǒng)。令人印象深刻的是,如今的AI技術(shù)在概念上更接近于信用評(píng)分算法,而非《2001太空漫游》中的超級(jí)電腦HAL9000或是由《機(jī)械姬》里有自我意識(shí)的機(jī)器人Ava。我們現(xiàn)在見到的都是狹隘AI。
回到本文的問題:預(yù)測(cè)一下,大數(shù)據(jù)和AI會(huì)從根本上改變規(guī)則還是會(huì)使人類的判斷過時(shí)?預(yù)測(cè)非常重要,它曾在2014年促使人們重新評(píng)估大數(shù)據(jù)的價(jià)值。一些分析家將谷歌流感趨勢(shì)(GFT)作為大數(shù)據(jù)取代傳統(tǒng)科學(xué)方法和數(shù)據(jù)分析的一個(gè)絕佳例子。當(dāng)時(shí)的想法是,谷歌可以利用人們與流感有關(guān)的搜索,實(shí)時(shí)追蹤流感爆發(fā)。這似乎能支持Chris Anderson,、Kenneth Cukier、 Viktor Mayer-Sch?nberger等專家的觀點(diǎn)。他們聲稱,當(dāng)獲得的數(shù)據(jù)足夠多時(shí),“相關(guān)性就足夠了”,從而傳統(tǒng)的分析形式可以被尋找相關(guān)性的計(jì)算機(jī)算法取代。然而,在2013年流感季節(jié)時(shí),GFT的預(yù)言被證明極其不準(zhǔn)確,大約有140%的誤差。分析家們開始質(zhì)疑他們的模型。計(jì)算社會(huì)科學(xué)家David Lazer及其聯(lián)合作者發(fā)表了一篇被廣泛引用的分析文章,從兩方面分析該算法最終失敗的原因。
算法動(dòng)力學(xué)
谷歌一直在調(diào)整搜索引擎以提高搜索結(jié)果和用戶體驗(yàn)。然而,GFT假設(shè),搜索詞條與外部事件之間的關(guān)系是靜態(tài)的。在Rob Hyndman的話來說,這違反了“未來很大程度上重復(fù)過去這一假設(shè)”。
大數(shù)據(jù)的傲慢
通過在疾病控制和預(yù)防中心(CDC)的數(shù)據(jù)與數(shù)百萬計(jì)的搜索詞條之間建立相關(guān)性,GFT違反了Hyndman的四個(gè)可預(yù)測(cè)性關(guān)鍵因素中的第一個(gè)也是最重要的一個(gè)因素:了解數(shù)據(jù)關(guān)系背后的偶然因素。由于存在隨機(jī)可能性,結(jié)果出現(xiàn)過多的虛假相關(guān)性。雖然這是在數(shù)據(jù)科學(xué)所有分支中的一個(gè)關(guān)注焦點(diǎn),這一事件說明隱性假設(shè)的本質(zhì)是不可靠的,它使大數(shù)據(jù)忽視了傳統(tǒng)數(shù)據(jù)分析的形式的必要。
Lazer團(tuán)隊(duì)從此次失敗中得到的教訓(xùn)不是說社交媒體的數(shù)據(jù)對(duì)于預(yù)測(cè)疾病爆發(fā)是無用的。教訓(xùn)是,大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法應(yīng)該被視為對(duì)人類判斷和傳統(tǒng)分析形式的補(bǔ)充,而非替代。
Philip Tetlock與Dan Gardner共同撰寫了In Superforecasting: The Art and Science of Prediction,討論以大數(shù)據(jù)為基礎(chǔ)的AI技術(shù)無法取代人的判斷。Tetlock報(bào)告了他與David Ferrucci的談話,F(xiàn)errucci領(lǐng)導(dǎo)工程團(tuán)隊(duì)開發(fā)了在《危險(xiǎn)邊緣》游戲中獲勝的Watson系統(tǒng)。Tetlock提出了2個(gè)問題:
1. 哪兩位俄羅斯領(lǐng)導(dǎo)人在過去十年交換了工作?
2. 兩位俄羅斯最高領(lǐng)導(dǎo)人會(huì)在10年后交換工作嗎?
Tetlock指出,第一個(gè)問題考的是歷史事實(shí),許多在線文檔都有電子記,計(jì)算機(jī)算法可以使用模式識(shí)別技術(shù)找出答案。第二個(gè)問題需要猜測(cè)普京的意圖和俄羅斯政治的動(dòng)態(tài)。Ferrucci對(duì)于計(jì)算機(jī)算法能在不確定的條件自動(dòng)化這種判斷形式表示懷疑。隨著數(shù)據(jù)量的增加和機(jī)器學(xué)習(xí)方法的不斷改進(jìn),模式識(shí)別應(yīng)用將更好地模仿人類的推理過程,但Ferrucci說,模仿和表達(dá)意義、產(chǎn)生意義是不同的。Tetlock說,二者之間的差距有待人類判斷來補(bǔ)充。
數(shù)據(jù)越來越多,統(tǒng)計(jì)方法也在進(jìn)化,但是最終的結(jié)果也不會(huì)讓Paul Meehl感到驚訝。的確,計(jì)算機(jī)可以自動(dòng)化某些傳統(tǒng)上只能由人類完成的任務(wù)。比如,信用評(píng)分在很大程度上替代了銀行信貸員的角色。但更普遍的是,計(jì)算機(jī)只能協(xié)助而不是取代人類在不確定的條件下做出
這就是說,人類與計(jì)算機(jī)合作的性質(zhì)很有可能發(fā)生變化。Tetlock引用“自由國(guó)際象棋”作為人機(jī)合作的典型例子,我們?cè)谖磥砜赡軙?huì)看到更多這樣的例子。Garry Kasparov(被IBM深藍(lán)計(jì)算機(jī)在在1996年擊敗)對(duì)2005年的自由國(guó)際象棋的討論就很好地說明了這種合作的可能性。Kasparov說:
比賽結(jié)束時(shí)出現(xiàn)了驚喜。獲勝者不是使用一臺(tái)最先進(jìn)計(jì)算機(jī)的大師,而是同時(shí)使用三臺(tái)計(jì)算機(jī)的一對(duì)美國(guó)業(yè)余棋手。他們操縱和“訓(xùn)練”計(jì)算機(jī)的技能能夠抗衡大師級(jí)別的對(duì)手具備的高超棋藝,以及其他參賽者更加強(qiáng)大的計(jì)算能力。能力弱的人+機(jī)器+較好的過程要?jiǎng)龠^一臺(tái)強(qiáng)大的計(jì)算機(jī),而且,更勝過能力強(qiáng)的人+機(jī)器+較差的過程。
由RAND公司在冷戰(zhàn)期間發(fā)展的Delphi方法,被用于預(yù)測(cè)軍事場(chǎng)景。Delphi是一個(gè)反復(fù)的思考過程,促使群體成員達(dá)成一個(gè)單一的預(yù)測(cè)。第一輪由各組員匿名提交自己個(gè)人的預(yù)測(cè)。第二輪,在第一輪預(yù)測(cè)的兩個(gè)四分點(diǎn)內(nèi)的結(jié)果中,由各組員再次選擇并作修正,這個(gè)過程一直進(jìn)行,直到得出一個(gè)統(tǒng)一的預(yù)測(cè)?,F(xiàn)在,產(chǎn)業(yè)、政治和醫(yī)療領(lǐng)域都已經(jīng)證明了這種預(yù)測(cè)方法的價(jià)值。
總之,利用高度組織化的智慧,能帶來判斷和預(yù)測(cè)力的提升。2011年,著名管理學(xué)家Philip Tetlock與人共同發(fā)起了Good Judgement Project(GJP),該項(xiàng)目受 Intelligence Advanced Research Projects Activity(IARPA)資助,IARPA 專門投資高回報(bào)、高風(fēng)險(xiǎn)的研究項(xiàng)目。GJP專門預(yù)測(cè)中級(jí)緊急的事件,比如,希臘會(huì)退出歐元區(qū)嗎?
Tetlock和他的團(tuán)隊(duì)發(fā)現(xiàn):a) 一些人在預(yù)測(cè)水平上一直都好于平均水平;b)這些人都有突出的心理特征;c)教育和實(shí)踐能提高人們的預(yù)測(cè)能力。Tetlock稱,僅通過GJP的小冊(cè)子的訓(xùn)練,就能將個(gè)人的預(yù)測(cè)能力提升10%左右。
GJP每年都會(huì)選出前2%的超級(jí)預(yù)測(cè)者,這些人有一些共同的特點(diǎn),就是從“外部視角”而非“內(nèi)部視角作預(yù)測(cè)”。除了建立在堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)上這一特質(zhì)外,Tetlock還總結(jié)了超級(jí)預(yù)測(cè)家的一些共性:
不迷信,更相信概率論
開放,對(duì)新的證據(jù)保持歡迎
知識(shí)水平高
謙虛,愿意承認(rèn)錯(cuò)誤并修改
對(duì)數(shù)字敏感
群體的預(yù)測(cè)水平可以在人事、并購(gòu)、戰(zhàn)略評(píng)估、風(fēng)險(xiǎn)管理、保險(xiǎn)等方面等得到應(yīng)用。而提高群體預(yù)測(cè)能力,帶來的好處也是顯而易見的。
雖然預(yù)測(cè)模型和其他AI應(yīng)用能使一些任務(wù)變得自動(dòng)化,但人類判斷全部交由算法負(fù)責(zé)這種情況幾乎不可能發(fā)生。更現(xiàn)實(shí)的方法是,使用數(shù)據(jù)科學(xué)和心理學(xué)不斷完善并提升人類的判斷質(zhì)量。當(dāng)數(shù)據(jù)十分充足,而世界的有關(guān)方面變化也相對(duì)較慢時(shí),依靠統(tǒng)計(jì)學(xué)的方法進(jìn)行決策是恰當(dāng)且合理的。當(dāng)沒有數(shù)據(jù)或擁有的數(shù)據(jù)十分有限時(shí),采用群體智慧和其他心理學(xué)方法能夠更好地進(jìn)行決策。
舉例來說,谷歌——一家建立在大數(shù)據(jù)和AI之上的公司——使用“群體智慧”和其他統(tǒng)計(jì)方法提升招聘員工的決策,其蘊(yùn)含的道理也是“輔助人類決策者,而非取代他們”。
在愈發(fā)涉及海量數(shù)據(jù)的情況下,“智能”AI應(yīng)用將把日程工作自動(dòng)化,從而空出更多時(shí)間讓人類專家專注于需要他們專業(yè)判斷的工作,以及從事社會(huì)認(rèn)知(social perception)和共情等非認(rèn)識(shí)能力的行動(dòng)。深度學(xué)習(xí)模型有可能讓醫(yī)療成像的某些過程自動(dòng)化,這將使醫(yī)護(hù)人員有更多時(shí)間集中精力完成抽象的醫(yī)療問題,圍繞診療方案進(jìn)行策略規(guī)劃,以及提供共情服務(wù)。類似的,保險(xiǎn)公司也可以使用深度學(xué)習(xí)系統(tǒng)將估算受損汽車的成本修理費(fèi)用變得自動(dòng)化,讓人類保險(xiǎn)雇員有更多時(shí)間完成更加復(fù)雜和需要更多經(jīng)驗(yàn)的客服。
未來我們還將借助心理學(xué)方法,以及數(shù)據(jù)科學(xué)、人工智能產(chǎn)品,繼續(xù)使用、依靠并且發(fā)揚(yáng)人類決策系統(tǒng)。但在可以預(yù)見的未來,人類仍將是“決策過程中的一部分”。至少我們是這樣預(yù)測(cè)的。
聯(lián)系客服