人工智能的終極目標(biāo)仍然是建造具有人類智能水平、并以我們能夠理解的方式思考的機(jī)器。
——阿尼爾·阿南薩斯瓦米
人工智能——內(nèi)置巧合的機(jī)器——終于漸趨成熟,并在核爆炸疏忽的監(jiān)察到早產(chǎn)兒脆弱身體的照料等眾多領(lǐng)域得到廣泛應(yīng)用。它是如何做到這一切的?
在需要診斷疾病時(shí),若有血肉之軀的醫(yī)生和人工智能(arti?cial intelligence,AI)系統(tǒng)兩個(gè)選擇,佩德羅·多明戈斯會(huì)選擇將自己的性命托付給后者?!拔蚁嘈艡C(jī)器勝過相信醫(yī)生?!鄙頌槲餮艌D華盛頓大學(xué)的計(jì)算機(jī)學(xué)家多明戈斯如此宣稱。
回到20世紀(jì)60年代,AI系統(tǒng)被寄予復(fù)制人類思維之關(guān)鍵的重大期望??茖W(xué)家們開始使用數(shù)理邏輯來構(gòu)建真實(shí)世界的知識(shí),以及其背后的聯(lián)系與邏輯。但人們很快便陷入僵局——邏輯固然可以按照人類思維的方式得出結(jié)果,但它天生就不適合處理不確定性。
AI復(fù)興的核心之一是概率規(guī)劃技術(shù),它將舊式AI基于邏輯的特性與統(tǒng)計(jì)學(xué)和概率論的優(yōu)勢結(jié)合在一起?!岸叨际前l(fā)展用以理解萬物之規(guī)律的最強(qiáng)有力的理論,二者的結(jié)合是非常自然的?!奔又荽髮W(xué)伯克利分校的現(xiàn)代人工智能先驅(qū)斯圖爾特·拉塞爾如是說。這一結(jié)合終于開始驅(qū)散長久籠罩在AI領(lǐng)域的冬日迷霧?!癆I的春天已經(jīng)到來?!甭槭±砉W(xué)院的認(rèn)知學(xué)家約什·特南鮑姆說。
“人工智能”的出現(xiàn)
“人工智能”一詞由麻省理工學(xué)院的約翰·麥卡錫于1956年首先創(chuàng)造。當(dāng)時(shí),他大力提倡邏輯思考,以發(fā)展能夠進(jìn)行推理的計(jì)算機(jī)系統(tǒng)。這導(dǎo)致了一階謂詞邏輯的成熟應(yīng)用,用標(biāo)準(zhǔn)的數(shù)學(xué)語言及符號(hào)刻畫真實(shí)世界。一階謂詞邏輯用于描述一類物體及物體之間的聯(lián)系,可以對事實(shí)進(jìn)行推理并得出有用的結(jié)論。
例如,若X患上傳染性很強(qiáng)的疾病Y,并且X與Z有過親密接觸,那么根據(jù)邏輯,我們很容易判斷出Z也患上了疾病Y。
然而,一階謂詞邏輯的最大成功之處在于,它讓人們找到了一種方法,使用許多最簡單的邏輯刻畫愈發(fā)復(fù)雜的實(shí)際情況。邏輯可以用最基礎(chǔ)的概念形成極其復(fù)雜的結(jié)論,這不禁讓人猜測人類的思維可能也是如此。
約翰·麥卡錫(John McCarthy)
可惜好消息到此為止。“壞消息是,事實(shí)并非如人所愿?!奔永D醽喫固垢4髮W(xué)的認(rèn)知學(xué)家諾厄·古德曼說。這是因?yàn)?,使用邏輯表述并推理知識(shí)要求我們對真實(shí)世界具有足夠確切的了解,容不得半點(diǎn)模糊和曖昧。
一件事情,要么是真的,要么是假的,不可能或真或假。不幸的是,真實(shí)世界中的幾乎每一條概括性定理都充滿了不確定性、起伏干擾和例外。所有基于一階謂詞邏輯的AI系統(tǒng)均無法處理這一問題。
它還存在另外一個(gè)嚴(yán)重的問題:無法反演。例如,如果已知Z患有疾病Y,我們不可能由此推測出Z一定是被X傳染的。這是醫(yī)療診斷環(huán)節(jié)的典型問題:邏輯推理可以從疾病推斷出癥狀,然而醫(yī)生需要做的卻是根據(jù)看到的癥狀反推出患者具有的疾病?!斑@需要將邏輯鏈路倒過來看,而推理邏輯不適合這么做?!碧啬硝U姆說。
這些問題導(dǎo)致在20世紀(jì)80年代中期,AI進(jìn)入了寒冬期。在世人看來,AI已死,毫無出路。然而古德曼相信,人們實(shí)際上并沒有放棄,“研究在暗中悄悄進(jìn)行”。
神經(jīng)網(wǎng)絡(luò),學(xué)會(huì)學(xué)習(xí)
春日的曙光首先出現(xiàn)于20世紀(jì)80年代末,那時(shí)神經(jīng)網(wǎng)絡(luò)剛剛面世。神經(jīng)網(wǎng)絡(luò)的原理異常簡單,神經(jīng)科學(xué)的發(fā)展讓人們得以建立神經(jīng)元的簡單模型。借助精巧復(fù)雜的算法,研究人員們構(gòu)建了人工神經(jīng)網(wǎng)絡(luò)(arti?cial neural networks,ANN),它可以進(jìn)行學(xué)習(xí),看起來與真正的大腦如出一轍。
神經(jīng)網(wǎng)絡(luò)促成了新型人工智能的一部分基礎(chǔ)。某些研究人工神經(jīng)網(wǎng)絡(luò)的學(xué)者最終意識(shí)到,這些網(wǎng)絡(luò)可以看作是真實(shí)世界的一種統(tǒng)計(jì)學(xué)和概率學(xué)描述。他們不再提起突觸和脈沖,而是討論參數(shù)化和隨機(jī)變量。“現(xiàn)在,它聽起來不再像是一個(gè)大腦,而是一個(gè)巨大的概率模型?!碧啬硝U姆說。
神經(jīng)網(wǎng)絡(luò)示意圖
隨后,在1988年,洛杉磯加利福尼亞大學(xué)的朱迪亞·佩爾的巨著《智能系統(tǒng)中基于概率的推理》問世,書中詳細(xì)描述了實(shí)現(xiàn)人工智能的一種嶄新方法。該方法基于18世紀(jì)英國數(shù)學(xué)家、牧師托馬斯·貝葉斯(Thomas Bayes)提出的方法,后者把在Q事件發(fā)生的條件下P事件發(fā)生的概率與在P事件發(fā)生的條件下Q事件發(fā)生的概率聯(lián)系在了一起,從而可以在因與果之間自如切換。
“如果你能用所有你感興趣的事情描述現(xiàn)有的知識(shí),那么貝葉斯原理可以告訴你該如何解讀它們的效果,并回溯每一個(gè)不同的起因?qū)е碌母怕省!碧啬硝U姆說。
零散的碎片拼在一起,形成學(xué)習(xí)真實(shí)世界的人工智能。貝葉斯網(wǎng)絡(luò)的參數(shù)代表概率的分布,它對世界的認(rèn)識(shí)越多,這些分布也就越接近事實(shí)。與基于一階謂詞邏輯的系統(tǒng)不同,即使面對不完整的知識(shí),這個(gè)網(wǎng)絡(luò)也不會(huì)崩潰。
AI前沿:邏輯與神經(jīng)網(wǎng)絡(luò)的結(jié)合
然而,邏輯并非毫無用處。人們發(fā)現(xiàn),僅靠貝葉斯網(wǎng)絡(luò)是不夠的,因?yàn)樗鼰o法形成任意復(fù)雜的結(jié)構(gòu)。只有將邏輯判斷與貝葉斯網(wǎng)絡(luò)結(jié)合在一起,概率規(guī)劃才能發(fā)揮其真正的威力。
站在新一代AI的最前沿的,是融合了以上兩者的眾多計(jì)算機(jī)程序語言。Church是古德曼、特南鮑姆與同事們開發(fā)的語言……馬爾可夫邏輯網(wǎng)絡(luò)是由多明戈斯的小組開發(fā)的另一種語言,將馬爾可夫網(wǎng)絡(luò)(與貝葉斯網(wǎng)絡(luò)類似)與邏輯結(jié)合在了一起。除此之外,還有拉塞爾與他的同事開發(fā)的一種語言,名字更為直截了當(dāng),就叫貝葉斯邏輯(Bayesian Logic,BLOG)。
朱迪亞·佩爾《智能系統(tǒng)中基于概率的推理》
在位于奧地利維也納的聯(lián)合國全面禁止核試驗(yàn)條約組織內(nèi)部,拉塞爾證明了這類語言的強(qiáng)大能力。該組織大膽猜測AI技術(shù)或許有助于解決探測核爆炸問題,于是邀請了拉塞爾。在花了一個(gè)上午,聽取了有關(guān)夾雜在地震背景信號(hào)、穿越地幔時(shí)信號(hào)的不規(guī)則失真,以及世界各地地震臺(tái)站接收到的眾多噪聲信號(hào)的干擾中探測來自遠(yuǎn)方核爆炸的地震信號(hào)所面臨的困難與挑戰(zhàn)的報(bào)告后,拉塞爾立刻開始著手編寫基于概率規(guī)劃原理的數(shù)學(xué)模型?!俺弥顼埞し?,我就把問題的完整模型寫出來了?!崩麪栒f。模型很短,只有半頁紙長。
已有的知識(shí),例如在蘇門答臘、印度尼西亞和英國伯明翰發(fā)生地震的概率,可以與該模型結(jié)合。CTBTO組織同樣要求該模型假定地球上任何一處發(fā)生核爆炸試驗(yàn)的概率均相等。實(shí)際數(shù)據(jù)已準(zhǔn)備妥當(dāng)—CTBTO組織的監(jiān)測臺(tái)站源源不斷地接收著震動(dòng)信號(hào)。AI系統(tǒng)的任務(wù)就是分析收到的所有數(shù)據(jù),并推測信號(hào)所代表的震動(dòng)最有可能來自何方。
比醫(yī)生更準(zhǔn)確的診斷
問題來了:BLOG等語言使用的是一種通用推理引擎(generic inference engine)。對于任何一個(gè)給定的真實(shí)問題的模型,通過計(jì)算其中的變量和概率分布,該引擎都應(yīng)該能給出相應(yīng)的解答。例如,若已知預(yù)測事件的發(fā)生概率,根據(jù)得到的地震信號(hào),引擎應(yīng)可以給出核爆炸發(fā)生在中東的概率;若把變量換而表示癥狀和疾病,引擎則應(yīng)給出合理的醫(yī)學(xué)診斷結(jié)果。換句話說,程序的算法應(yīng)具有良好的通用性——這意味著程序的運(yùn)行效率將大大降低。
結(jié)果是,每當(dāng)遇到一個(gè)新的問題時(shí),我們必須調(diào)整算法,使之最大限度適應(yīng)該問題。但你不可能每遇到一個(gè)新問題都雇一名博士生來改進(jìn)算法。拉塞爾說:“你的大腦并不是這樣解決問題的;大腦會(huì)適應(yīng)每一個(gè)新的問題?!?/p>
然而,這并沒有澆滅AI 領(lǐng)域燃起的熱情。例如,斯坦福大學(xué)的達(dá)夫妮·科勒正使用概率規(guī)劃方法集中攻克一個(gè)特定的問題,并取得了顯著的成效。科勒與同在斯坦福大學(xué)的新生兒??漆t(yī)師安娜·佩恩以及其他同事研發(fā)了一個(gè)名為PhysiScore的系統(tǒng),用于預(yù)測早產(chǎn)兒是否會(huì)面臨健康問題,這在新生兒科學(xué)中是十分困難的任務(wù)。醫(yī)生幾乎無法較為準(zhǔn)確地給出任何預(yù)判,“而這恰恰是父母最為關(guān)心的問題。”佩恩說。
PhysiScore 綜合考慮妊娠期、出生體重等指標(biāo)及嬰 兒出生后數(shù)小時(shí)內(nèi)的實(shí)時(shí)監(jiān)測數(shù)據(jù)(包括心率、呼吸率和 血氧飽和度)?!拔覀兛梢栽趮雰撼錾笕r(shí)內(nèi)判斷其是否健康,是否更容易具有嚴(yán)重的并發(fā)癥。即使那些癥狀要到出生后兩周才會(huì)變得顯著,我們?nèi)匀豢梢灶A(yù)先給出結(jié)論。”科勒說。
“像一個(gè)真正的人一樣”
除了發(fā)展靈活快速的推理算法,研究者還必須要改進(jìn)AI系統(tǒng)的學(xué)習(xí)能力,讓其能夠不僅從已有數(shù)據(jù),而且通過傳感器獲得的有關(guān)真實(shí)世界的數(shù)據(jù)學(xué)習(xí)。如今,絕大多數(shù)的機(jī)器學(xué)習(xí)是通過針對問題優(yōu)化算法并巧妙構(gòu)建數(shù)據(jù)集而完成的,相當(dāng)于讓機(jī)器做某種專門的工作?!拔覀兿M到y(tǒng)能更多樣化,這樣我們就可以把它直接放到真實(shí)世界里,讓它利用更多種類的輸入信息進(jìn)行學(xué)習(xí)。”科勒說。
人工智能的終極目標(biāo)仍然是建造具有人類智能水平、并以我們能夠理解的方式思考的機(jī)器。“這個(gè)目標(biāo)可能與尋找外星生命一樣極為遙遠(yuǎn),甚至具有危險(xiǎn),”特南鮑姆說?!邦惾薃I這一表述覆蓋的范圍更廣,同時(shí)也更易于調(diào)整。我們樂于看到,有一天我們造出了一個(gè)視覺識(shí)別系統(tǒng),它朝窗外看一眼,就能告訴我們外面有什么—就像一個(gè)真正的人一樣?!?/p>
【以上節(jié)選自《我,算法》】
聯(lián)系客服