作者:阿米特·V. 喬希(Ameet V Joshi)
來源:華章科技
艾倫·圖靈(Alan Turing)對(duì)人工智能的定義如下:
如果窗簾后面有一臺(tái)機(jī)器,并且有人正在與之互動(dòng)(無論以何種方式,例如音頻或打字等),并且如果該人覺得他正在與另一個(gè)人互動(dòng),那么這臺(tái)機(jī)器就是人工智能的。
這是定義AI的一種非常獨(dú)特的方式。它并不直接針對(duì)智能的概念,而是專注于類人的行為。事實(shí)上,這一目標(biāo)的范圍甚至比單純的智能更為廣泛。從這個(gè)角度來看,AI并不意味著要建造一臺(tái)可以立即解決任何問題的超智能機(jī)器,而是要建造一臺(tái)能模仿人類行為的機(jī)器。
然而,僅僅制造模仿人類的機(jī)器聽起來并不有趣。從現(xiàn)代角度來看,每當(dāng)我們談到AI時(shí),指的是能夠執(zhí)行以下一項(xiàng)或多項(xiàng)任務(wù)的機(jī)器:理解人類語言,執(zhí)行涉及復(fù)雜操縱的機(jī)械任務(wù),在很短的時(shí)間內(nèi)解決可能涉及大量數(shù)據(jù)的基于計(jì)算機(jī)的復(fù)雜問題,并以類人的方式回復(fù)答案,等等。
電影《2001:太空漫游》中描述的超級(jí)計(jì)算機(jī)HAL非常接近現(xiàn)代AI的觀點(diǎn)。它是一臺(tái)機(jī)器,能夠處理各種來源的大量數(shù)據(jù),并以極快的速度生成對(duì)其的見解和總結(jié),并且能夠以類人的交互方式(如語音對(duì)話)將這些結(jié)果傳達(dá)給人類。
從類人行為的角度來看,人工智能有兩個(gè)方面。一方面,機(jī)器是智能的并且能夠與人類交流,但是沒有任何運(yùn)動(dòng)功能。HAL就是這類人工智能的例子。另一方面,涉及與類人的運(yùn)動(dòng)能力的物理交互,這涉及機(jī)器人領(lǐng)域。
術(shù)語“機(jī)器學(xué)習(xí)”或簡(jiǎn)稱ML(Machine Learning),是亞瑟·塞繆爾(Arthur Samuel)在1959年用機(jī)器解決跳棋游戲的背景下提出的。該術(shù)語指的是一種計(jì)算機(jī)程序,它可以學(xué)習(xí)產(chǎn)生一種行為,而這種行為不是由程序的作者明確編程實(shí)現(xiàn)的。相反,它能夠顯示出作者可能完全沒有意識(shí)到的行為。
這種行為的學(xué)習(xí)基于三個(gè)因素:
可以看出,第二個(gè)和第三個(gè)因素很快使這個(gè)概念變得抽象,并強(qiáng)調(diào)其深層的數(shù)學(xué)根源。機(jī)器學(xué)習(xí)理論中的方法對(duì)于構(gòu)建人工智能系統(tǒng)至關(guān)重要。
機(jī)器學(xué)習(xí)算法大致分為三種類型:
讓我們?cè)敿?xì)了解每種類型。
為簡(jiǎn)單起見,讓我們將機(jī)器學(xué)習(xí)系統(tǒng)看作一個(gè)黑盒,在給定一些輸入時(shí)會(huì)產(chǎn)生些輸出。如果我們已經(jīng)有一個(gè)歷史數(shù)據(jù),該歷史數(shù)據(jù)包含一組輸入的一組輸出,則基于這些數(shù)據(jù)的學(xué)習(xí)稱為監(jiān)督學(xué)習(xí)。
監(jiān)督學(xué)習(xí)的一個(gè)經(jīng)典示例是分類。假設(shè)我們已經(jīng)測(cè)量了3種不同類型的花( Setosa山鳶尾、 Versicolor變色鳶尾、 Virginica弗吉尼亞鳶尾)的4種不同的屬性(尊片長(zhǎng)度、尊片寬度、花瓣長(zhǎng)度和花瓣寬度)。
我們對(duì)每種花的25種不同示例進(jìn)行了測(cè)量。然后,這些數(shù)據(jù)將用作訓(xùn)練數(shù)據(jù),其中有可用于訓(xùn)練模型的輸入(4個(gè)測(cè)量的屬性)和相應(yīng)的輸出(花的類型)。然后以監(jiān)督的方式訓(xùn)練合適的機(jī)器學(xué)習(xí)模型。一旦模型被訓(xùn)練好,就可以根據(jù)萼片和花瓣的尺寸對(duì)任何花(在三種已知類型之間)進(jìn)行分類。
在無監(jiān)督學(xué)習(xí)范式中,標(biāo)記數(shù)據(jù)是不可用的。無監(jiān)督學(xué)習(xí)的一個(gè)經(jīng)典例子是“聚類”。考慮與前面小節(jié)中描述的相同示例,在該示例中,我們對(duì)三種類型的花的萼片和花瓣尺寸進(jìn)行了測(cè)量。但是,在本例中,我們沒有每組測(cè)量的花的確切名稱。我們所擁有的只是一組測(cè)量值。此外,我們被告知這些測(cè)量值屬于三種不同類型的花。
在這種情況下,可以使用無監(jiān)督學(xué)習(xí)技術(shù)自動(dòng)識(shí)別三組測(cè)量值(所屬的)類簇。但是,由于標(biāo)簽未知,我們所能做的就是將每個(gè)類簇稱為flower-type-1、flower-type-2和flower-type-3。如果給出一組新的測(cè)量值,我們可以找到它們最接近的類簇,并將它們歸類為其中之一。
強(qiáng)化學(xué)習(xí)是一種特殊的學(xué)習(xí)方法,需要與監(jiān)督和無監(jiān)督方法分開對(duì)待。強(qiáng)化學(xué)習(xí)涉及來自環(huán)境的反饋,因此它并不是完全無監(jiān)督的,但是,它也沒有一組可用于訓(xùn)練的標(biāo)記樣本,因此不能將其視為有監(jiān)督的。在強(qiáng)化學(xué)習(xí)方法中,系統(tǒng)不斷地與環(huán)境進(jìn)行交互以尋求產(chǎn)生期望的行為,并從環(huán)境中獲取反饋。
劃分機(jī)器學(xué)習(xí)方法的另一種方式是根據(jù)它們處理的數(shù)據(jù)類型進(jìn)行分類。接收靜態(tài)標(biāo)記數(shù)據(jù)的系統(tǒng)稱為靜態(tài)學(xué)習(xí)方法。處理隨時(shí)間不斷變化的數(shù)據(jù)的系統(tǒng)稱為動(dòng)態(tài)方法。每種方法都可以是有監(jiān)督的,也可以是無監(jiān)督的,但是,強(qiáng)化學(xué)習(xí)方法始終是動(dòng)態(tài)的。
靜態(tài)學(xué)習(xí)是指對(duì)作為單個(gè)快照獲取的數(shù)據(jù)進(jìn)行學(xué)習(xí),并且數(shù)據(jù)的屬性隨時(shí)間保持不變。一旦在數(shù)據(jù)上訓(xùn)練了模型(使用監(jiān)督學(xué)習(xí)或無監(jiān)督學(xué)習(xí)),就可以在將來的任何時(shí)間將訓(xùn)練后的模型應(yīng)用于類似的數(shù)據(jù),而且該模型仍然有效,并將按預(yù)期執(zhí)行。典型的例子是不同動(dòng)物的圖像分類。
這也稱為基于時(shí)間序列的學(xué)習(xí)。這類問題中的數(shù)據(jù)對(duì)時(shí)間敏感,會(huì)隨著時(shí)間不斷變化。因此,模型訓(xùn)練不是一個(gè)靜態(tài)的過程,而是需要不斷地(或在每個(gè)合理的時(shí)間窗口之后)對(duì)模型進(jìn)行訓(xùn)練,以保持有效。
此類問題的典型例子是天氣預(yù)報(bào)或股票市場(chǎng)預(yù)測(cè)。一年前訓(xùn)練過的模型對(duì)于預(yù)測(cè)明天的天氣或預(yù)測(cè)明天任何股票的價(jià)格將完全無用。兩種類型的根本區(qū)別在于狀態(tài)的概念。在靜態(tài)模型中,模型的狀態(tài)是不變的,而在動(dòng)態(tài)模型中,模型的狀態(tài)是時(shí)間的函數(shù),它在不斷變化。
在處理各種數(shù)據(jù)集時(shí),維數(shù)通常是一個(gè)令人困惑的概念。從物理角度看,維度是空間維度:長(zhǎng)度、寬度和高度。(為了簡(jiǎn)單起見,我們不把時(shí)間當(dāng)作第四維度來深入研究物理學(xué)。)在任何現(xiàn)實(shí)生活的場(chǎng)景中,我們遇到的都不超過這三個(gè)維度。
但是,當(dāng)我們處理用于機(jī)器學(xué)習(xí)的數(shù)據(jù)時(shí),通常有幾十個(gè)、數(shù)百個(gè)甚至更多個(gè)維度。為了理解這些高維度,我們需要研究維度的基本性質(zhì)。
空間維度的定義使得每個(gè)維度都與其他兩個(gè)維度垂直或正交。這種正交性對(duì)于三維空間中的所有點(diǎn)都有唯一表示至關(guān)重要。如果維度不是互相正交的,則空間中的相同點(diǎn)可以具有多種表示形式,并且基于此的整個(gè)數(shù)學(xué)計(jì)算將失敗。
例如,如果我們將三個(gè)坐標(biāo)設(shè)置為長(zhǎng)度、寬度和高度,并具有任意的原點(diǎn)(原點(diǎn)的精確位置僅會(huì)更改坐標(biāo)值,但不會(huì)影響唯一性屬性,因此只要它在整個(gè)計(jì)算過程中保持不變,任何原點(diǎn)的選擇都是可以的。)
坐標(biāo)(0,0,0)標(biāo)記原點(diǎn)本身的位置。坐標(biāo)(1,1,1)將標(biāo)記一個(gè)點(diǎn)空間,該點(diǎn)空間在每個(gè)維度中均距原點(diǎn)1個(gè)單位,并且是唯一的。沒有其他坐標(biāo)系可以表示空間中的相同位置。
現(xiàn)在,讓我們將這個(gè)概念擴(kuò)展到更高的維度。在數(shù)學(xué)上添加更多的維度相對(duì)容易,但是很難在空間上可視化它們。如果我們添加第四個(gè)維度,則它必須與之前的所有三個(gè)維度都正交。在這樣的四維空間中,原點(diǎn)的坐標(biāo)為(0,0,0,0)。三維空間中的點(diǎn)(1,1,1)可以在四維空間中具有坐標(biāo)(1,1,1,0)。
只要確保正交性,就可以保證坐標(biāo)的唯一性。同樣地,我們可以有任意數(shù)量的維度,所有的數(shù)學(xué)計(jì)算仍然成立。
考慮前面描述的鳶尾花數(shù)據(jù)示例。輸入有4個(gè)特征:萼片和花瓣的長(zhǎng)度和寬度。由于這4個(gè)特征相互獨(dú)立,所以它們可以看作是正交的。因此,當(dāng)使用鳶尾花數(shù)據(jù)解決問題時(shí),我們實(shí)際上是在處理四維輸入空間。
即使從數(shù)學(xué)的角度來看,增加任意數(shù)量的維度都是可以的,但是仍然存在一個(gè)問題。隨著維度的增加,數(shù)據(jù)的密度呈指數(shù)下降。
例如,如果我們?cè)谟?xùn)練數(shù)據(jù)中有1000個(gè)數(shù)據(jù)點(diǎn),并且數(shù)據(jù)具有3個(gè)獨(dú)有的特征。假設(shè)所有特征的值在1~10之間。所有這1000個(gè)數(shù)據(jù)點(diǎn)都位于一個(gè)大小為10×10×10的立方體中。因此,密度為1000/1000或每單位立方體1個(gè)樣本。如果有5個(gè)獨(dú)有的特征而不是3個(gè),那么數(shù)據(jù)的密度很快就會(huì)下降到每單位5維立方體0.01個(gè)樣本。
數(shù)據(jù)的密度很重要,因?yàn)?strong>數(shù)據(jù)的密度越高,找到一個(gè)好模型的可能性就越大,模型準(zhǔn)確性的置信度就越高。如果密度很低,則使用該數(shù)據(jù)的訓(xùn)練模型的置信度就會(huì)很低。因此,盡管高維在數(shù)學(xué)上是可以接受的,但是人們需要注意維數(shù),以便能夠開發(fā)出具有高置信度的良好的機(jī)器學(xué)習(xí)模型。
在開發(fā)和應(yīng)用機(jī)器學(xué)習(xí)模型時(shí),總是會(huì)遇到多種可能的解決方案和多種可能的方法來獲得答案。很多時(shí)候,對(duì)于哪種解決方案或哪種方法比其他方法更好,沒有任何理論指導(dǎo)。在這種情況下,奧卡姆剃刀原理的概念(有時(shí)也稱為簡(jiǎn)約原則)可以有效地應(yīng)用。該原理指出:
一個(gè)人不應(yīng)該做出超過最低需求的假設(shè),或者換句話說,當(dāng)一個(gè)解決方案有多種選擇時(shí),最簡(jiǎn)單的方法就是最好的。
這個(gè)原理不完全是一個(gè)定理,不能作為一個(gè)定量規(guī)則或方程來應(yīng)用。但是,在現(xiàn)實(shí)生活中做出這樣的決定時(shí),它是一個(gè)強(qiáng)有力的有效的概念指南。
還需要注意的是,這條規(guī)則創(chuàng)建了一種折中的形式,一方面,我們擁有更多復(fù)雜性形式的信息,另一方面,我們卻擁有更少的簡(jiǎn)單性形式的信息。人們不應(yīng)該過于簡(jiǎn)單化問題,以致丟失一些核心信息。奧卡姆剃刀原理的另一個(gè)衍生方面是更簡(jiǎn)單的解決方案往往具有更多的泛化能力。
在設(shè)計(jì)機(jī)器學(xué)習(xí)系統(tǒng)時(shí),需要注意的另一個(gè)有趣的概念來自Wolpert和Macready的論文,其形式是“沒有免費(fèi)的午餐”定理或優(yōu)化中的NFL定理。該定理實(shí)質(zhì)上指出:
如果一個(gè)算法在某類問題上表現(xiàn)得更好,那么它會(huì)以在其他類別的問題上性能下降的形式付出代價(jià)。換句話說,對(duì)于所有類型的問題,你都無法擁有單一最佳的解決方案。
這個(gè)定理需要更多地作為指導(dǎo)原則而不是定律,因?yàn)樵谒锌赡艿膯栴}類別中,一個(gè)設(shè)計(jì)良好的算法完全有可能勝過其他設(shè)計(jì)不太好的算法。但是,在實(shí)際情況下可以從這個(gè)定理推斷出,我們不能對(duì)所有的問題都采用同一個(gè)解決方案,并期望它在所有的情況下都能很好地工作。
收益遞減規(guī)律通常出現(xiàn)在經(jīng)濟(jì)和商業(yè)場(chǎng)景中。它指出,隨著現(xiàn)有員工人數(shù)的增加,增加更多的員工來完成一項(xiàng)工作開始產(chǎn)生越來越少的收益。
從機(jī)器學(xué)習(xí)的角度來看,這一規(guī)律可以應(yīng)用于特征工程。從給定的數(shù)據(jù)集中,人們只能提取一定數(shù)量的特征,在此之后,性能上的收益開始減少,付出的努力是不值得的。在某些方面,它與奧卡姆剃刀原理一致,并增加了更多的細(xì)節(jié)。
在機(jī)器學(xué)習(xí)開始真正意義上的商業(yè)化之前,很少有其他系統(tǒng)已經(jīng)突破常規(guī)計(jì)算的邊界。其中一個(gè)顯著的應(yīng)用是專家系統(tǒng)。
艾倫·圖靈的定義標(biāo)志著機(jī)器智能被認(rèn)可的時(shí)代的開始,人工智能領(lǐng)域也隨之誕生。然而,在早期(一直到20世紀(jì)80年代),機(jī)器智能或機(jī)器學(xué)習(xí)領(lǐng)域僅限于所謂的專家系統(tǒng)或基于知識(shí)的系統(tǒng)。專家系統(tǒng)領(lǐng)域的頂尖專家之一,Edward Feigenbaum博士,曾經(jīng)這樣定義專家系統(tǒng):
一種智能計(jì)算機(jī)程序,使用知識(shí)和推理過程來解決很難解決的以至于需要大量的人類專業(yè)知識(shí)才能解決的問題。
這種系統(tǒng)能夠替代某些領(lǐng)域的專家。這些機(jī)器經(jīng)過編程,用于執(zhí)行基于復(fù)雜邏輯運(yùn)算的復(fù)雜啟發(fā)式任務(wù)。
盡管這些系統(tǒng)能夠取代特定領(lǐng)域的專家,但如果我們將其與人類智能進(jìn)行比較,就會(huì)發(fā)現(xiàn)它們并不是真正意義上的“智能”系統(tǒng)。原因是系統(tǒng)被“硬編碼”為僅解決特定類型的問題,如果需要解決一個(gè)更簡(jiǎn)單但完全不同的問題,這些系統(tǒng)將很快變得完全無用。
盡管如此,這些系統(tǒng)還是非常流行和成功的,特別是在需要重復(fù)但高度精確的性能的領(lǐng)域,例如診斷、檢查、監(jiān)測(cè)和控制。
聯(lián)系客服