中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
第四次工業(yè)革命:人工智能(AI)入門

“過去10年我們在忙于打造移動為先的世界。未來10年,我們將步入AI為先的世界?!保ü雀鐲EO Sundar Pichai,2016年10月)

相關(guān)廠商內(nèi)容

如何更敏捷的使用 Golang 開發(fā)微服務(wù)

相關(guān)贊助商

QCon北京2017,4月16-18日,北京·國家會議中心,精彩內(nèi)容搶先看

從亞馬遜到Facebook,再到谷歌和微軟,全球最頂尖、最有影響力的技術(shù)公司都將目光轉(zhuǎn)向了人工智能(AI)。AI到底是什么?為何如此重要?為何現(xiàn)在變得重要?雖然人們對AI的關(guān)注與日俱增,但對該領(lǐng)域有著充分理解的依然僅僅只是業(yè)內(nèi)專家。本文意在讓更多人了解這一重要的前沿領(lǐng)域。

本文首先會介紹“AI”的含義以及包括“機器學(xué)習(xí)”在內(nèi)的一些關(guān)鍵詞。我們將介紹“深度學(xué)習(xí)”這一最有成效的AI分支是如何實現(xiàn)的。同時還會介紹AI試圖解決的問題以及這些問題的重要性。最后,我們還將深入介紹為何早在二十世紀(jì)五十年代就已誕生的AI這一概念直到今天才開始逐漸成熟。

作為風(fēng)險投資人,我們需要緊跟能為消費者和企業(yè)創(chuàng)造價值的新興趨勢。我們認(rèn)為AI是計算領(lǐng)域的一次革命,其重要性甚至遠遠超過移動或云計算?!斑@實在難以用言語表達,”亞馬遜CEO Jeff Bezos寫道:“未來20年里,人工智能對全社會產(chǎn)生的影響將大到難以想象?!毕M疚目梢云瞥鞣N喧囂炒作,向消費者或企業(yè)高管,以及創(chuàng)業(yè)者和投資人解釋這一新興趨勢如此重要的原因。

1. AI是什么?

人工智能:研究智能程序的科學(xué)

“人工智能(AI)”這個詞由達特茅斯大學(xué)助理教授John McCarthy在1956年提出,作為一種統(tǒng)稱,AI可用于指代可體現(xiàn)出智能行為的硬件或軟件。按照McCarthy教受的說法,這是一種“可以制造出智能的機器,尤其是智能的計算機程序的科學(xué)和工程?!?/p>

最基本的AI早在幾十年前就已誕生,當(dāng)時的AI可通過基于規(guī)則的程序,在某些特定情境中體現(xiàn)出最基本的“智能”。然而這類技術(shù)的發(fā)展一直受到各種限制,因為足以應(yīng)對現(xiàn)實世界中各種問題所需的算法實在是太過復(fù)雜,很難由人工編程的方式實現(xiàn)。

這里所謂的復(fù)雜的活動包括做出醫(yī)學(xué)診斷、預(yù)測機器故障時間或衡量某些資產(chǎn)的市值,這些行為中往往涉及數(shù)千種數(shù)據(jù)集和大量變量之間的非線性關(guān)系。這種情況下通常難以通過現(xiàn)有數(shù)據(jù)獲得最佳效果,即對我們的預(yù)測進行“優(yōu)化”。對于其他一些情況,例如識別圖片中的物體以及翻譯語言,此時我們甚至無法開發(fā)出用于描述所需“功能”的規(guī)則。例如,我們該如何通過編寫一系列規(guī)則,使得程序能在任何情況下描述出一只狗的外觀?

如果能將做出各種復(fù)雜預(yù)測的困難工作,即數(shù)據(jù)優(yōu)化特征(Feature)規(guī)范?,從程序員身上轉(zhuǎn)嫁給程序,情況又會怎樣?這正是現(xiàn)代化人工智能帶給我們的承諾。

機器學(xué)習(xí):承擔(dān)優(yōu)化任務(wù)

機器學(xué)習(xí)(ML)是AI的一個子集。所有機器學(xué)習(xí)都是AI,但并非所有AI都是機器學(xué)習(xí)(圖上圖1)。當(dāng)今人們對AI的興趣主要體現(xiàn)在對機器學(xué)習(xí)技術(shù)的關(guān)注中,使得這一技術(shù)快速獲得了顯著進步。

機器學(xué)習(xí)使得我們可以將某些沉重的工作交給算法處理,進而解決相對于人類來說過于復(fù)雜的問題。AI分支的先驅(qū)Arthur Samuel在1959年曾經(jīng)寫到,機器學(xué)習(xí)是“一種能夠讓計算機在無須進行有針對性的編程情況下,自行獲得學(xué)習(xí)能力的學(xué)科領(lǐng)域?!?/p>

大部分機器學(xué)習(xí)技術(shù)的目標(biāo)在于針對特定用例開發(fā)一種預(yù)測引擎。算法負責(zé)接收有關(guān)特定領(lǐng)域(例如某人過去看過的所有電影)的信息,通過對輸入的信息進行權(quán)衡做出有用的預(yù)測(此人未來觀看其他種類電影的可能性)。通過實現(xiàn)讓“計算機自行學(xué)習(xí)的能力”,我們可以將優(yōu)化方面的任務(wù),即對可用數(shù)據(jù)中的不同變量進行權(quán)衡,進而面向未來做出精確的預(yù)測,交給算法負責(zé)。有時候甚至可以更進一步,將“需要考慮的未來”這種初步?jīng)Q策也交給程序處理。

機器學(xué)習(xí)算法可通過訓(xùn)練進行學(xué)習(xí)。最開始,可以為算法提供輸出結(jié)果為已知的樣本數(shù)據(jù),并將實際結(jié)果與預(yù)測結(jié)果的差異進行對比,隨后對所輸入內(nèi)容的權(quán)重進行調(diào)優(yōu),借此改善預(yù)測結(jié)果的精確度,直到最終獲得優(yōu)化。因此機器學(xué)習(xí)算法的界定性征(Defining characteristic)就在于通過經(jīng)驗對預(yù)測結(jié)果進行改善所能取得的質(zhì)量。我們提供的數(shù)據(jù)越多(通常大到某種臨界點),就能創(chuàng)建出越好的預(yù)測引擎(如下圖2和圖3,需要注意,所需數(shù)據(jù)集的規(guī)模嚴(yán)重取決于具體情境,但無法從下列范例中加以概括。)

目前機器學(xué)習(xí)方法已經(jīng)超過15種,每種都可以使用不同的算法結(jié)構(gòu)通過收到的數(shù)據(jù)對預(yù)測進行優(yōu)化。作為其中的一種方法,“深度學(xué)習(xí)”在很多全新領(lǐng)域?qū)崿F(xiàn)了突破性的結(jié)果,下文將詳細介紹。算法其實還有很多,其他算法雖然不像深度學(xué)習(xí)那樣獲得了最為廣泛的關(guān)注,但也有自己的價值,因為可以適用于更廣泛的用例中。除了深度學(xué)習(xí),其他最實用的機器學(xué)習(xí)算法還包括:

  • Random forests(隨機叢林)”,通過創(chuàng)建大量決策樹對預(yù)測進行優(yōu)化;
  • Bayesian networks(貝葉斯網(wǎng)絡(luò))”,使用基于概率的方法分析變量和變量之間的關(guān)系,以及
  • 支持向量機(Vector machine)”,可通過多種分類樣本并創(chuàng)建模型將新的輸入內(nèi)容分配給某一分類。

每種方法各有利弊,并能混合使用(一種“綜合”方法)。針對特定問題選擇哪種算法,主要取決于各種因素,包括可用數(shù)據(jù)集的本質(zhì)特征等。實際上開發(fā)者通常趨向于通過多種實驗確定最佳算法。

機器學(xué)習(xí)技術(shù)的用例因具體需求和想象力而各不相同。只要有合適的數(shù)據(jù),我們就可以為無數(shù)用途構(gòu)建所需的算法,例如:根據(jù)購買記錄推薦顧客可能愿意購買的產(chǎn)品,預(yù)測汽車組裝流水線上的機械手什么時候會故障,預(yù)測郵件地址是否輸入有誤,估算某筆信用卡交易存在欺詐情況的可能性等。

深度學(xué)習(xí):開始處理特征規(guī)范

就算借助通用用途的機器學(xué)習(xí)(隨機叢林、貝葉斯網(wǎng)絡(luò)、支持向量機等),編寫能良好執(zhí)行某類任務(wù)的程序這也是一項困難的工作,從語言的理解到圖片中物體的識別不出其外。為什么?因為我們無法用足夠?qū)嵱貌⑶铱煽康姆绞矫鞔_指定所要優(yōu)化的特征。舉例來說,如果希望編寫能識別車輛圖片的計算機程序,我們根本不能通過為算法指定車輛特征的方式確保在任何情況下均能獲得正確的識別結(jié)果。車輛有著不同的外形、尺寸和顏色,車輛的位置、朝向以及具體形態(tài)也多種多樣。背景、光照,以及眾多其他因素都會對物體的外觀產(chǎn)生影響。此時若要編寫規(guī)則,需要考慮的變化實在是太多了。就算可以做到這一切,整個解決方案的縮放能力也會受到極大限制:我們必須為打算識別的每個類型的物體分別編寫一套程序。

擁抱深度學(xué)習(xí)(DL)吧,該技術(shù)讓人工智能領(lǐng)域產(chǎn)生了脫胎換骨的革新。深度學(xué)習(xí)是機器學(xué)習(xí)的一個子集,也是超過15種不同方法之一。所有深度學(xué)習(xí)均為機器學(xué)習(xí),但并非所有機器學(xué)習(xí)均為深度學(xué)習(xí)(見下圖4)。

深度學(xué)習(xí)很有用,避免了程序員不得不自行處理特征規(guī)范(定義要在數(shù)據(jù)種分析的特征)或優(yōu)化(如何對數(shù)據(jù)進行權(quán)衡以提供更精確的預(yù)測)的麻煩,這些可交給算法來做。

這是如何實現(xiàn)的?深度學(xué)習(xí)的突破之處在于對大腦,而非整個世界進行建模。人類的大腦會學(xué)著做各種困難的事,例如理解語音和識別物體,這并不是通過事無巨細的規(guī)則實現(xiàn)的,而是通過各種實踐和反饋實現(xiàn)。孩提時期,我們會逐漸開始探索整個世界(例如看到一張汽車的圖片),做出預(yù)測(“看,汽車!”),并收到反饋(“你說的沒錯!”)。并不需要各種瑣碎的規(guī)則,我們可以通過訓(xùn)練自行學(xué)習(xí)。

深度學(xué)習(xí)使用了類似的方法。人工制造的僅僅是基于軟件的計算器,借此模擬出與大腦中神經(jīng)元相互連接后所實現(xiàn)的類似功能。通過這種計算機組成一個“神經(jīng)網(wǎng)絡(luò)”,接受輸入(繼續(xù)上文的例子,一張汽車的圖片),對輸入的內(nèi)容進行分析進而做出判斷,并了解自己的判斷是否正確。如果輸出結(jié)果是錯誤的,將由算法對神經(jīng)元之間的連接進行調(diào)教,進而改變后續(xù)的預(yù)測。最初這個網(wǎng)絡(luò)可能會經(jīng)常犯錯,但隨著我們向TA提供數(shù)百萬個樣本,神經(jīng)元之間的連接將獲得調(diào)優(yōu),使得整個神經(jīng)網(wǎng)絡(luò)能在幾乎所有情況下做出正確的判斷。實踐出(近似的)真知。

通過這種過程,隨著效果日漸好轉(zhuǎn),現(xiàn)在我們已經(jīng)可以:

  • 識別圖片中的元素;
  • 實時進行兩種語言的互譯;
  • 通過語音命令控制設(shè)備(例如蘋果的Siri、Google Now、亞馬遜Alexa,以及微軟小娜);
  • 預(yù)測基因變異對DNA轉(zhuǎn)錄的影響;
  • 分析客戶評論中的情緒;
  • 檢測醫(yī)療影像中的腫瘤等。

深度學(xué)習(xí)并不能用來解決所有問題。這種方式通常需要用極大量的數(shù)據(jù)集進行訓(xùn)練。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和運行需要投入大量計算處理能力,此外這種方法還存在“可解釋性”方面的問題:可能很難知道某個神經(jīng)網(wǎng)絡(luò)的預(yù)測能力是如何發(fā)展起來的。但因為能將開發(fā)者從復(fù)雜的特征規(guī)范任務(wù)中解脫出來,深度學(xué)習(xí)已經(jīng)可以為各種重要問題提供非常成功的預(yù)測引擎。因此深度學(xué)習(xí)已經(jīng)成為AI開發(fā)者手中一款強大的利器。

2. 深度學(xué)習(xí)是如何工作的?

鑒于其重要性,我們有必要對深度學(xué)習(xí)的工作原理有所簡單理解。深度學(xué)習(xí)需要使用人造的“神經(jīng)網(wǎng)絡(luò)”,這是一種相互連接的“神經(jīng)元”(基于軟件的計算器)的集合。

人造的神經(jīng)元可以接受一種或多種輸入。神經(jīng)元會針對輸入結(jié)果執(zhí)行數(shù)學(xué)運算,并產(chǎn)生可輸出的結(jié)果。輸出的結(jié)果取決于每類輸入的“權(quán)重”以及神經(jīng)元的“輸入-輸出函數(shù)”配置(見下圖5)。輸入-輸出函數(shù)各異。神經(jīng)元可以是:

  • 一種線性單位(Linear unit),輸出結(jié)果與輸入總權(quán)重成比例;
  • 一種閾值單位(Threshold unit),輸出結(jié)果為兩個級別中的一種,取決于總輸入是否高于某一特定值;或
  • 是一種S形單位(Sigmoid unit),輸出結(jié)果頻繁變化,而不像輸入那樣呈線性變化的態(tài)勢。

多個神經(jīng)元相互連接組成了神經(jīng)網(wǎng)絡(luò),一個神經(jīng)元的輸出可以成為另一個神經(jīng)元的輸入(見下圖6)。

神經(jīng)網(wǎng)絡(luò)可通過組織整理呈現(xiàn)為多層次神經(jīng)元(這也是“深度”這個詞的由來)。其中“輸入層”負責(zé)接收將由網(wǎng)絡(luò)處理的信息,例如一組圖片。“輸出層”負責(zé)提供結(jié)果。輸入和輸出層之間還有“隱藏層”,大部分活動均在這一層中發(fā)生。通常來說,神經(jīng)網(wǎng)絡(luò)上每一層神經(jīng)元的輸出內(nèi)容均可成為下一層神經(jīng)元的輸入內(nèi)容之一(見下圖7)。

用圖像識別算法作為例子來看看吧。假設(shè)要識別圖片中的人臉。將數(shù)據(jù)裝入神經(jīng)網(wǎng)絡(luò)后,第一層負責(zé)識別局部對比模式,例如圖片邊緣,這是一種“底層”特征。隨著圖片在整個網(wǎng)絡(luò)中流動,逐漸提取出“高層”特征,例如從邊緣到鼻子,再從鼻子到面孔(見下圖8)。

在輸出層方面,根據(jù)訓(xùn)練效果,神經(jīng)網(wǎng)絡(luò)會就圖片是每種特定類型的可能性給出概率(人臉:97%;氣球:2%;樹葉:1%)。

通常來說,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程需要使用大量已經(jīng)進行過分類的樣本。隨后算法會通過檢測出的錯誤和神經(jīng)元之間的連接權(quán)重進行調(diào)整,借此改善效果。優(yōu)化過程的重復(fù)性極高,訓(xùn)練完成后即可部署系統(tǒng)并對未分類圖片進行評估。

上文描述的是一種很簡單的神經(jīng)網(wǎng)絡(luò),實際上神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可能各異,并且大部分都非常復(fù)雜。各種常見變體包括:同層神經(jīng)元之間的不同連接,每層神經(jīng)元數(shù)量的變化,以及將神經(jīng)元的輸出結(jié)果流向前一層網(wǎng)絡(luò)(“遞歸”神經(jīng)網(wǎng)絡(luò))的連接。

神經(jīng)網(wǎng)絡(luò)的設(shè)計和完善需要投入相當(dāng)多的技能。例如針對特定應(yīng)用調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),提供適宜的訓(xùn)練數(shù)據(jù)集,根據(jù)進展調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),以及多種方法的混合使用等。

3. 為何AI如此重要?

AI如此重要,原因在于這種技術(shù)可以順利解決以往看來極為困難的問題,而這些問題的解決方案能夠應(yīng)用于關(guān)乎人類福祉的重要領(lǐng)域:健康、教育、商業(yè)、運輸、公共事業(yè)、娛樂…… 自二十世紀(jì)五十年代開始,人們對AI的研究主要側(cè)重于下列五大領(lǐng)域的“查詢”:

  1. 推論(Reasoning):通過邏輯推理解決問題的能力。
  2. 知識(Knowledge):運用人類知識的能力(了解現(xiàn)實世界中的某些實體、事件以及情況,并了解到這些元素有不同的屬性,并且這些元素可以進行分類)。
  3. 規(guī)劃(Planning):設(shè)置并實現(xiàn)目標(biāo)的能力(世界存在一種特定的未來預(yù)期狀態(tài),以及通過采取一系列行動最終推動世界向著這種狀態(tài)發(fā)展的結(jié)果)。
  4. 交流(Communication):理解書面和口頭語言的能力。
  5. 感知(Perception):通過視覺圖像、聲音和其他傳感器輸入推演出世間物件的能力。

AI蘊含著重大的價值,因為在很多情境下,這些能力方面取得的最新進展往往能催生出顛覆性(Revolutionary),而不僅僅是逐漸演變而來(Evolutionary)的其他能力。例如下文列舉了AI的部分(遠非全部)應(yīng)用范例:

  1. 推論:法律評估、金融資產(chǎn)管理、金融應(yīng)用處理、游戲、自主武器系統(tǒng)。
  2. 知識:醫(yī)學(xué)診斷、藥品研發(fā)、媒體推薦、購買預(yù)測、金融市場交易、欺詐檢測。
  3. 規(guī)劃:物流、調(diào)度、導(dǎo)航、物理和數(shù)字化網(wǎng)絡(luò)優(yōu)化、預(yù)防式維護、需求預(yù)測、庫存管理。
  4. 交流:語音控制、智能代理/助理/客戶支持、實時翻譯書面和口頭語言、文字實時轉(zhuǎn)錄。
  5. 感知:自動駕駛機動車、醫(yī)學(xué)診斷、安防監(jiān)控。

未來幾年里,機器學(xué)習(xí)能力將被運用于幾乎所有領(lǐng)域的各種過程中。以企業(yè)中的某一個職能為例,例如公司內(nèi)部的人力資源(HR)活動,即可在下列不同過程中運用機器學(xué)習(xí)技術(shù):

  • 通過更完善的目標(biāo)定位、更智能的崗位匹配,以及部分程度上自動化實現(xiàn)的評估改善人員招募過程;
  • 通過對個人需求和可能出現(xiàn)的缺席進行預(yù)測式規(guī)劃,改善員工管理能力;
  • 通過向員工提供更有針對性的培訓(xùn)內(nèi)容建議,實現(xiàn)更有效的員工學(xué)習(xí)活動;以及
  • 通過預(yù)測重要員工可能存在離職風(fēng)險降低員工流失率。

隨著時間的發(fā)展,我們期待著機器學(xué)習(xí)能變成常態(tài)。機器學(xué)習(xí)遲早會成為開發(fā)者人手必備的工具,最初也許只能對現(xiàn)有過程進行改善,但有朝一日將實現(xiàn)徹底的革新。

機器學(xué)習(xí)的深遠影響遠遠勝過這些直接產(chǎn)生的影響。深度學(xué)習(xí)已經(jīng)讓計算機視覺獲得了突飛猛進的提高,例如目前的自動駕駛機動車(轎車和卡車)均已變?yōu)楝F(xiàn)實。但會產(chǎn)生怎樣的影響?以目前的英國為例,90%的人員和80%的貨物運輸是在道路上進行的,僅自動駕駛機動車本身就能產(chǎn)生下列影響:

  • 安全性(90%的機動車事故源于駕駛員注意力不集中);
  • 就業(yè)(英國的貨運和物流行業(yè)員工總數(shù)為220萬人,年薪總和約為570億英鎊);
  • 保險(Autonomous Research預(yù)計經(jīng)過一段時間后英國的機動車保險保費總額將減少63%);
  • 經(jīng)濟(消費者更愿意按需獲得交通服務(wù),而非自行購置機動車);
  • 機動車生產(chǎn)量、城市規(guī)劃、規(guī)章制度……

4. 為何AI直到今天才開始成熟?

有關(guān)AI的研究始于二十世紀(jì)五十年代,經(jīng)歷過數(shù)次虛假的“黎明期”后,為何現(xiàn)在才迎來拐點?由于新算法的陸續(xù)完善,所適用數(shù)據(jù)的大幅豐富,用于訓(xùn)練的硬件日益強大,以及云服務(wù)對開發(fā)者接受度的逐漸催化,AI的實際運用效果在近些年有了大幅改進。

1. 算法的改進

雖然深度學(xué)習(xí)算不上一種新技術(shù)(早在1965年就有人提出了第一個實際有效的多層神經(jīng)網(wǎng)絡(luò)規(guī)范?),但最近十年來深度學(xué)習(xí)算法的革新催生出了截然不同的結(jié)果。

識別圖像中物體的能力隨著卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolutional Neural Network)的發(fā)展產(chǎn)生了突飛猛進的提高(如下圖9)。受到動物視覺腦皮層工作原理啟發(fā)設(shè)計而來的CNN中,神經(jīng)網(wǎng)絡(luò)中的每一層均可充當(dāng)判斷特定模式是否存在所用的篩選器。2015年,微軟基于CNN的計算機視覺系統(tǒng)在對圖片中物體進行識別方面實現(xiàn)了比人類更高的準(zhǔn)確度(計算機:95.1%;人類:94.9%)?!皳?jù)我們所知,”他們寫到:“我們的測試結(jié)果是計算機戰(zhàn)勝人類的首例。”CNN還可應(yīng)用于視頻和語音識別等更廣泛的領(lǐng)域。

與此同時,隨著遞歸神經(jīng)網(wǎng)絡(luò)(RNN,Recurrent Neural Network)的誕生,語音和手寫識別方面也取得了飛速進展(見下圖10)。不同于卷積神經(jīng)網(wǎng)絡(luò)僅“向下饋送”的運作方式,RNN可通過反饋連接讓數(shù)據(jù)呈環(huán)路流動。RNN還出現(xiàn)了一種更強大的新類型:長短期記憶(LSTM,Long Short-Term Memory)模型。在額外的連接和內(nèi)存“細胞(Cell)”的幫助下,RNN可以“記住”自己在數(shù)千步操作之前看到的數(shù)據(jù),并使用這些數(shù)據(jù)對后續(xù)需要關(guān)注的內(nèi)容進行解釋:這一特性對語音識別產(chǎn)生了巨大的幫助,因為對下一個詞的理解通常會受到之前所處理詞匯的影響。從2012年開始,谷歌就在使用LSTM驅(qū)動Android中的語音識別系統(tǒng)。就在六周前,微軟工程師稱他們的系統(tǒng)實現(xiàn)了低至5.9%的單詞錯誤率,這是有史以來首次接近人類能力的水平。

2. 專用硬件

圖形處理器(GPU)是一種特殊設(shè)計的電子電路,可大幅縮短為深度學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需的時間。

現(xiàn)代化的GPU最初誕生于二十世紀(jì)九十年代末,當(dāng)時主要是為了為3D游戲和3D開發(fā)應(yīng)用程序進行加速。在3D環(huán)境中平移或縮放鏡頭需要重復(fù)用到一種名為矩陣計算的數(shù)學(xué)運算過程,串行架構(gòu)的微處理器,包括當(dāng)今大部分計算機所用的CPU很不適合用來處理此類任務(wù)。為了更高效地執(zhí)行矩陣計算,GPU通常會使用大規(guī)模并行架構(gòu)來制造(Nvidia M40包含3,072個內(nèi)核)。

神經(jīng)網(wǎng)絡(luò)的訓(xùn)練會涉及大量矩陣計算。因此人們發(fā)現(xiàn)原本針對3D游戲設(shè)計的GPU其實很適合用來對深度學(xué)習(xí)過程加速。這樣做獲得了巨大的收效:一顆GPU即可讓神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間縮短5倍,針對一些比較大規(guī)模的問題甚至可實現(xiàn)10倍甚至更高的加速。在配合針對深度學(xué)習(xí)框架進行優(yōu)化的軟件開發(fā)工具包之后,甚至還可以進一步加快訓(xùn)練速度(見下圖11)。

3. 廣博的數(shù)據(jù)

深度學(xué)習(xí)所用的神經(jīng)網(wǎng)絡(luò)通常需要用大量數(shù)據(jù)集進行訓(xùn)練,樣本數(shù)量從數(shù)千起步,甚至可高達數(shù)百萬。好在數(shù)據(jù)的創(chuàng)建速度和可用性也經(jīng)歷了指數(shù)形式的增長。今天,隨著我們步入“第三波”數(shù)據(jù)時代,人類平均每天會生成2.2EB(23億GB)數(shù)據(jù),全球數(shù)據(jù)總量中有90%是過去24個月內(nèi)創(chuàng)建的。

“第一波”的數(shù)據(jù)創(chuàng)建時代始于二十世紀(jì)八十年代,當(dāng)時創(chuàng)建的主要是文檔和事務(wù)數(shù)據(jù),這一時期還在可聯(lián)網(wǎng)臺式計算機的普及過程中獲得了催化。隨后“第二波”數(shù)據(jù)時代,在可聯(lián)網(wǎng)智能手機的推動下,誕生了大量非結(jié)構(gòu)化媒體數(shù)據(jù)(郵件、照片、音樂、視頻)、Web數(shù)據(jù),以及各種元數(shù)據(jù)。今天我們正在步入數(shù)據(jù)的“第三個時代”,工業(yè)設(shè)施和家庭中部署的機器傳感器創(chuàng)造了更多監(jiān)視用數(shù)據(jù)、分析用數(shù)據(jù),以及更多元數(shù)據(jù)。

考慮到今天我們所創(chuàng)建的大部分?jǐn)?shù)據(jù)都會通過互聯(lián)網(wǎng)傳輸,日益膨脹的互聯(lián)網(wǎng)流量也開始充當(dāng)人類海量數(shù)據(jù)生成過程中的代理。1992年,全人類每天平均傳輸100GB數(shù)據(jù),但到2020年,我們將每秒傳輸61,000GB數(shù)據(jù)(見下圖12,請注意尺度的變化)。

除了通用數(shù)據(jù)的富足,專用數(shù)據(jù)資源也在機器學(xué)習(xí)的推動下與日俱增。例如ImageNet是一個免費提供的數(shù)據(jù)庫,其中已經(jīng)包含超過1千萬張手工分類的圖片。該資源的誕生也對深度學(xué)習(xí)算法物體分類能力的發(fā)展起到了推波助瀾的效果。

4. 云服務(wù)

開發(fā)者對機器學(xué)習(xí)的運用還受到云端機器學(xué)習(xí)基礎(chǔ)架構(gòu)和業(yè)界領(lǐng)先云供應(yīng)商所提供服務(wù)的推動。

谷歌、亞馬遜、微軟,以及IBM均提供了云端基礎(chǔ)架構(gòu)(用于構(gòu)建和迭代模型的環(huán)境,提供可縮放“GPU即服務(wù)”產(chǎn)品,并提供其他相關(guān)托管服務(wù)),這也使得機器學(xué)習(xí)能力的開發(fā)成本和難度大幅降低。

此外他們還提供了正在飛速發(fā)展的一系列云端機器學(xué)習(xí)服務(wù),開發(fā)者可將其(從圖像識別到語言翻譯)直接用于自己的應(yīng)用程序內(nèi)。谷歌的機器學(xué)習(xí)服務(wù)針對下列領(lǐng)域提供了易于訪問的服務(wù):視覺(物體識別、顯性內(nèi)容檢測、人臉檢測、圖像情緒分析);語音(語音識別和語音到文字轉(zhuǎn)換);文字分析(實體識別、情緒分析、語言檢測和翻譯);以及職員工作搜索(機會呈現(xiàn)和基于資歷的匹配)。微軟認(rèn)知服務(wù)也提供了涵蓋視覺、語音、語言、知識和搜索等領(lǐng)域的超過21種服務(wù)。

5. 興趣和創(chuàng)業(yè)者

公眾對AI的興趣在過去五年里增加了六倍(見下圖13),風(fēng)投公司對AI公司的注資金額也有了顯著增長(見下圖14)。我們已經(jīng)進入了一種良性循環(huán)的境地,機器學(xué)習(xí)的進一步發(fā)展正在繼續(xù)吸引投資、創(chuàng)業(yè)者,以及社會各界的關(guān)注。尤其是后者,對機器學(xué)習(xí)的未來發(fā)展意義重大。

5. 接下來會怎樣?

機器學(xué)習(xí)能帶來數(shù)量眾多、意義重大的收益。很多收益是看得見的,從無人駕駛機動車到新的人機交互方式等。還有一些收益雖然不那么明顯,但也會對日常業(yè)務(wù)流程和消費者服務(wù)提供更強大的能力和效率。

與任何范式轉(zhuǎn)變過程一樣,有時過高的期望可能會超出短期內(nèi)所能實現(xiàn)的潛力。我們期待著未來某一時刻,人們對AI的幻想能夠徹底幻滅,隨之而來的將會是長期、持續(xù)的價值認(rèn)可,因為機器學(xué)習(xí)已經(jīng)被用于改善并革新現(xiàn)有的系統(tǒng)。

在歷史上,工業(yè)革命曾通過新的電力和傳送方式改變了生產(chǎn)和交流方法。第一次工業(yè)革命在十八世紀(jì)八十年代使用蒸汽機驅(qū)動了機械化的生產(chǎn)過程;第二次工業(yè)革命在十九世紀(jì)七十年代使用電力推動了商品的大規(guī)模量產(chǎn);第三次工業(yè)革命在二十世紀(jì)七十年代使用電子和軟件技術(shù)實現(xiàn)了生產(chǎn)和交流的自動化。今天,隨著軟件逐漸“蠶食”整個世界,我們創(chuàng)造價值的主要來源已成為信息本身的處理。通過用更智能的方式完成這樣的工作,機器學(xué)習(xí)將低調(diào)地為我們帶來效益和歷史意義。

作者:David Kelnar,閱讀英文原文:The fourth industrial revolution: a primer on Artificial Intelligence (AI)


感謝朱昊冰對本文的審校。

給InfoQ中文站投稿或者參與內(nèi)容翻譯工作,請郵件至editors@cn.infoq.com。也歡迎大家通過新浪微博(@InfoQ,@丁曉昀),微信(微信號:InfoQChina)關(guān)注我們。


本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
7000字深度長文丨AI深處令人恐懼的陰暗秘密
終于有人說清AI、機器學(xué)習(xí)與深度學(xué)習(xí)的區(qū)別了!
深度學(xué)習(xí) | 簡析深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法的基本思路
AI 人工智能的深度學(xué)習(xí)(3月16日文章)
人工智能、機器學(xué)習(xí)、深度學(xué)習(xí),終于弄懂了……
人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)的介紹和發(fā)展
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服