【編者按】三大牛Yann LeCun、Yoshua Bengio和Geoffrey Hinton在深度學(xué)習(xí)領(lǐng)域的地位無(wú)人不知。為紀(jì)念人工智能提出60周年，最新的《Nature》雜志專門開(kāi)辟了一個(gè)“人工智能 + 機(jī)器人”專題，發(fā)表多篇相關(guān)論文，其中包括了Yann LeCun、Yoshua Bengio和Geoffrey Hinton首次合作的這篇綜述文章“Deep Learning”。本文為該綜述文章中文譯文的下半部分，詳細(xì)介紹了CNN、分布式特征表示、RNN及其不同的應(yīng)用，并對(duì)深度學(xué)習(xí)技術(shù)的未來(lái)發(fā)展進(jìn)行展望。

卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)被設(shè)計(jì)用來(lái)處理到多維數(shù)組數(shù)據(jù)的，比如一個(gè)有3個(gè)包含了像素值2-D圖像組合成的一個(gè)具有3個(gè)顏色通道的彩色圖像。很多數(shù)據(jù)形態(tài)都是這種多維數(shù)組的：1D用來(lái)表示信號(hào)和序列包括語(yǔ)言，2D用來(lái)表示圖像或者聲音，3D用來(lái)表示視頻或者有聲音的圖像。卷積神經(jīng)網(wǎng)絡(luò)使用4個(gè)關(guān)鍵的想法來(lái)利用自然信號(hào)的屬性：局部連接、權(quán)值共享、池化以及多網(wǎng)絡(luò)層的使用。

圖2 卷積神經(jīng)網(wǎng)絡(luò)內(nèi)部

一個(gè)典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)（如圖2）是由一系列的過(guò)程組成的。最初的幾個(gè)階段是由卷積層和池化層組成，卷積層的單元被組織在特征圖中，在特征圖中，每一個(gè)單元通過(guò)一組叫做濾波器的權(quán)值被連接到上一層的特征圖的一個(gè)局部塊，然后這個(gè)局部加權(quán)和被傳給一個(gè)非線性函數(shù)，比如ReLU。在一個(gè)特征圖中的全部單元享用相同的過(guò)濾器，不同層的特征圖使用不同的過(guò)濾器。使用這種結(jié)構(gòu)處于兩方面的原因。首先，在數(shù)組數(shù)據(jù)中，比如圖像數(shù)據(jù)，一個(gè)值的附近的值經(jīng)常是高度相關(guān)的，可以形成比較容易被探測(cè)到的有區(qū)分性的局部特征。其次，不同位置局部統(tǒng)計(jì)特征不太相關(guān)的，也就是說(shuō)，在一個(gè)地方出現(xiàn)的某個(gè)特征，也可能出現(xiàn)在別的地方，所以不同位置的單元可以共享權(quán)值以及可以探測(cè)相同的樣本。在數(shù)學(xué)上，這種由一個(gè)特征圖執(zhí)行的過(guò)濾操作是一個(gè)離線的卷積，卷積神經(jīng)網(wǎng)絡(luò)也是這么得名來(lái)的。

卷積層的作用是探測(cè)上一層特征的局部連接，然而池化層的作用是在語(yǔ)義上把相似的特征合并起來(lái)，這是因?yàn)樾纬梢粋€(gè)主題的特征的相對(duì)位置不太一樣。一般地，池化單元計(jì)算特征圖中的一個(gè)局部塊的最大值，相鄰的池化單元通過(guò)移動(dòng)一行或者一列來(lái)從小塊上讀取數(shù)據(jù)，因?yàn)檫@樣做就減少的表達(dá)的維度以及對(duì)數(shù)據(jù)的平移不變性。兩三個(gè)這種的卷積、非線性變換以及池化被串起來(lái)，后面再加上一個(gè)更多卷積和全連接層。在卷積神經(jīng)網(wǎng)絡(luò)上進(jìn)行反向傳播算法和在一般的深度網(wǎng)絡(luò)上是一樣的，可以讓所有的在過(guò)濾器中的權(quán)值得到訓(xùn)練。

深度神經(jīng)網(wǎng)絡(luò)利用的很多自然信號(hào)是層級(jí)組成的屬性，在這種屬性中高級(jí)的特征是通過(guò)對(duì)低級(jí)特征的組合來(lái)實(shí)現(xiàn)的。在圖像中，局部邊緣的組合形成基本圖案，這些圖案形成物體的局部，然后再形成物體。這種層級(jí)結(jié)構(gòu)也存在于語(yǔ)音數(shù)據(jù)以及文本數(shù)據(jù)中，如電話中的聲音，因素，音節(jié)，文檔中的單詞和句子。當(dāng)輸入數(shù)據(jù)在前一層中的位置有變化的時(shí)候，池化操作讓這些特征表示對(duì)這些變化具有魯棒性。

卷積神經(jīng)網(wǎng)絡(luò)中的卷積和池化層靈感直接來(lái)源于視覺(jué)神經(jīng)科學(xué)中的簡(jiǎn)單細(xì)胞和復(fù)雜細(xì)胞。這種細(xì)胞的是以LNG-V1-V2-V4-IT這種層級(jí)結(jié)構(gòu)形成視覺(jué)回路的。當(dāng)給一個(gè)卷積神經(jīng)網(wǎng)絡(luò)和猴子一副相同的圖片的時(shí)候，卷積神經(jīng)網(wǎng)絡(luò)展示了猴子下顳葉皮質(zhì)中隨機(jī)160個(gè)神經(jīng)元的變化。卷積神經(jīng)網(wǎng)絡(luò)有神經(jīng)認(rèn)知的根源，他們的架構(gòu)有點(diǎn)相似，但是在神經(jīng)認(rèn)知中是沒(méi)有類似反向傳播算法這種端到端的監(jiān)督學(xué)習(xí)算法的。一個(gè)比較原始的1D卷積神經(jīng)網(wǎng)絡(luò)被稱為時(shí)延神經(jīng)網(wǎng)絡(luò)，可以被用來(lái)識(shí)別語(yǔ)音以及簡(jiǎn)單的單詞。

圖2 卷積神經(jīng)網(wǎng)絡(luò)內(nèi)部

20世紀(jì)90年代以來(lái)，基于卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)了大量的應(yīng)用。最開(kāi)始是用時(shí)延神經(jīng)網(wǎng)絡(luò)來(lái)做語(yǔ)音識(shí)別以及文檔閱讀。這個(gè)文檔閱讀系統(tǒng)使用一個(gè)被訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)和一個(gè)概率模型，這個(gè)概率模型實(shí)現(xiàn)了語(yǔ)言方面的一些約束。20世紀(jì)90年代末，這個(gè)系統(tǒng)被用來(lái)美國(guó)超過(guò)10%的支票閱讀上。后來(lái)，微軟開(kāi)發(fā)了基于卷積神經(jīng)網(wǎng)絡(luò)的字符識(shí)別系統(tǒng)以及手寫體識(shí)別系統(tǒng)。20世紀(jì)90年代早期，卷積神經(jīng)網(wǎng)絡(luò)也被用來(lái)自然圖形中的物體識(shí)別，比如臉、手以及人臉識(shí)別（face recognition ）。

使用深度卷積網(wǎng)絡(luò)進(jìn)行圖像理解

21世紀(jì)開(kāi)始，卷積神經(jīng)網(wǎng)絡(luò)就被成功的大量用于檢測(cè)、分割、物體識(shí)別以及圖像的各個(gè)領(lǐng)域。這些應(yīng)用都是使用了大量的有標(biāo)簽的數(shù)據(jù)，比如交通信號(hào)識(shí)別，生物信息分割，面部探測(cè)，文本、行人以及自然圖形中的人的身體部分的探測(cè)。近年來(lái)，卷積神經(jīng)網(wǎng)絡(luò)的一個(gè)重大成功應(yīng)用是人臉識(shí)別。

值得一提的是，圖像可以在像素級(jí)別進(jìn)行打標(biāo)簽，這樣就可以應(yīng)用在比如自動(dòng)電話接聽(tīng)機(jī)器人、自動(dòng)駕駛汽車等技術(shù)中。像Mobileye以及NVIDIA公司正在把基于卷積神經(jīng)網(wǎng)絡(luò)的方法用于汽車中的視覺(jué)系統(tǒng)中。其它的應(yīng)用涉及到自然語(yǔ)言的理解以及語(yǔ)音識(shí)別中。

圖3 從圖像到文字

盡管卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用的很成功，但是它被計(jì)算機(jī)視覺(jué)以及機(jī)器學(xué)習(xí)團(tuán)隊(duì)開(kāi)始重視是在2012年的ImageNet競(jìng)賽。在該競(jìng)賽中，深度卷積神經(jīng)網(wǎng)絡(luò)被用在上百萬(wàn)張網(wǎng)絡(luò)圖片數(shù)據(jù)集，這個(gè)數(shù)據(jù)集包含了1000個(gè)不同的類。該結(jié)果達(dá)到了前所未有的好，幾乎比當(dāng)時(shí)最好的方法降低了一半的錯(cuò)誤率。這個(gè)成功來(lái)自有效地利用了GPU、ReLU、一個(gè)新的被稱為dropout的正則技術(shù)，以及通過(guò)分解現(xiàn)有樣本產(chǎn)生更多訓(xùn)練樣本的技術(shù)。這個(gè)成功給計(jì)算機(jī)視覺(jué)帶來(lái)一個(gè)革命。如今，卷積神經(jīng)網(wǎng)絡(luò)用于幾乎全部的識(shí)別和探測(cè)任務(wù)中。最近一個(gè)更好的成果是，利用卷積神經(jīng)網(wǎng)絡(luò)結(jié)合回饋神經(jīng)網(wǎng)絡(luò)用來(lái)產(chǎn)生圖像標(biāo)題。

如今的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)有10-20層采用ReLU激活函數(shù)、上百萬(wàn)個(gè)權(quán)值以及幾十億個(gè)連接。然而訓(xùn)練如此大的網(wǎng)絡(luò)兩年前就只需要幾周了，現(xiàn)在硬件、軟件以及算法并行的進(jìn)步，又把訓(xùn)練時(shí)間壓縮到了幾小時(shí)。

基于卷積神經(jīng)網(wǎng)絡(luò)的視覺(jué)系統(tǒng)的性能已經(jīng)引起了大型技術(shù)公司的注意，比如Google、Facebook、Microsoft、IBM，yahoo！、Twitter和Adobe等，一些快速增長(zhǎng)的創(chuàng)業(yè)公司也同樣如是。

卷積神經(jīng)網(wǎng)絡(luò)很容易在芯片或者現(xiàn)場(chǎng)可編程門陣列（FPGA）中高效實(shí)現(xiàn)，許多公司比如NVIDIA、Mobileye、Intel、Qualcomm以及Samsung，正在開(kāi)發(fā)卷積神經(jīng)網(wǎng)絡(luò)芯片，以使智能機(jī)、相機(jī)、機(jī)器人以及自動(dòng)駕駛汽車中的實(shí)時(shí)視覺(jué)系統(tǒng)成為可能。

分布式特征表示與語(yǔ)言處理

與不使用分布式特征表示（distributed representations ）的經(jīng)典學(xué)習(xí)算法相比，深度學(xué)習(xí)理論表明深度網(wǎng)絡(luò)具有兩個(gè)不同的巨大的優(yōu)勢(shì)。這些優(yōu)勢(shì)來(lái)源于網(wǎng)絡(luò)中各節(jié)點(diǎn)的權(quán)值，并取決于具有合理結(jié)構(gòu)的底層生成數(shù)據(jù)的分布。首先，學(xué)習(xí)分布式特征表示能夠泛化適應(yīng)新學(xué)習(xí)到的特征值的組合（比如，n元特征就有2ⁿ種可能的組合）。其次，深度網(wǎng)絡(luò)中組合表示層帶來(lái)了另一個(gè)指數(shù)級(jí)的優(yōu)勢(shì)潛能（指數(shù)級(jí)的深度）。

多層神經(jīng)網(wǎng)絡(luò)中的隱層利用網(wǎng)絡(luò)中輸入的數(shù)據(jù)進(jìn)行特征學(xué)習(xí)，使之更加容易預(yù)測(cè)目標(biāo)輸出。下面是一個(gè)很好的示范例子，比如將本地文本的內(nèi)容作為輸入，訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)句子中下一個(gè)單詞。內(nèi)容中的每個(gè)單詞表示為網(wǎng)絡(luò)中的N分之一的向量，也就是說(shuō)，每個(gè)組成部分中有一個(gè)值為1其余的全為0。在第一層中，每個(gè)單詞創(chuàng)建不同的激活狀態(tài)，或單詞向量（如圖4）。在語(yǔ)言模型中，網(wǎng)絡(luò)中其余層學(xué)習(xí)并轉(zhuǎn)化輸入的單詞向量為輸出單詞向量來(lái)預(yù)測(cè)句子中下一個(gè)單詞，可以通過(guò)預(yù)測(cè)詞匯表中的單詞作為文本句子中下一個(gè)單詞出現(xiàn)的概率。網(wǎng)絡(luò)學(xué)習(xí)了包含許多激活節(jié)點(diǎn)的、并且可以解釋為詞的獨(dú)立特征的單詞向量，正如第一次示范的文本學(xué)習(xí)分層表征文字符號(hào)的例子。這些語(yǔ)義特征在輸入中并沒(méi)有明確的表征。而是在利用“微規(guī)則”（‘micro-rules’,本文中直譯為：微規(guī)則）學(xué)習(xí)過(guò)程中被發(fā)掘，并作為一個(gè)分解輸入與輸出符號(hào)之間關(guān)系結(jié)構(gòu)的好的方式。當(dāng)句子是來(lái)自大量的真實(shí)文本并且個(gè)別的微規(guī)則不可靠的情況下，學(xué)習(xí)單詞向量也一樣能表現(xiàn)得很好。利用訓(xùn)練好的模型預(yù)測(cè)新的事例時(shí)，一些概念比較相似的詞容易混淆，比如星期二（Tuesday）和星期三（Wednesday），瑞典（Sweden）和挪威（Norway）。這樣的表示方式被稱為分布式特征表示，因?yàn)樗麄兊脑刂g并不互相排斥，并且他們的構(gòu)造信息對(duì)應(yīng)于觀測(cè)到的數(shù)據(jù)的變化。這些單詞向量是通過(guò)學(xué)習(xí)得到的特征構(gòu)造的，這些特征不是由專家決定的，而是由神經(jīng)網(wǎng)絡(luò)自動(dòng)發(fā)掘的。從文本中學(xué)習(xí)得單詞向量表示現(xiàn)在廣泛應(yīng)用于自然語(yǔ)言中。

圖4 詞向量學(xué)習(xí)可視化

特征表示問(wèn)題爭(zhēng)論的中心介于對(duì)基于邏輯啟發(fā)和基于神經(jīng)網(wǎng)絡(luò)的認(rèn)識(shí)。在邏輯啟發(fā)的范式中，一個(gè)符號(hào)實(shí)體表示某一事物，因?yàn)槠湮ㄒ坏膶傩耘c其他符號(hào)實(shí)體相同或者不同。該符號(hào)實(shí)例沒(méi)有內(nèi)部結(jié)構(gòu)，并且結(jié)構(gòu)與使用是相關(guān)的，至于理解符號(hào)的語(yǔ)義，就必須與變化的推理規(guī)則合理對(duì)應(yīng)。相反地，神經(jīng)網(wǎng)絡(luò)利用了大量活動(dòng)載體、權(quán)值矩陣和標(biāo)量非線性化，來(lái)實(shí)現(xiàn)能夠支撐簡(jiǎn)單容易的、具有常識(shí)推理的快速“直覺(jué)”功能。

在介紹神經(jīng)語(yǔ)言模型前，簡(jiǎn)述下標(biāo)準(zhǔn)方法，其是基于統(tǒng)計(jì)的語(yǔ)言模型，該模型沒(méi)有使用分布式特征表示。而是基于統(tǒng)計(jì)簡(jiǎn)短符號(hào)序列出現(xiàn)的頻率增長(zhǎng)到N（N-grams，N元文法）?？赡艿腘-grams的數(shù)字接近于V^N，其中V是詞匯表的大小，考慮到文本內(nèi)容包含成千上萬(wàn)個(gè)單詞，所以需要一個(gè)非常大的語(yǔ)料庫(kù)。N-grams將每個(gè)單詞看成一個(gè)原子單元，因此不能在語(yǔ)義相關(guān)的單詞序列中一概而論，然而神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型可以，是因?yàn)樗麄冴P(guān)聯(lián)每個(gè)詞與真是特征值的向量，并且在向量空間中語(yǔ)義相關(guān)的詞彼此靠近（圖4）。

遞歸神經(jīng)網(wǎng)絡(luò)

首次引入反向傳播算法時(shí)，最令人興奮的便是使用遞歸神經(jīng)網(wǎng)絡(luò)（recurrent neural networks，下文簡(jiǎn)稱RNNs）訓(xùn)練。對(duì)于涉及到序列輸入的任務(wù)，比如語(yǔ)音和語(yǔ)言，利用RNNs能獲得更好的效果。RNNs一次處理一個(gè)輸入序列元素，同時(shí)維護(hù)網(wǎng)絡(luò)中隱式單元中隱式的包含過(guò)去時(shí)刻序列元素的歷史信息的“狀態(tài)向量”。如果是深度多層網(wǎng)絡(luò)不同神經(jīng)元的輸出，我們就會(huì)考慮這種在不同離散時(shí)間步長(zhǎng)的隱式單元的輸出，這將會(huì)使我們更加清晰怎么利用反向傳播來(lái)訓(xùn)練RNNs（如圖5，右）。

圖5 遞歸神經(jīng)網(wǎng)絡(luò)

RNNs是非常強(qiáng)大的動(dòng)態(tài)系統(tǒng)，但是訓(xùn)練它們被證實(shí)存在問(wèn)題的，因?yàn)榉聪騻鞑サ奶荻仍诿總€(gè)時(shí)間間隔內(nèi)是增長(zhǎng)或下降的，所以經(jīng)過(guò)一段時(shí)間后將導(dǎo)致結(jié)果的激增或者降為零。

由于先進(jìn)的架構(gòu)和訓(xùn)練方式，RNNs被發(fā)現(xiàn)可以很好的預(yù)測(cè)文本中下一個(gè)字符或者句子中下一個(gè)單詞，并且可以應(yīng)用于更加復(fù)雜的任務(wù)。例如在某時(shí)刻閱讀英語(yǔ)句子中的單詞后，將會(huì)訓(xùn)練一個(gè)英語(yǔ)的“編碼器”網(wǎng)絡(luò)，使得隱式單元的最終狀態(tài)向量能夠很好地表征句子所要表達(dá)的意思或思想。這種“思想向量”（thought vector）可以作為聯(lián)合訓(xùn)練一個(gè)法語(yǔ)“編碼器”網(wǎng)絡(luò)的初始化隱式狀態(tài)（或者額外的輸入），其輸出為法語(yǔ)翻譯首單詞的概率分布。如果從分布中選擇一個(gè)特殊的首單詞作為編碼網(wǎng)絡(luò)的輸入，將會(huì)輸出翻譯的句子中第二個(gè)單詞的概率分布，并直到停止選擇為止。總體而言，這一過(guò)程是根據(jù)英語(yǔ)句子的概率分布而產(chǎn)生的法語(yǔ)詞匯序列。這種簡(jiǎn)單的機(jī)器翻譯方法的表現(xiàn)甚至可以和最先進(jìn)的（state-of-the-art）的方法相媲美，同時(shí)也引起了人們對(duì)于理解句子是否需要像使用推理規(guī)則操作內(nèi)部符號(hào)表示質(zhì)疑。這與日常推理中同時(shí)涉及到根據(jù)合理結(jié)論類推的觀點(diǎn)是匹配的。

類比于將法語(yǔ)句子的意思翻譯成英語(yǔ)句子，同樣可以學(xué)習(xí)將圖片內(nèi)容“翻譯”為英語(yǔ)句子（如圖3）。這種編碼器是可以在最后的隱層將像素轉(zhuǎn)換為活動(dòng)向量的深度卷積網(wǎng)絡(luò)（ConvNet）。解碼器與RNNs用于機(jī)器翻譯和神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型的類似。近來(lái)，已經(jīng)掀起了一股深度學(xué)習(xí)的巨大興趣熱潮（參見(jiàn)文獻(xiàn)[86]提到的例子）。

RNNs一旦展開(kāi)（如圖5），可以將之視為一個(gè)所有層共享同樣權(quán)值的深度前饋神經(jīng)網(wǎng)絡(luò)。雖然它們的目的是學(xué)習(xí)長(zhǎng)期的依賴性，但理論的和經(jīng)驗(yàn)的證據(jù)表明很難學(xué)習(xí)并長(zhǎng)期保存信息。

為了解決這個(gè)問(wèn)題，一個(gè)增大網(wǎng)絡(luò)存儲(chǔ)的想法隨之產(chǎn)生。采用了特殊隱式單元的LSTM（long short-termmemory networks）被首先提出，其自然行為便是長(zhǎng)期的保存輸入。一種稱作記憶細(xì)胞的特殊單元類似累加器和門控神經(jīng)元：它在下一個(gè)時(shí)間步長(zhǎng)將擁有一個(gè)權(quán)值并聯(lián)接到自身，拷貝自身狀態(tài)的真實(shí)值和累積的外部信號(hào)，但這種自聯(lián)接是由另一個(gè)單元學(xué)習(xí)并決定何時(shí)清除記憶內(nèi)容的乘法門控制的。

LSTM網(wǎng)絡(luò)隨后被證明比傳統(tǒng)的RNNs更加有效，尤其當(dāng)每一個(gè)時(shí)間步長(zhǎng)內(nèi)有若干層時(shí)，整個(gè)語(yǔ)音識(shí)別系統(tǒng)能夠完全一致的將聲學(xué)轉(zhuǎn)錄為字符序列。目前LSTM網(wǎng)絡(luò)或者相關(guān)的門控單元同樣用于編碼和解碼網(wǎng)絡(luò)，并且在機(jī)器翻譯中表現(xiàn)良好。

過(guò)去幾年中，幾位學(xué)者提出了不同的提案用于增強(qiáng)RNNs的記憶模塊。提案中包括神經(jīng)圖靈機(jī)，其中通過(guò)加入RNNs可讀可寫的“類似磁帶”的存儲(chǔ)來(lái)增強(qiáng)網(wǎng)絡(luò)，而記憶網(wǎng)絡(luò)中的常規(guī)網(wǎng)絡(luò)通過(guò)聯(lián)想記憶來(lái)增強(qiáng)。記憶網(wǎng)絡(luò)在標(biāo)準(zhǔn)的問(wèn)答基準(zhǔn)測(cè)試中表現(xiàn)良好，記憶是用來(lái)記住稍后要求回答問(wèn)題的事例。

除了簡(jiǎn)單的記憶化，神經(jīng)圖靈機(jī)和記憶網(wǎng)絡(luò)正在被用于那些通常需要推理和符號(hào)操作的任務(wù)，還可以教神經(jīng)圖靈機(jī)“算法”。除此以外，他們可以從未排序的輸入符號(hào)序列（其中每個(gè)符號(hào)都有與其在列表中對(duì)應(yīng)的表明優(yōu)先級(jí)的真實(shí)值）中，學(xué)習(xí)輸出一個(gè)排序的符號(hào)序列。可以訓(xùn)練記憶網(wǎng)絡(luò)用來(lái)追蹤一個(gè)設(shè)定與文字冒險(xiǎn)游戲和故事的世界的狀態(tài)，回答一些需要復(fù)雜推理的問(wèn)題。在一個(gè)測(cè)試?yán)又?，網(wǎng)絡(luò)能夠正確回答15句版的《指環(huán)王》中諸如“Frodo現(xiàn)在在哪？”的問(wèn)題。

深度學(xué)習(xí)的未來(lái)展望

無(wú)監(jiān)督學(xué)習(xí)對(duì)于重新點(diǎn)燃深度學(xué)習(xí)的熱潮起到了促進(jìn)的作用，但是純粹的有監(jiān)督學(xué)習(xí)的成功蓋過(guò)了無(wú)監(jiān)督學(xué)習(xí)。在本篇綜述中雖然這不是我們的重點(diǎn)，我們還是期望無(wú)監(jiān)督學(xué)習(xí)在長(zhǎng)期內(nèi)越來(lái)越重要。無(wú)監(jiān)督學(xué)習(xí)在人類和動(dòng)物的學(xué)習(xí)中占據(jù)主導(dǎo)地位：我們通過(guò)觀察能夠發(fā)現(xiàn)世界的內(nèi)在結(jié)構(gòu)，而不是被告知每一個(gè)客觀事物的名稱。

人類視覺(jué)是一個(gè)智能的、基于特定方式的利用小或大分辨率的視網(wǎng)膜中央窩與周圍環(huán)繞區(qū)域?qū)饩€采集成像的活躍的過(guò)程。我們期望未來(lái)在機(jī)器視覺(jué)方面會(huì)有更多的進(jìn)步，這些進(jìn)步來(lái)自那些端對(duì)端的訓(xùn)練系統(tǒng)，并結(jié)合ConvNets和RNNs，采用增強(qiáng)學(xué)習(xí)來(lái)決定走向。結(jié)合了深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)的系統(tǒng)正處在初期，但已經(jīng)在分類任務(wù)中超過(guò)了被動(dòng)視頻系統(tǒng)，并在學(xué)習(xí)操作視頻游戲中產(chǎn)生了令人印象深刻的效果。

在未來(lái)幾年，自然語(yǔ)言理解將是深度學(xué)習(xí)做出巨大影響的另一個(gè)領(lǐng)域。我們預(yù)測(cè)那些利用了RNNs的系統(tǒng)將會(huì)更好地理解句子或者整個(gè)文檔，當(dāng)它們選擇性地學(xué)習(xí)了某時(shí)刻部分加入的策略。

最終，在人工智能方面取得的重大進(jìn)步將來(lái)自那些結(jié)合了復(fù)雜推理表示學(xué)習(xí)（representation learning ）的系統(tǒng)。盡管深度學(xué)習(xí)和簡(jiǎn)單推理已經(jīng)應(yīng)用于語(yǔ)音和手寫字識(shí)別很長(zhǎng)一段時(shí)間了，我們?nèi)孕枰ㄟ^(guò)操作大量向量的新范式來(lái)代替基于規(guī)則的字符表達(dá)式操作。

本文參考文獻(xiàn)詳見(jiàn)原文。

感謝@kevin和@劉志遠(yuǎn)的翻譯，感謝京東DNN實(shí)驗(yàn)室首席科學(xué)家@李成華友情審校！也歡迎更多人工智能愛(ài)好者推薦好文章和投稿（zhoujd@csdn.net）。（責(zé)編/周建?。?/span>

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

卷積神經(jīng)網(wǎng)絡(luò)

使用深度卷積網(wǎng)絡(luò)進(jìn)行圖像理解

分布式特征表示與語(yǔ)言處理

遞歸神經(jīng)網(wǎng)絡(luò)

深度學(xué)習(xí)的未來(lái)展望