2015年已然過去,2016剛剛開始,回頭將目光集中于去年的成就上,以及對將來科學(xué)趨勢的預(yù)測。去年最令人矚目的一個領(lǐng)域就是深度學(xué)習(xí),它是機(jī)器學(xué)習(xí)中越來越流行的一個分支,看起來它會繼續(xù)向前發(fā)展,并會運用到越來越多的行業(yè)和領(lǐng)域中。
在過去的一年中,我們有幸通過RE·WORK節(jié)目與從事人工智能和計算機(jī)科學(xué)方面的許多大牛進(jìn)行交流,我們期待在2016年會晤更多的專家,并向他們學(xué)習(xí)。
作為Q&A系列的一部分,我們邀請了一些深度學(xué)習(xí)方面最為資深的人士,來預(yù)測深度學(xué)習(xí)領(lǐng)域未來5年的可能發(fā)展情況。
未來5年我們可能看到深度學(xué)習(xí)會有怎樣的發(fā)展?
Ilya Sutskever,OpenAI研究總監(jiān):我們應(yīng)該會看到更為深層的模型,與如今的模型相比,這些模型可以從更少的訓(xùn)練樣例中學(xué)習(xí),在非監(jiān)督學(xué)習(xí)方面也會取得實質(zhì)性進(jìn)展。我們應(yīng)該會看到更精準(zhǔn)有用的語音和視覺識別系統(tǒng)。
Sven Behnke,波恩大學(xué)全職教授、自主智能系統(tǒng)小組負(fù)責(zé)人:我期望深度學(xué)習(xí)能夠越來越多地被用于多模(multi-modal)問題上,在數(shù)據(jù)上更結(jié)構(gòu)化。這將為深度學(xué)習(xí)開創(chuàng)新的應(yīng)用領(lǐng)域,比如機(jī)器人技術(shù),數(shù)據(jù)挖掘和知識發(fā)現(xiàn)。
Christian Szegedy,谷歌高級研究員:目前深度學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)的性能與理論性能相去甚遠(yuǎn)。如今,我們可以用五到十分之一的成本,以及十五分之一的參數(shù)來設(shè)計視覺網(wǎng)絡(luò),而性能比一年前花費昂貴成本設(shè)計出的網(wǎng)絡(luò)更優(yōu),這完全憑借改善的網(wǎng)絡(luò)架構(gòu)和更好的訓(xùn)練方法。我堅信,這僅僅只是個開始:深度學(xué)習(xí)算法將會更高效,能夠在廉價的移動設(shè)備上運行,即使沒有額外的硬件支持或是過高的內(nèi)存開銷。
Andrej Karpathy,斯坦福大學(xué)在讀計算機(jī)科學(xué)博士、OpenAI研究科學(xué)家:我不打算從高層面描述幾個即將到來的有趣發(fā)展,我將會集中于一個方面作具體描述。我看到的一個趨勢是,架構(gòu)正在迅速地變得更大、更復(fù)雜。我們正在朝著建設(shè)大型神經(jīng)網(wǎng)絡(luò)系統(tǒng)方面發(fā)展,交換神經(jīng)組件的輸入輸出,不同數(shù)據(jù)集上預(yù)訓(xùn)練的網(wǎng)絡(luò)部分,添加新模塊,同時微調(diào)一切等等。比如,卷積網(wǎng)絡(luò)曾是最大/最深的神經(jīng)網(wǎng)絡(luò)架構(gòu)之一,但如今,它被抽象成了大多數(shù)新架構(gòu)中的一小部分。反過來,許多這些架構(gòu)也會成為將來創(chuàng)新架構(gòu)中的一小部分。我們正在學(xué)習(xí)如何堆“樂高積木”,以及如何有效地將它們連線嵌套建造大型“城堡”。
Pieter Abbeel,加州大學(xué)伯克利分校計算機(jī)科學(xué)副教授、Gradescope聯(lián)合創(chuàng)始人:有很多技術(shù)都基于深度監(jiān)督式學(xué)習(xí)技術(shù),視頻技術(shù)也是一樣,搞清楚如何讓深度學(xué)習(xí)在自然語言處理方面超越現(xiàn)在的方法,在深度無監(jiān)督學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)方面也會取得顯著進(jìn)步。
Eli David,Deep Instinct CTO:在過去的兩年中,我們觀察到,在大多數(shù)使用了深度學(xué)習(xí)的領(lǐng)域中,深度學(xué)習(xí)取得了極大的成功。即使未來5年深度學(xué)習(xí)無法達(dá)到人類水平的認(rèn)知(盡管這很可能在我們有生之年發(fā)生),我們也將會看到在許多其他領(lǐng)域里深度學(xué)習(xí)會有巨大的改進(jìn)。具體而言,我認(rèn)為最有前途的領(lǐng)域?qū)⑹菬o監(jiān)督學(xué)習(xí),因為世界上大多數(shù)數(shù)據(jù)都是未標(biāo)記的,而且我們大腦的新皮層是一個很好的無監(jiān)督學(xué)習(xí)區(qū)域。
Deep Instinct是第一家使用深度學(xué)習(xí)進(jìn)行網(wǎng)絡(luò)安全研究的公司,在今后幾年,我希望有更多的公司使用深度學(xué)習(xí)進(jìn)行網(wǎng)絡(luò)安全研究。然而,使用深度學(xué)習(xí)的門檻還是相當(dāng)高的,尤其是對那些通常不使用人工智能方法(例如,只有少數(shù)幾個解決方案采用經(jīng)典機(jī)器學(xué)習(xí)方法)的網(wǎng)絡(luò)安全公司,所以在深度學(xué)習(xí)成為網(wǎng)絡(luò)安全領(lǐng)域廣泛運用的日常技術(shù)之前,這還將需要數(shù)年時間。
Daniel McDuff,Affectiva研究總監(jiān):深度學(xué)習(xí)已經(jīng)成為在計算機(jī)視覺,語音分析和許多其他領(lǐng)域占優(yōu)勢的機(jī)器學(xué)習(xí)形式。我希望通過一或兩個GPU提供的計算能力構(gòu)建出的精準(zhǔn)識別系統(tǒng)能夠讓研究人員在現(xiàn)實世界中開發(fā)和部署新的軟件。我希望有更多的重點放在無監(jiān)督訓(xùn)練、半監(jiān)督訓(xùn)練算法上,因為數(shù)據(jù)一直不斷增長。
J?rg Bornschein,加拿大高級研究所(CIFAR)全球學(xué)者:預(yù)測未來總是很難。我希望無監(jiān)督、半監(jiān)督和強(qiáng)化學(xué)習(xí)方法將會扮演比今天更突出的角色。當(dāng)我們考慮將機(jī)器學(xué)習(xí)作為大型系統(tǒng)的一部分,比如,在機(jī)器人控制系統(tǒng)或部件中,掌控大型系統(tǒng)計算資源,似乎很明顯地可以看出,純監(jiān)督式方法在概念上很難妥善解決這些問題。
Ian Goodfellow,谷歌高級研究科學(xué)家:我希望在五年之內(nèi),我們將可以讓神經(jīng)網(wǎng)絡(luò)總結(jié)視頻片段的內(nèi)容,并能夠生成視頻短片。神經(jīng)網(wǎng)絡(luò)已經(jīng)是視覺任務(wù)的標(biāo)準(zhǔn)解決方案了。我希望它也能成為NLP和機(jī)器人任務(wù)的標(biāo)準(zhǔn)解決方案。我還預(yù)測,神經(jīng)網(wǎng)絡(luò)將成為其他科學(xué)學(xué)科的重要工具。比如,神經(jīng)網(wǎng)絡(luò)可以被訓(xùn)練來對基因、藥物和蛋白質(zhì)行為進(jìn)行建模,然后用于設(shè)計新藥物。
Nigel Duffy,Sentient Technologies CTO:目前大數(shù)據(jù)生態(tài)系統(tǒng)一直專注于收集,管理,策展大量數(shù)據(jù)。很明顯,在分析和預(yù)測方面也有很多工作。從根本上說,企業(yè)用戶不關(guān)心那些。企業(yè)用戶只關(guān)心結(jié)果,即“這些數(shù)據(jù)將會改變我的行為方式嗎?將會改變我做出的抉擇嗎?”我們認(rèn)為,這些問題是未來5年需要解決的關(guān)鍵問題。我們相信,人工智能將會是數(shù)據(jù)和更好的決策之間的橋梁。
很明顯,深度學(xué)習(xí)將會在演變中起到顯著的作用,但需要與其他人工智能方法結(jié)合。在接下來的5年里,我們會看到越來越多的混合系統(tǒng)中,深度學(xué)習(xí)用于處理一些難以感知的任務(wù),而其他人工智能和機(jī)器學(xué)習(xí)(ML)技術(shù)用于處理其他部分的問題,如推理。
Koray Kavukcuoglu & Alex Graves,谷歌DeepMind研究科學(xué)家:未來5年會發(fā)生許多事。我們希望無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)會更加杰出。我們同樣希望看到更多的多模式學(xué)習(xí),以及對多數(shù)據(jù)集學(xué)習(xí)更加關(guān)注。
Charlie Tang,多倫多大學(xué)機(jī)器學(xué)習(xí)小組博士生:深度學(xué)習(xí)算法將逐步用于更多的任務(wù)并且將“解決”更多的問題。例如,5年前,人臉識別算法的準(zhǔn)確率仍然比人類表現(xiàn)略差。然而,目前在主要人臉識別數(shù)據(jù)集(LFW)和標(biāo)準(zhǔn)圖像分類數(shù)據(jù)集(Imagenet)上算法的表現(xiàn)已經(jīng)超過了人類。在未來5年,越來越難的問題,如視頻識別,醫(yī)學(xué)影像或文字處理將順利由深度學(xué)習(xí)算法解決。我們還可以看到深度學(xué)習(xí)算法被移植到商業(yè)產(chǎn)品中,就像10年前人臉檢測如何被納入相機(jī)中一樣。
聯(lián)系客服