最近,李飛飛關(guān)于人工智能的一些看法,發(fā)表在了國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)的官方網(wǎng)站的“People of ACM”欄目中,這個(gè)欄目會(huì)不定期介紹ACM成員的成就和簡(jiǎn)介,希望能給同行們帶來(lái)啟發(fā)。
作為斯坦福人工智能實(shí)驗(yàn)室(SAIL)和斯坦福視覺實(shí)驗(yàn)室主任,李飛飛再次解釋了為什么說(shuō)目前是從事人工智能領(lǐng)域工作的好時(shí)機(jī)、為何計(jì)算機(jī)視覺是AI技術(shù)發(fā)展基石,以及人工智能在醫(yī)療行業(yè)將有怎樣的機(jī)會(huì)。
以下是李飛飛對(duì)幾個(gè)問(wèn)題的看法,量子位編譯:
問(wèn):為什么說(shuō),目前是工作于深度神經(jīng)網(wǎng)絡(luò)和人工智能領(lǐng)域的好時(shí)機(jī)?
李飛飛:人工智能已有60多年的發(fā)展歷史。最初的目標(biāo)是開發(fā)智能機(jī)器。自那時(shí)以來(lái),主要來(lái)自學(xué)術(shù)實(shí)驗(yàn)室和學(xué)術(shù)機(jī)構(gòu)的研究員為人工智能打下了基礎(chǔ),相關(guān)工作包括問(wèn)題的定義、評(píng)價(jià)指標(biāo)、算法,以及作為人工智能支柱的子領(lǐng)域(例如機(jī)器人、計(jì)算機(jī)視覺、自然語(yǔ)言處理和機(jī)器學(xué)習(xí))。我將這個(gè)階段稱作“體外人工智能”。
令人興奮的變化發(fā)生在2010年左右,人工智能的發(fā)展進(jìn)入了我稱之為“體內(nèi)人工智能”的階段。在新時(shí)代中,人工智能變革了現(xiàn)實(shí)世界場(chǎng)景,例如交通運(yùn)輸、圖像處理和醫(yī)療健康行業(yè)的計(jì)算方式。由于一系列的進(jìn)步,包括算法(例如基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法)、計(jì)算技術(shù)(例如摩爾定律、GPU,以及正在發(fā)展的TPU)和可用數(shù)據(jù)集(例如ImageNet),人工智能應(yīng)用正在帶來(lái)真正的改變。實(shí)際上,這還只是起步階段。我認(rèn)為,人工智能將成為“第四次工業(yè)革命”最重要的驅(qū)動(dòng)力,而這將改變我們目前所知的各個(gè)行業(yè)。這也令人工智能領(lǐng)域變得更令人興奮。
問(wèn):你提到,計(jì)算機(jī)視覺,即計(jì)算機(jī)如何識(shí)別和理解圖像,將成為人工智能未來(lái)發(fā)展的技術(shù)基石。那么能否解釋一下,為什么計(jì)算機(jī)視覺是核心?
李飛飛:我們可以借鑒自然界的例子。5.4億年前,動(dòng)物出現(xiàn)了眼睛,成為了“寒武紀(jì)生物大爆發(fā)”最重要的推動(dòng)力量。在這段時(shí)期內(nèi),物種數(shù)量出現(xiàn)了爆發(fā)式增長(zhǎng)。視覺是改變動(dòng)物行為的最主要因素,同時(shí)也加速了大腦的發(fā)展。作為已知智慧程度最高的生物,人類將視覺作為生存、運(yùn)動(dòng)、操作和溝通的最主要感官系統(tǒng)。實(shí)際上,有估計(jì)認(rèn)為,大腦的超過(guò)一半機(jī)能都被用于視覺處理和視覺智能。
現(xiàn)在,讓我們來(lái)看看數(shù)字世界。由于傳感器、智能手機(jī)和無(wú)人駕駛汽車的發(fā)展,信息數(shù)據(jù)的最主要形式就是像素。思科估計(jì),互聯(lián)網(wǎng)上超過(guò)80%的數(shù)據(jù)都是某種形式的像素。僅僅對(duì)于YouTube,每60秒鐘就有數(shù)百小時(shí)的視頻上傳至其服務(wù)器。因此與動(dòng)物界類似,視覺將成為機(jī)器智能發(fā)展最主要的推動(dòng)力量。這是一種覆蓋了所有垂直行業(yè)的通用應(yīng)用,也是智能機(jī)器應(yīng)當(dāng)具備的最重要能力之一,無(wú)論這樣的機(jī)器是無(wú)人駕駛汽車、醫(yī)療診斷系統(tǒng)、智能教室,還是未來(lái)的制造設(shè)備。
在近期斯坦福大學(xué)的項(xiàng)目中,你和學(xué)生開發(fā)的技術(shù)讓計(jì)算機(jī)可以生成文字,描述它們“看到”的圖像。哪些關(guān)鍵進(jìn)步使這個(gè)項(xiàng)目成為可能?
人類最強(qiáng)大的能力之一是,能夠描述我們看到的畫面。老話說(shuō),“一張圖片勝過(guò)千言萬(wàn)語(yǔ)”。因此,自從開始計(jì)算機(jī)視覺科學(xué)家的職業(yè)生涯以來(lái),我就在解決這個(gè)問(wèn)題,即如何讓機(jī)器描述照片(和視頻)。近期關(guān)于圖片標(biāo)注(以及隨后根據(jù)圖片生成大段文字)的工作再次證明了深度學(xué)習(xí)方法的力量。在通過(guò)足夠多的圖片-標(biāo)注配對(duì)進(jìn)行訓(xùn)練之后,我們的算法能學(xué)會(huì)為可視化內(nèi)容匹配單詞或詞組,并生成類似人類的語(yǔ)句??紤]到自然界在數(shù)億年的進(jìn)化中只誕生了人類一種具備這種能力的生物,這是個(gè)令人難以置信的結(jié)果。計(jì)算機(jī)用了50多年、60多年就獲得了同樣的能力。值得注意的是,當(dāng)前數(shù)億人正通過(guò)谷歌照片應(yīng)用去使用這項(xiàng)技術(shù)。如果你在這款應(yīng)用中搜索特定關(guān)鍵詞,例如“海灘”或“天空”,那么就可以很容易地找到相關(guān)照片。谷歌照片很好地證明了,類似谷歌的公司如何基于特定研究項(xiàng)目開發(fā)產(chǎn)品。
問(wèn):許多行業(yè)都將受到人工智能的影響,而你提到,醫(yī)療將會(huì)成為轉(zhuǎn)型最明顯的一個(gè)行業(yè)。未來(lái)20年中,人工智能技術(shù)在醫(yī)療行業(yè)將會(huì)有哪些有趣的應(yīng)用?
李飛飛:正如我之前所說(shuō),人工智能正在改變,或是即將改變,所有垂直行業(yè)。這是一種信息和數(shù)據(jù)的全新計(jì)算方式,而計(jì)算能力對(duì)所有公司來(lái)說(shuō)都是必要的。我看好人工智能在醫(yī)療行業(yè)的潛力,因?yàn)槲艺J(rèn)為,人工智能將給所有人,而不僅僅是少數(shù)精英帶來(lái)幫助。
在醫(yī)療行業(yè),我尤為看好兩方面應(yīng)用。首先是人工智能輔助的診斷。這是醫(yī)療的基礎(chǔ)。許多醫(yī)生都必須面對(duì)大量數(shù)據(jù)和信息,而有經(jīng)驗(yàn)的醫(yī)生無(wú)法前往很多地方為病人進(jìn)行診斷,判斷他們需要接受什么樣的治療。此外眾所周知,如果我們可以更早地發(fā)現(xiàn)醫(yī)療問(wèn)題,那么患者的預(yù)后情況就會(huì)越好。我們已經(jīng)看到,人工智能可以更好地預(yù)測(cè)糖尿病眼病,以及幫助病理學(xué)家發(fā)現(xiàn)乳腺癌。基于人工智能的醫(yī)療診斷可以成為不知疲倦的助手,幫助醫(yī)生展開工作,無(wú)論是早期預(yù)防診斷、分類處理,還是精確醫(yī)療。無(wú)論是病理學(xué)還是放射學(xué),大部分醫(yī)療數(shù)據(jù)都會(huì)以像素形式出現(xiàn)。因此在提供更先進(jìn)的解決方案方面,計(jì)算機(jī)視覺可以扮演關(guān)鍵的角色。
我非??春玫牧硪粋€(gè)領(lǐng)域是,通過(guò)流程的改進(jìn),我們可以改善醫(yī)療質(zhì)量,降低成本。無(wú)論是門診、急診、手術(shù)室、ICU,還是家庭醫(yī)療,用人工智能去輔助流程都可以給患者治療和醫(yī)療管理帶來(lái)幫助。這里有個(gè)小案例。每年,美國(guó)都要花費(fèi)約300億美元去治療在醫(yī)院被傳染上傳染病的患者。這是個(gè)預(yù)防醫(yī)學(xué)的問(wèn)題,主要是由于醫(yī)生沒有進(jìn)行適當(dāng)?shù)氖植啃l(wèi)生處理。在斯坦福大學(xué),我實(shí)驗(yàn)室中的學(xué)生嘗試與醫(yī)學(xué)院,以及Lucile Packard兒童醫(yī)院的同事合作解決這個(gè)問(wèn)題。與傳統(tǒng)方法,即安排專人進(jìn)行監(jiān)督不同,人工智能系統(tǒng)能帶來(lái)持續(xù)、低成本、無(wú)偏見,以及更準(zhǔn)確的結(jié)果。這是用人工智能去改進(jìn)工作流程的一個(gè)案例。類似的技術(shù)可以幫助醫(yī)生進(jìn)行醫(yī)學(xué)文書工作,并監(jiān)督手術(shù)室和急診室規(guī)章的執(zhí)行。
【完】
招聘聯(lián)系客服