摘要:
研究人員和制造商正在培訓(xùn)機器人如何利用人工智能來學(xué)習(xí)和處理復(fù)雜的任務(wù),但是所能實現(xiàn)的功能還遠(yuǎn)遠(yuǎn)未達(dá)到人們期望機器人達(dá)到的目標(biāo)?,F(xiàn)在人工智能的定義比以前更廣泛,這可能會造成一些混亂。
在人工智能 (AI) 領(lǐng)域工作了數(shù)十年的研究人員和企業(yè)家,正試圖幫助人們更好地理解它不夠明晰的內(nèi)涵。他們正在努力減少圍繞人工智能的一些混淆和誤解,并展示它是如何被用于工業(yè)應(yīng)用的機器人技術(shù)。
“ 最大的誤解可能是, 它還有多遠(yuǎn)。”Rethink Robotics 董事長兼首席技術(shù)官Rodney Brooks 說,“ 自從1956 年AI 之父John McCarthy 創(chuàng)造了'人工智能’一詞以來,我們一直致力于人工智能的研究,到目前為止大約62 年了。但它遠(yuǎn)比物理學(xué)復(fù)雜得多,而物理學(xué)花了相當(dāng)長的時間來完善。 我想我們還處于人工智能的初期階段?!?/p>
很多與人工智能相關(guān)的炒作與最近媒體的大肆報道相關(guān),例如展會上仿生和受動物啟發(fā)的機器人展示,或者觀賞體育的人工智能系統(tǒng),例如可以與人類下棋、打乒乓球、高爾夫的機器人。一些誤解源于將機器性能等同于能力。當(dāng)看到人執(zhí)行某項任務(wù)時,我們可以假定一些基本的能力——技能和天賦,人必須擁有這些技能才能完成該任務(wù)。但人工智能和這并不一樣。
“雖然AI 系統(tǒng)在下棋方面的表現(xiàn)令人吃驚,但它甚至不知道它是在玩游戲?!盉rooks說,“我們把機器的性能誤認(rèn)為是它們的能力。當(dāng)看到程序像人一樣學(xué)習(xí)新事物時,如果你認(rèn)為程序也能像你一樣對其有深刻的理解,那可能你就犯了一個錯誤。”
■ 圖 1: Brooks 認(rèn)為AI 仍處于起步階段。機器智能和人類智力之間沒有可預(yù)見的競爭,人類仍然更聰明。
人工智能到底是什么
人工智能已經(jīng)成為營銷的時髦詞。就像在此之前的 “機器人”一樣,現(xiàn)在似乎一切都是AI 驅(qū)動的。到底什么是AI,什么不是 AI,有時很難確定。即使是專家,在確切的定義什么是AI、什么不是 AI 時,也會猶豫。正如Brooks 所指出的,在1960 年代被認(rèn)為是 AI 的事物,現(xiàn)在則出現(xiàn)在計算機編程的第一個課中。但它不叫 AI。
“在某個時候曾被叫做AI,” Brooks 說,“后來,它就變成了計算機科學(xué)?!睓C器學(xué)習(xí)以及它的所有變化,包括深入學(xué)習(xí)、強化學(xué)習(xí)和模仿學(xué)習(xí),都是 AI 的子集。
“在某段時間內(nèi),AI 是一個非常狹窄的領(lǐng)域。有些人非常確定的認(rèn)為它是一種搜索技術(shù)。”加州大學(xué)伯克利分校工業(yè)工程與運籌學(xué)研究教授兼主席Ken Goldberg 說,“而現(xiàn)在, AI 被廣泛認(rèn)為是機器人和機器學(xué)習(xí)的一個總括術(shù)語,因此現(xiàn)在它被看做一系列子集的集合。”
先進(jìn)的計算機視覺是人工智能的一種形式。“如果你只是檢查螺絲是否在合適的地方,那從60 年代開始就有了該項技術(shù)。如果想將其稱之為AI,那就需要對其進(jìn)行擴展。”Goldberg說,“但同時,如果一個計算機視覺系統(tǒng)能識別工人面孔,那我們一般認(rèn)為這是人工智能。因為這是一個更復(fù)雜的挑戰(zhàn)?!?/p>
缺乏語境
人的智力和機器智力之間的一個重要區(qū)別是語境。作為人類,我們對周圍的世界有了更多、更深入的了解。但人工智能并沒有。Brooks 說: “我在AI 語境領(lǐng)域已經(jīng)工作了60 年,成果甚少?!边@就是為什么即使我們擁有超級智能AI,我也并不擔(dān)心。雖然我們在某些領(lǐng)域取得了成功,也就是現(xiàn)在所謂的革命,但非常有限。當(dāng)然,言語理解與我們10年前的情況截然不同。過去,按照語音理解系統(tǒng)的設(shè)置,你可以按下或說'2’來代表挫折感。但現(xiàn)在已經(jīng)不是這樣?!彼齺嗰R遜的Alexa 為例,還有谷歌助手和蘋果的 Siri。
“你對 Alexa 說些什么,即使在音樂播放的時候,在房間里還有其它人在說話時,它也能很好的理解?!盉rooks 說,這令人吃驚,主要受益于深度學(xué)習(xí)的發(fā)展?!俺浞掷眠@些新興技術(shù)領(lǐng)域的發(fā)展,讓我們可以做出更好的產(chǎn)品?!?/p>
“在剛開始創(chuàng)建Rethink Robotics 時,我們考察了所有的商業(yè)語言理解系統(tǒng)。那時,我們認(rèn)為在工廠里,實現(xiàn)機器人語音識別是荒唐可笑的。我想現(xiàn)在情況已經(jīng)發(fā)生了改變?!盉rooks 說。
語音識別系統(tǒng)編譯出正確的字串。準(zhǔn)確的字串足以做很多事情,但它仍不能像人一樣聰明?!斑@就是區(qū)別,”他說,“獲取字串只是一種有限的能力。如果要擴展這種能力,還有很長的路要走?!?/p>
這些有限的能力,已經(jīng)成為許多關(guān)于人工智能樂觀預(yù)測的基礎(chǔ),但對未來人類所承擔(dān)的角色,則可能顯得過于悲觀。
在現(xiàn)實世界中的AI 研究
相對于單一性,Goldberg 更強調(diào)多樣性,注意到不同組合的人和機器合作解決問題和創(chuàng)新的重要性。如果AI 應(yīng)用程序想要走出實驗室,進(jìn)入現(xiàn)實世界,這種協(xié)作尤其重要。
加州大學(xué)伯克利分校電氣工程和計算機科學(xué)系的教授Pieter Abbeel,也是Embodied Intelligence 公司的總裁和首席科學(xué)家。他正致力于將AI 帶入工業(yè)世界,同時強調(diào)人類和機器協(xié)同工作的重要性。
“ 這是挑戰(zhàn)的一部分,” Abbeel說,“ 人類如何能夠利用這項技術(shù),利用它來使自己更聰明,而不是僅僅讓這些機器與我們分開?當(dāng)機器成為我們?nèi)粘I畹囊徊糠?,可以用于提高效率的時候,那就是它真正令人興奮的時刻?!?/p>
盡管Abbeel 對 AI 的前景感到興奮,但他認(rèn)為適當(dāng)?shù)闹?jǐn)慎是有必要的?!拔艺J(rèn)為最好記住,像語音識別、機器翻譯和識別圖像中最顯著的進(jìn)步其實只是所謂的監(jiān)督學(xué)習(xí)的例子?!?/p>
重要的是要了解有不同類型的AI正在建立。在機器學(xué)習(xí)中,有三種主要的學(xué)習(xí)類型: 監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)。
“ 監(jiān)督學(xué)習(xí)只是一種模式識別,”Abbeel 說。從語音到文本,或者從一種語言到另一種語言,這是一個很難的識別模式,但是 AI 沒有任何目標(biāo)或目的。給出英語,它會告訴你中文是什么。給它一個口頭句子,它將轉(zhuǎn)錄成一系列的字母。這只是模式匹配。你給出數(shù)據(jù)——圖像和標(biāo)簽,它學(xué)習(xí)如何從圖像到標(biāo)簽的識別模式。
沒有監(jiān)督的學(xué)習(xí)是你只給它圖像,沒有標(biāo)簽。希望它能夠從大量的圖像開始,了解世界是什么,然后逐步建立這種理解,也許在將來它可以更快地學(xué)習(xí)到其它東西。沒有監(jiān)督的學(xué)習(xí)沒有任務(wù)。只需給它提供大量的數(shù)據(jù)。
接下來是強化學(xué)習(xí),這種學(xué)習(xí)非常不同,更有趣,也更難 ( 強化學(xué)習(xí)被歸功于自動駕駛技術(shù)的進(jìn)步)。 強化學(xué)習(xí)是給系統(tǒng)一個目標(biāo)。目標(biāo)可以是在視頻游戲中獲得高分,或在國際象棋游戲中獲勝,或組裝兩個零件。這也是對AI 產(chǎn)生某些恐懼的理由。如果 AI 有錯誤的目標(biāo),會發(fā)生什么?目標(biāo)應(yīng)該如何設(shè)定?
重要的是人類和人工智能不會在真空隔絕的環(huán)境中進(jìn)化的。Abbeel說:“當(dāng)我們創(chuàng)造越來越智能的機器時,我們作為人類的能力也將會增強?,F(xiàn)在,我們在Embodied Intelligence所做的工作最讓我興奮的是,人工智能的最新發(fā)展,已經(jīng)使 AI 能夠理解它們在圖片中看到的內(nèi)容?!?/p>
■ 圖 2: Abbeel 正在將機器學(xué)習(xí)的突破性研究轉(zhuǎn)變?yōu)閷嶋H的工業(yè)應(yīng)用,機器人可以自主學(xué)習(xí)新技能。
機器人抓取的深度學(xué)習(xí)
加州大學(xué)伯克利分校的Autolab實驗室, 專注AI 領(lǐng)域的研究超過10年,并已將其應(yīng)用于云機器人、深入強化學(xué)習(xí)、從演示中學(xué)習(xí)、以及倉庫物流強健的機器人抓取和操縱、家庭機器人、以及外科機器人等項目。
該實驗室的Dexterity Network(Dex-Net) 項目表明, AI 可以幫助機器人學(xué)習(xí)抓取不同大小和形狀的對象,通過提供數(shù)以百萬計的3D 對象模型、圖像,以及如何將它們抓取到深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)指標(biāo)。
以前,機器人通過拿不同的對象反復(fù)練習(xí)來學(xué)習(xí)抓取和操作對象,這是一個耗時的過程。利用合成點云代替物理對象來訓(xùn)練神經(jīng)網(wǎng)絡(luò)、識別抓取,最新的Dex-Net 迭代效率更高,可以達(dá)到99% 的抓取精度。從長遠(yuǎn)來看,Goldberg 希望開發(fā)高可靠性的機器人,能夠抓取各種剛性物體:如工具、家居用品、包裝貨物、和工業(yè)零件。
■ 圖 3: 在研究人員培訓(xùn)神經(jīng)網(wǎng)絡(luò)如何識別來自數(shù)以百萬計的3D 模型和圖像中的對象以后,機器人可以操作之前從未遇到過的對象。
深度學(xué)習(xí)協(xié)作機器人
Rethink 公司的 Intera 5 軟件,旨在使Baxter 和Sawyer 協(xié)作機器人更聰明。機器人的視覺和培訓(xùn)功能中,利用了很多人工智能。
“傳統(tǒng)的工業(yè)機器人沒有太多的智慧,這一情況正在改變。我們正在將深度學(xué)習(xí)應(yīng)用到機器人?!?Brooks說。未來可能90% 的制造,都是人與機器人在同一空間協(xié)同工作。
Baxter 和Sawyer 機器人有一個示范培訓(xùn)功能,可以使 AI 投入工作。Brooks 說: “當(dāng)你通過演示訓(xùn)練它的時候,你可以通過移動它的手臂向其展示某些東西,它會推斷出一個叫做行為樹的程序。它會為自己編寫一個程序來運行。你不必親自去寫這個程序?!?/p>
Intera 5 是一種圖形化編程語言。Brooks 說,你可以查看它,修改它,或者你可以在行為樹中編寫一個程序,讓它繞過程序的選項自動執(zhí)行。
■ 圖 4: 集成AI 的協(xié)作機器人,將計算機數(shù)控車床應(yīng)用到定制注塑機上,可以促進(jìn)工藝過程的自動化,提高產(chǎn)品質(zhì)量和生產(chǎn)效率,并可以將運行人員從重復(fù)的任務(wù)中解放出來。
AI 改變機器人編程
人工智能正在改變機器人的編程方式。在Embodied Intelligence 公司,Abbeel 和他的團(tuán)隊利用 AI 的力量,以幫助工業(yè)機器人學(xué)習(xí)新的、復(fù)雜的技能。
他們的工作是從 Abbeel 在加州大學(xué)伯克利分校的研究中發(fā)展而來的,在使用模仿學(xué)習(xí)和深層強化學(xué)習(xí)來培訓(xùn)機器人操縱物體方面有了重大突破。開始采用感知和控制相結(jié)合的方式來遠(yuǎn)程操作機器人。操作員佩戴虛擬現(xiàn)實 (VR) 裝置,通過攝像機來顯示機器人的視圖。
在控制方面,VR 設(shè)備配置了操作員手持的處理設(shè)備。當(dāng)運行人員的手移動時,該運動就能被跟蹤。跟蹤所得的坐標(biāo)和方向,被送入驅(qū)動機器人的計算機上。這樣操作員可以直接控制機器人爪的運動,就像木偶一樣。
Abbeel 說: “我們允許人類將自己嵌入機器人內(nèi)部?!蓖ㄟ^機器人的眼睛, 人可以看并且控制機器人的手臂。他說,人類是如此靈巧,以至于機器人爪和我們的手之間沒有可比性。通過 VR 系統(tǒng),操作員可以感受到機器人運動方面的限制。
“通過給機器人演示來傳授技能的精髓。這并不意味,在剛開始時會像機器人一樣快。它會以人類的速度進(jìn)行,對于大多數(shù)機器人來說,這非常緩慢?!盇bbeel 說。這是第一階段( 模仿學(xué)習(xí))。通過示范培訓(xùn)機器人。然后在第二階段,機器人將運行強化學(xué)習(xí),從它自己的嘗試和錯誤中學(xué)習(xí)。這時,機器人已經(jīng)學(xué)會了任務(wù)的精髓?,F(xiàn)在,機器人只需要學(xué)會如何加速。這時它可以通過強化學(xué)習(xí)加快學(xué)習(xí)的進(jìn)程。
他們的技術(shù)特別適合于挑戰(zhàn)性的視覺和操作任務(wù),而這對傳統(tǒng)的軟件編程技術(shù)來說太復(fù)雜了。Embodied公司可以讓任何人通過自己的演示,使用該軟件來重新為它們的機器人編程。這將允許任何公司,不管大小都可以快速重新部署機器人,完成不同的任務(wù)。
■ 圖 5: 操作員戴著VR 頭盔,手持運動跟蹤裝置,遠(yuǎn)程操作機器人,這樣它就可以學(xué)習(xí)如何使用強化學(xué)習(xí)來獨立完成新的技能。
未來的潛力
雖然AI 在云計算機器人、機器學(xué)習(xí)、計算機視覺、語音識別等各個方面都在進(jìn)步,并在特定領(lǐng)域取得了顯著的進(jìn)步,然而,AI 對人類還是所知有限。
在 AI 和人類工程學(xué)的幫助下,即使有一天機器人能夠接近人類的靈巧程度,但可能也永遠(yuǎn)不會真正掌握周圍的世界。語境和獨創(chuàng)性將仍是人類主導(dǎo)的領(lǐng)域。技術(shù)既不壞也不好,就看我們?nèi)绾问褂盟?。有了人工智能和機器人的幫助,人類就有了巨大的潛能來做更多有意義的事。
本文關(guān)鍵概念
■ 人工智能正在發(fā)展,但它還遠(yuǎn)不如人類聰明。
■ 人類可以利用人工智能幫助機器人學(xué)習(xí)新的技能。
■ 云機器人可以幫助協(xié)作機器人,AI需要大量的數(shù)據(jù)。
思考一下 : 有什么特殊的技能可以教給機器人,從而在制造和工業(yè)自動化方面帶來巨大影?
本文來自于《控制工程中文版》(CONTROL ENGINEERING China )2018年9月刊《技術(shù)文章》欄目,原標(biāo)題為:人工智能對未來機器人產(chǎn)業(yè)的影響。
本期雜志封面
想要免費閱讀每期雜志內(nèi)容,請查閱《控制工程中文版》微信訂閱號自定義菜單。
聯(lián)系客服