摘要
AIGC+機(jī)器人=具身智能?硅谷最酷的兩個(gè)男人不謀而合,A股預(yù)演“下個(gè)浪潮”。
新的AI題材層出不窮,這次輪到“機(jī)器人+AI”融合而成的具身智能概念。
“硅谷鋼鐵俠”馬斯克和熱愛(ài)黑色皮衣的“顯卡教父”黃仁勛均作出積極表態(tài),可謂不謀而合。
當(dāng)?shù)貢r(shí)間5月16日, 特斯拉2023年年度股東大會(huì)召開(kāi),馬斯克在會(huì)上表示,人形機(jī)器人將會(huì)是今后特斯拉主要的長(zhǎng)期價(jià)值來(lái)源,“如果人形機(jī)器人和人的比例是2比1左右,那么人們對(duì)機(jī)器人的需求量可能是100億乃至200億個(gè),遠(yuǎn)超電動(dòng)車(chē)的數(shù)量?!?/p>
同日,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在ITF World 2023半導(dǎo)體大會(huì)上表示,AI下一個(gè)浪潮將是“具身智能”,他也公布了Nvidia VIMA,這是一個(gè)多模態(tài)具身人工智能系統(tǒng),能夠在視覺(jué)文本提示的指導(dǎo)下執(zhí)行復(fù)雜的任務(wù)。
反映在A股二級(jí)市場(chǎng)上,今日,相關(guān)標(biāo)的強(qiáng)勢(shì)上漲,多只個(gè)股漲停。截至收盤(pán),鳴志電器、優(yōu)德精密、奧比中光漲停,機(jī)器人、虹軟科技、云天勵(lì)飛、昊志機(jī)電、埃夫特等漲超10%。
自2021年發(fā)布以來(lái),馬斯克一直為其人形機(jī)器人“站臺(tái)”,不斷重申“機(jī)器人+AI”的遠(yuǎn)大前景。而在AIGC(生成式AI)火熱的當(dāng)下,“具身智能”這一名詞的普及正逢其時(shí),將“機(jī)器人+AI”再次推上舞臺(tái)中心。
AIGC、具身智能、機(jī)器人,三者到底是如何聯(lián)系在一起的?
▌特斯拉人形機(jī)器人≈具身智能機(jī)器人
人們對(duì)馬斯克的人形機(jī)器人早已耳熟能詳。從最終用途來(lái)看,特斯拉人形機(jī)器人和具身智能機(jī)器人幾乎可以劃等號(hào)。
馬斯克對(duì)特斯拉機(jī)器人的遠(yuǎn)景目標(biāo)是讓機(jī)器人適應(yīng)環(huán)境并能做人類(lèi)所做之事,進(jìn)而讓其服務(wù)于千家萬(wàn)戶(hù),比如做飯、修剪草坪、照顧老人等。
具身智能機(jī)器人是一個(gè)具有物理實(shí)體、可與真實(shí)世界進(jìn)行多模態(tài)交互,像人類(lèi)一樣感知和理解環(huán)境,并通過(guò)自主學(xué)習(xí)完成任務(wù)的智能體。英偉達(dá)機(jī)器人研究高級(jí)主管、華盛頓大學(xué)教授 Dieter Fox 此前指出,機(jī)器人研究的一個(gè)關(guān)鍵目標(biāo)是構(gòu)建在現(xiàn)實(shí)世界中對(duì)人類(lèi)有幫助的機(jī)器人。
▌AIGC為具身智能突破技術(shù)瓶頸提供新思路
具身智能是智能科學(xué)的一個(gè)基礎(chǔ)問(wèn)題,也是一個(gè)大難題。而AIGC為具身智能的實(shí)現(xiàn)提供了新思路。
1950 年,圖靈在他的論文——《Computing Machinery and Intelligence》中首次提出了具身智能的概念。在之后的幾十年里,囿于技術(shù)問(wèn)題,具身智能并沒(méi)有取得很大的進(jìn)展。
正如斯坦福大學(xué)計(jì)算機(jī)科學(xué)教授李飛飛所說(shuō),“具身的含義不是身體本身,而是與環(huán)境交互以及在環(huán)境中做事的整體需求和功能?!?/p>
與人、與環(huán)境的交互,是具身智能機(jī)器人形成對(duì)于客觀世界的理解和改造能力的第一步,這方面,最直接的障礙在于,人們嚴(yán)重依賴(lài)手寫(xiě)代碼來(lái)控制機(jī)器人,人類(lèi)與人工智能面前,“巴別塔”高筑。
而進(jìn)入AIGC時(shí)代,GPT等AI大模型提供了新的解決方案,已有不少研究者嘗試將多模態(tài)的大語(yǔ)言模型作為人類(lèi)與機(jī)器人溝通的橋梁。即通過(guò)將圖像、文字、具身數(shù)據(jù)聯(lián)合訓(xùn)練,并引入多模態(tài)輸入,增強(qiáng)模型對(duì)現(xiàn)實(shí)中對(duì)象的理解,幫助機(jī)器人處理具身推理任務(wù)。
▌微軟、谷歌、阿里等積極探索
目前,具身智能已經(jīng)成為國(guó)際學(xué)術(shù)前沿研究方向,包括美國(guó)國(guó)家科學(xué)基金會(huì)在內(nèi)的機(jī)構(gòu)都在推動(dòng)具身智能的發(fā)展,各大國(guó)際學(xué)術(shù)會(huì)議也開(kāi)始越來(lái)越多地關(guān)注具身智能相關(guān)工作,美國(guó)頂尖高校已經(jīng)開(kāi)始形成具身智能研究社區(qū)。
業(yè)界同樣進(jìn)展神速,谷歌、微軟帶頭,均試圖以大模型為機(jī)器人注入靈魂。前者的PaLM-E模型與具身智能密不可分,完成機(jī)器人具身任務(wù)一直是該模型研究的重點(diǎn),后者正探索如何將 OpenA研發(fā)的ChatGPT擴(kuò)展到機(jī)器人領(lǐng)域,從而讓我們用語(yǔ)言直觀控制如機(jī)械臂、無(wú)人機(jī)、家庭輔助機(jī)器人等多個(gè)平臺(tái)。
國(guó)內(nèi),阿里巴巴也正在試驗(yàn)將千問(wèn)大模型接入工業(yè)機(jī)器人,在釘釘對(duì)話(huà)框輸入一句人類(lèi)語(yǔ)言,可遠(yuǎn)程指揮機(jī)器人工作。
▌投資主線(xiàn)日益清晰
從技術(shù)上看,具身智能的實(shí)現(xiàn)離不開(kāi)三大環(huán)節(jié)——感知、想象和執(zhí)行。這意味著具身智能機(jī)器人需要有靈活的頭腦、強(qiáng)大的執(zhí)行力、流暢的與人交流的能力、像人一樣的自學(xué)能力。
強(qiáng)大的執(zhí)行力依賴(lài)于機(jī)器人的物理外設(shè),即機(jī)械身體和基本運(yùn)動(dòng)控制,感知、想象能力可以外化為機(jī)器人能聽(tīng)、能看、能說(shuō),需要利用機(jī)器視覺(jué)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等多種AI技術(shù)優(yōu)化軟件與算法,并利用文本、視覺(jué)、語(yǔ)音、場(chǎng)景等跨越不同環(huán)境的大量數(shù)據(jù)集進(jìn)行訓(xùn)練。
基于此,機(jī)器人產(chǎn)業(yè)和多模態(tài)大模型、機(jī)器視覺(jué)技術(shù)等被多家機(jī)構(gòu)視作新的掘金方向。國(guó)盛證券稱(chēng),多模態(tài)GPT能極大助力機(jī)器人產(chǎn)業(yè)的發(fā)展,未來(lái)5-10年,結(jié)合復(fù)雜多模態(tài)方案的大模型有望具備完備的與世界交互的能力,在通用機(jī)器人等領(lǐng)域得到應(yīng)用;天風(fēng)國(guó)際證券表示,AI是機(jī)器視覺(jué)的母身,深度學(xué)習(xí)為機(jī)器視覺(jué)的技術(shù)堡壘,近期Meta發(fā)布SAM模式有望助力機(jī)器視覺(jué)迎來(lái)GPT時(shí)刻。
身處上述行業(yè)或擁有相應(yīng)技術(shù)的公司已成重點(diǎn)關(guān)注對(duì)象。上市公司互動(dòng)易上,凌云光、匯川技術(shù)、海天瑞聲等均被投資者追問(wèn)與具身智能的聯(lián)系。其中,凌云光是為數(shù)不多的給出明確回應(yīng)的公司,稱(chēng)其采用多模態(tài)融合技術(shù)解決客戶(hù)多場(chǎng)景的智能制造需求,屬于向具身智能方向發(fā)展的必經(jīng)環(huán)節(jié)。
結(jié)合機(jī)構(gòu)研報(bào),據(jù)《科創(chuàng)板日?qǐng)?bào)》不完全梳理,還有這些公司均受到關(guān)注:
聯(lián)系客服