繼PC互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)之后,IOT時代正在到來,人工智能在近幾年獲得突破之后,很多創(chuàng)業(yè)公司包括大公司都趨之若鶩,不僅在國內(nèi),美國也一樣,好像現(xiàn)在做互聯(lián)網(wǎng)做IOT不談人工智能就是OUT了。
雖然這些掛著人工智能噱頭的公司,在未來一兩年內(nèi)或許是大批死去,但人工智能是下一波浪潮,會誕生下一波獨(dú)角獸公司應(yīng)該是毋庸置疑的。
對于創(chuàng)業(yè)者來說,首先要明白的是,人工智能的研究、應(yīng)用與落地,需要與某一個行業(yè)、領(lǐng)域或者場景相結(jié)合,否則是沒有意義的。人工智能是一種技術(shù),技術(shù)最終都需要落地,解決我們現(xiàn)在不能解決的問題,或者提高我們當(dāng)前解決問題的效率。
今天來分享一篇文章,《尋找下個獨(dú)角獸:深度解析 A.I. 創(chuàng)業(yè)的三種模式》,作者李智勇(微信公眾號ID:zuomoshi)。
這次A.I.浪潮看著眼花繚亂,但實際上只有四個可能的落地方向:一是語音、語義的突破導(dǎo)致語音交互最終真的成為可能;二是計算機(jī)視覺的突破導(dǎo)致AR這樣的混合了現(xiàn)實空間和虛擬空間的顯示方式;三是計算機(jī)視覺的突破讓自動化得以升級,出現(xiàn)自動駕駛汽車、機(jī)器人這樣的高度自動化產(chǎn)品;
四是機(jī)器學(xué)習(xí)提供了新的數(shù)據(jù)處理方式。
前三種的創(chuàng)業(yè)模式又可以分為:產(chǎn)品系,從軟到硬以及從硬到軟。這篇文章探討這三種模式的優(yōu)劣。我們耳熟能詳?shù)娜斯ぶ悄軇?chuàng)業(yè)公司基本上是產(chǎn)品系,比如國內(nèi)的出門問問、Rokid機(jī)器人,國外的Jibo、Savioke、Knightscope、Meta等。這類創(chuàng)業(yè)公司的根本特征是嘗試借用人工智能上的技術(shù)突破,打造具有新奇體驗的新產(chǎn)品(帶語音交互或者AR等),并跑出漂亮的銷售曲線。漂亮的銷售曲線意味著新產(chǎn)品的市場一旦啟動,那在之后的三年里,銷售曲線是倍增(可能高于2倍)的,而不是每年增加百分之十這類緩慢遞增。反過來講這意味著這些創(chuàng)業(yè)公司的決勝期實際上只有三年。不管你之前做了多少,一旦你錯過這三年,那所有努力工作可能就變得沒有價值。那多久市場才會從早期市場變得真的啟動呢?這沒人知道,趨勢是可以用邏輯推演判斷的,但具體的啟動時間點其實都是瞎猜??赡苁?年,也可能是2年,甚至5年,10年。這樣一來所有產(chǎn)品系的ai創(chuàng)業(yè)者們要把握的關(guān)鍵點就只有兩個:- 在一個不可清晰預(yù)測長度的預(yù)熱期做好充足的準(zhǔn)備,包括產(chǎn)品、銷售渠道、生產(chǎn)制造能力等。
如果第一點沒做好,那就是老羅和他的錘子科技,如果第二點沒做好那其實會像某些大企業(yè),比如摩托羅拉,什么都不缺但就是干不成事。如果兩點都做好了那就必是新的獨(dú)角獸企業(yè)。這里必須強(qiáng)調(diào)的是達(dá)成上述兩個目標(biāo)時真正重要的是產(chǎn)品體驗而不是技術(shù)的先進(jìn)性,也就是說這種模式更需要喬布斯這樣能用好技術(shù)的人而不是謝爾蓋布林這樣能創(chuàng)造技術(shù)的人。哪怕所有技術(shù)都是別人的,但只要不影響用戶體驗,那其實關(guān)聯(lián)不大,但實際上由于這一代AI的創(chuàng)業(yè)者都非常聰明和野心勃勃,他們都不想純粹的變成組裝型企業(yè),所以這類創(chuàng)業(yè)公司通常會在初期就嘗試卡住技術(shù)上的某幾個關(guān)鍵點,比如ASR等。這里面比較極致的是出門問問,根據(jù)各種信息來看,出門問問全線打造了自己的ASR、NLU甚至搜索。這就導(dǎo)致產(chǎn)品系創(chuàng)業(yè)很像爬珠穆朗瑪峰的北坡,成了必是一番大事業(yè),但成功非常艱難。高風(fēng)險來自于這樣兩個方面:
- 預(yù)熱期的時長高度不可預(yù)測。拋開AI不論,到現(xiàn)在為止這個模式下里國內(nèi)比較成功的一家企業(yè)是大疆。大疆的銷售開始起飛大約是2013年(暫時沒有官方數(shù)據(jù),只有Dronelife的猜測數(shù)據(jù))。
那大疆哪一年成立的呢?2006年,也就是說大疆等待產(chǎn)品起飛等待了差不多7年。2.成本因想卡住關(guān)鍵技術(shù)點而大幅增加。前面提到過,新一批創(chuàng)業(yè)者們通常并不想自己成為單純的組裝和銷售公司,所以會在早期就把握住幾個關(guān)鍵的技術(shù)點。這對產(chǎn)品起量后企業(yè)發(fā)展有利,沒有這些點上的控制權(quán)即使成了也可能變成現(xiàn)在的某類PC和手機(jī)企業(yè)。這未必不對,畢竟亞馬遜為了做Echo也收購了三家公司完整搭建自己的技術(shù)體系,但無疑,這對創(chuàng)業(yè)公司而言會顯著增加成本和風(fēng)險,會導(dǎo)致企業(yè)長期處在收入沒著落但支出比較高的狀態(tài)。不管從硬到軟還是從軟到硬,說的都是公司本身不做產(chǎn)品、而是為做產(chǎn)品的公司提供服務(wù)。從硬到軟說的是公司認(rèn)為公司優(yōu)勢必須從前端(比如麥克風(fēng)陣列)開始,延伸到后端(云端)。從軟到硬則是說公司認(rèn)為云是智能的核心,前端優(yōu)先級較低。當(dāng)然我們可以講最好兩端都強(qiáng),但創(chuàng)業(yè)公司由于資源、創(chuàng)始人背景限制通常只能先強(qiáng)調(diào)某一部分。這兩種模式又可以分別落在語音交互與計算機(jī)視覺上,但由于很難雜在一起說的清楚,所以下面會拿語音交互這個方向做例子先把這兩種模式說清楚,最后再總的分析下這兩種模式。國內(nèi)語音交互人工智能創(chuàng)業(yè)公司里走從硬到軟賽道的公司還比較稀少,最典型的應(yīng)該是聲智科技(這公司是我Portfolio公司,所以比較了解),聲智科技是從最底層的聲學(xué)陣列開始,先做噪聲抑制、混響消除、回聲抵消等,反過來再考慮上面的ASR等,與云知聲等的道路正相反。這種模式的好處是可以站到產(chǎn)業(yè)鏈的最前端,容易落地,是數(shù)據(jù)的必經(jīng)之路。而數(shù)據(jù)本身是未來ASR甚至NLU的核心驅(qū)動力,所以后勁比較足。壞處是短期需要用硬件獲取客戶,并且需要組織硬件的生產(chǎn),需要較多的啟動資金。可以講產(chǎn)品系創(chuàng)業(yè)公司的成功事實上有兩個外部要求:一是趨勢要來,其次是產(chǎn)品要經(jīng)得起市場檢驗。從硬到軟的公司也有兩個外部要求,一是趨勢要來,二是要技術(shù)過硬,有價格優(yōu)勢。2B的公司所面臨的客戶通常非常理性,很多花哨營銷反倒是作用不大。語音交互上從軟到硬比較典型的創(chuàng)業(yè)企業(yè)則是云知聲,這種模式選擇和公司定位甚至從名字上就可以看得出來。從軟到硬的好處是更容易覆蓋已有的成熟計算平臺,比如所有的 App 都需要一個自己的Siri,那云知聲這樣的企業(yè)只要做好技術(shù)壁壘,等著攜程、今日頭條上門就行了。這個方向上主要的挑戰(zhàn)在于要和大公司(比如百度和訊飛)直接競爭。我們這篇文章主要關(guān)注的是新硬件產(chǎn)品上落地,所以這點不再展開。壞處則是在新硬件產(chǎn)品(Echo、汽車、機(jī)器人、AR等)上很難落地,因為為了在新硬件產(chǎn)品上落地,中間必須加入陣列那一層,否則效果會很差。而一旦無法落地,其技術(shù)優(yōu)勢就很容易被突破。語音識別的精度骨子里是數(shù)據(jù)驅(qū)動的,但顯然不做陣列等硬件,你沒法落地,沒法落地就沒有數(shù)據(jù),也就很難獲得數(shù)據(jù)、技術(shù)、精度、場景上的正反饋,也就不容易解決真實環(huán)境的語音識別精度問題。云知聲等顯然認(rèn)識到了這一點,所以也在積極往這一方向擴(kuò)展。這時候通常會碰到軟件企業(yè)跨界做硬件的一般性問題,比如供應(yīng)鏈侃價搞不定會導(dǎo)致同樣的產(chǎn)品成本會高個百分之幾十等。路線差異起源于對計算架構(gòu)的認(rèn)知上面拿語音語義的企業(yè)做了個例子,但事實上在計算機(jī)視覺上同樣成立,只不過細(xì)節(jié)會有差異,比如Movidus的芯片可能在端上就把圖像識別處理完了,而不需要像麥克風(fēng)陣列那樣自己處理后再把結(jié)果傳到云端。這種模式選擇背后隱含的共通的東西是對計算架構(gòu)認(rèn)知和假設(shè)。到現(xiàn)在為止這種假設(shè)和認(rèn)知一共有三種:一種是為保證體驗(速度等)端始終要扮演重要的角色,云用來輔助端完成計算。所有我們用的硬件產(chǎn)品:手機(jī)、Pad等基本都是這種模式;一種是計算應(yīng)該大部分發(fā)生在云上。Google主推的ChromeBook是這種模式,以前銀行里的終端也是這種模式;一種是正在興起的傳感器+Fog computing+云架構(gòu)。這種可以看成是第一種架構(gòu)的擴(kuò)展,比如智能家居里所有的設(shè)備都直接連云上計算成本太高,那就不如家里有一個中樞先把能處理的處理了(比如天冷開空調(diào),下雨關(guān)窗戶就不傳到云端了),實在不行的再連云。前兩種架構(gòu)在現(xiàn)實里經(jīng)常會發(fā)生PK,并且導(dǎo)致很嚴(yán)重的后果,下面說兩個例子:一次PK發(fā)生在PC上,那時候Oracle等嘗試做的Network Computer骨子里的含義就是把各種計算轉(zhuǎn)移到后端,讓前端就變成輸入輸出設(shè)備。這種嘗試顯然失敗的慘不忍睹,但有意思的是20幾年后當(dāng)PC這個品類足夠成熟后仍然走這條路線的Chromebook卻看到了些成功的曙光。一次發(fā)生在Native APP和HTML5上,當(dāng)時Facebook是很希望主推HTML5,那時候扎克伯格想用Web App來打破iOS和Anroid的壟斷,但實際上Facebook差點死在在這個選擇上,因為這選擇幾乎讓它錯過移動互聯(lián)網(wǎng),后續(xù)的Instagram與WhatsApp大額收購很可能與這種錯誤路線的選擇有關(guān)。我個人對此的基本認(rèn)知是:對于新品類硬件產(chǎn)品剛出現(xiàn)的時候,首先是端要足夠強(qiáng)大,把體驗做到極致,隨著應(yīng)用、帶寬等的逐步發(fā)展,那端上的計算量可能會轉(zhuǎn)移到云上,因為那會有成本優(yōu)勢,但這需要一個漫長的過程,PC走了20幾年剛看到這可能性。如果這是對的,那意味著在新硬件產(chǎn)品上,首先成立的會是從硬到軟的模式,而不是從軟到硬。AR、自動駕駛等都和前面說的語音交互一樣要先解決終端上的問題,讓產(chǎn)品能夠快速準(zhǔn)確的進(jìn)行實時響應(yīng),確保用戶體驗,之后再談其它。也可以換個角度來考慮這問題,在新產(chǎn)品上更可能是先有iPhone才有Android手機(jī),而不是掉過來,因為iPhone給用戶的沖擊更強(qiáng),更容易樹立起一個新的品類,但iPhone不可能用HTML做出來的。但確實從硬到軟的模式對創(chuàng)始人提出更復(fù)雜的要求,比如聲智科技的陳孝良首先是聲學(xué)專家,同時也是語音識別專家所以才會選擇這種從前端開始,結(jié)合后端的路線。而云知聲的CTO是計算機(jī)科學(xué)家,更擅長的是算法,深度學(xué)習(xí),所以先天上就會傾向于用數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)算法和大幅增長的計算能力(從云計算到HPC)來解決問題。轉(zhuǎn)到重視端的這條路上來同時需要跨越思維和技術(shù)壁壘,也許不太容易。
1.AI的浪潮來了。
2.一定會有新的硬件產(chǎn)品出現(xiàn)。所以一定會有新的獨(dú)角獸從產(chǎn)品系中誕生。如果你認(rèn)為新硬件產(chǎn)品必須端的強(qiáng)大做支持,確保體驗,而新品類的基本出現(xiàn)次序也是先有 iPhone,才有 Android,那很可能你會同意有獨(dú)角獸會先從從硬到軟的模式里出現(xiàn)。(我曾經(jīng)和很多人講過這些觀點,但很巧的是直到最近才碰到一個做投資的美女和我認(rèn)知非常一致,不會說我是抄襲她觀點吧......)必須強(qiáng)調(diào)的是這篇文章里主要探討的是新的硬件產(chǎn)品下的可能狀態(tài),數(shù)據(jù)分析類不在這篇文章覆蓋范圍內(nèi)(數(shù)據(jù)分析是純粹的云端計算),主要面向現(xiàn)有平臺(手機(jī)、Pad等)的產(chǎn)品或服務(wù)也不在這文章覆蓋的范圍內(nèi)。
本文由作者,前360戰(zhàn)略分析師,一個愛折騰的程序員以及自媒體,李智勇
本文由作者,前360戰(zhàn)略分析師,一個愛折騰的程序員以及自媒體,李智勇授權(quán)轉(zhuǎn)載。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。