計(jì)算機(jī)視覺(jué):AI行業(yè)最具商業(yè)化價(jià)值的賽道
計(jì)算機(jī)視覺(jué)是國(guó)內(nèi)外AI企業(yè)最集中的領(lǐng)域,商業(yè)成熟度較高。從AI企業(yè)的應(yīng)用技術(shù)方向分布來(lái)看,計(jì)算機(jī)視覺(jué)技術(shù)企業(yè)在全球AI企業(yè)中占比約40%,在國(guó)內(nèi)占比約46%;無(wú)論國(guó)外還是國(guó)內(nèi),計(jì)算機(jī)視覺(jué)都是AI企業(yè)最集中的領(lǐng)域。從市場(chǎng)規(guī)模來(lái)看,2017年計(jì)算機(jī)視覺(jué)市場(chǎng)占全球AI市場(chǎng)總規(guī)模的16.9%,排在語(yǔ)音識(shí)別之后;而國(guó)內(nèi)計(jì)算機(jī)視覺(jué)市場(chǎng)占AI市場(chǎng)的34.9%,排名第一。國(guó)內(nèi)外計(jì)算機(jī)視覺(jué)的市場(chǎng)規(guī)模差異要遠(yuǎn)大于企業(yè)分布差異,說(shuō)明國(guó)內(nèi)計(jì)算機(jī)視覺(jué)公司的總體盈利能力較其他AI領(lǐng)域的公司較強(qiáng),商業(yè)成熟度較高。
計(jì)算機(jī)視覺(jué)是AI領(lǐng)域應(yīng)用場(chǎng)景最豐富、商業(yè)化價(jià)值最大的賽道。目前,AI技術(shù)處理的數(shù)據(jù)類(lèi)型不外乎四類(lèi):文字、語(yǔ)音、圖像和視頻。從信息維度來(lái)看,從文字到視頻維度是遞增的,文字的信息維度最少、包含的信息量也最少,視頻的信息維度最多、包含的信息量最大。反映在數(shù)據(jù)量占比上,以線上數(shù)據(jù)為例,根據(jù)Cisco的研究,到2022年全球線上視頻流量占總流量的比例將從2017年的75%上升到82%,說(shuō)明線上數(shù)據(jù)將越來(lái)越被視頻數(shù)據(jù)所主導(dǎo)。
信息維度更高加之?dāng)?shù)據(jù)量更大,因此以圖像和視頻為主要處理對(duì)象的計(jì)算機(jī)視覺(jué)要比以文字或語(yǔ)音為主要處理對(duì)象的其它AI技術(shù)具有更加豐富的應(yīng)用場(chǎng)景和商業(yè)化價(jià)值。我們認(rèn)為,當(dāng)前資本市場(chǎng)也正以其資源配置、資產(chǎn)定價(jià)功能充分反映計(jì)算機(jī)視覺(jué)相對(duì)其它AI領(lǐng)域的優(yōu)勢(shì)。例如,根據(jù)公開(kāi)資料,當(dāng)前計(jì)算機(jī)視覺(jué)行業(yè)四家頭部初創(chuàng)企業(yè)(商湯、曠視、依圖、云從)的總估值已經(jīng)超過(guò)1000億人民幣,也超過(guò)了語(yǔ)音識(shí)別行業(yè)幾家頭部初創(chuàng)企業(yè)(思必馳、云知聲、出門(mén)問(wèn)問(wèn)、圖靈機(jī)器人、捷通華聲)總估值加上AI語(yǔ)音龍頭科大訊飛的市值總和。
市場(chǎng)格局上,科技巨頭把控基礎(chǔ)層,初創(chuàng)企業(yè)領(lǐng)跑應(yīng)用層。計(jì)算機(jī)視覺(jué)架構(gòu)從下至上:1)基礎(chǔ)層——核心芯片被Intel、Nvidia等傳統(tǒng)芯片廠商把控,新型芯片廠商尚未崛起,規(guī)模應(yīng)用有待時(shí)日;開(kāi)源平臺(tái)以谷歌的Tensorflow、Facebook的Caffe等為主,其它企業(yè)的深度學(xué)習(xí)框架多為二次開(kāi)發(fā);2)技術(shù)層——算法,初創(chuàng)企業(yè)占優(yōu);云計(jì)算,幾乎被AWS、Google Cloud、Azure、阿里云等壟斷;3)應(yīng)用層——垂直行業(yè)龍頭占據(jù)場(chǎng)景,技術(shù)層初創(chuàng)企業(yè)向上滲透。根據(jù)IDC,2017年中國(guó)計(jì)算機(jī)應(yīng)用市場(chǎng)總規(guī)模約為15.5億元,商湯、曠視、依圖、云從“四小龍”市場(chǎng)份額共計(jì)達(dá)69.4%,至2022年中國(guó)計(jì)算機(jī)視覺(jué)應(yīng)用市場(chǎng)規(guī)模將達(dá)到146. 1億元人民幣。
目前中國(guó)計(jì)算機(jī)視覺(jué)算法企業(yè)在技術(shù)水平、商業(yè)化程度以及融資能力(估值)上均領(lǐng)先于國(guó)際同行。技術(shù)上,近年來(lái)中國(guó)計(jì)算機(jī)視覺(jué)頭部算法企業(yè)在國(guó)際性圖像識(shí)別競(jìng)賽如ImageNet、FRVT、MSR IRC等中頻繁摘得桂冠;商業(yè)化上,根據(jù)公開(kāi)報(bào)道,商湯、曠視、云從等在2017年均已實(shí)現(xiàn)盈利,而國(guó)際初創(chuàng)企業(yè)同行如EverAI等尚處于凈投入階段;另外,從估值上看,CV四小龍均已達(dá)到數(shù)十億美元估值,而國(guó)外尚沒(méi)有僅靠人臉識(shí)別、圖像識(shí)別就估值破十億美元的初創(chuàng)企業(yè)。
分析上述領(lǐng)先優(yōu)勢(shì)產(chǎn)生的原因,我們認(rèn)為,主要是由于國(guó)內(nèi)頭部計(jì)算機(jī)視覺(jué)算法企業(yè)充分享受了安防行業(yè)(尤其是視頻監(jiān)控)發(fā)展的紅利:一是安防市場(chǎng)快速成長(zhǎng)的紅利,2007年至2017年我國(guó)安防行業(yè)十年CAGR達(dá)16%,2016年以后安防智能化趨勢(shì)確定,計(jì)算機(jī)視覺(jué)技術(shù)率先得到應(yīng)用;二是政策真空紅利,與歐美國(guó)家相比,當(dāng)前我國(guó)對(duì)公民生物特征的保護(hù)政策并不完善(見(jiàn)下文),因此國(guó)內(nèi)計(jì)算機(jī)視覺(jué)算法企業(yè)可以從包括地方政府在內(nèi)的各種機(jī)構(gòu)中獲得大量的人臉、人像數(shù)據(jù)用于模型訓(xùn)練和算法改進(jìn)。根據(jù)Quartz的報(bào)道,中國(guó)某頭部計(jì)算機(jī)視覺(jué)算法企業(yè)聲稱(chēng)擁有20億張訓(xùn)練圖,而國(guó)際最大的公開(kāi)圖庫(kù)之一的ImageNet僅擁有1300萬(wàn)丈左右的訓(xùn)練圖,相差150倍以上。
從市場(chǎng)結(jié)構(gòu)上看,國(guó)內(nèi)外市場(chǎng)結(jié)構(gòu)略有不同:國(guó)內(nèi)安防、金融、互聯(lián)網(wǎng)為主,國(guó)外消費(fèi)、機(jī)器人(及機(jī)器視覺(jué))、智能駕駛領(lǐng)先。根據(jù)IDC的市場(chǎng)跟蹤,2018年中國(guó)計(jì)算機(jī)視覺(jué)技術(shù)輸出規(guī)模最大的3個(gè)行業(yè)是政府、金融和互聯(lián)網(wǎng),最大的兩個(gè)場(chǎng)景為政府行業(yè)中的平安城市以及金融行業(yè)中基于人臉識(shí)別的身份認(rèn)證。而根據(jù)Tractica的預(yù)測(cè),2018年全球計(jì)算機(jī)視覺(jué)技術(shù)輸出規(guī)模最大的3個(gè)行業(yè)分別為消費(fèi)、機(jī)器人(及機(jī)器視覺(jué))以及智能駕駛。
我們認(rèn)為影響計(jì)算機(jī)視覺(jué)落地的三個(gè)主要因素為監(jiān)管政策、行業(yè)接受度及用戶接受度,三者并不割裂:監(jiān)管政策表明了監(jiān)管機(jī)構(gòu)的態(tài)度,行業(yè)接受度體現(xiàn)了行業(yè)玩家的購(gòu)買(mǎi)意愿,而用戶接受度一定程度上會(huì)影響監(jiān)管政策和行業(yè)接受度。造成國(guó)內(nèi)外計(jì)算機(jī)視覺(jué)市場(chǎng)結(jié)構(gòu)巨大差異的主要原因,我們認(rèn)為是監(jiān)管政策和行業(yè)接受度的不同。
在歐美國(guó)家,生物特征作為關(guān)鍵的個(gè)人信息在被科技公司收集和使用時(shí)受到法律法規(guī)的嚴(yán)格保護(hù)。去年5月25日,歐盟史上適用范圍最廣、定則條例最嚴(yán)、處罰金額最昂貴的數(shù)據(jù)保護(hù)法案GDPR生效,該法案將指紋、人臉、視網(wǎng)膜等信息全部納入個(gè)人資產(chǎn)范疇,對(duì)科技公司利用上述信息盈利進(jìn)行了嚴(yán)格規(guī)定和限制。因此,在歐美計(jì)算機(jī)視覺(jué)率先在政策較為寬松、用戶接受度較高的領(lǐng)域落地,例如消費(fèi)和智能駕駛等。
在中國(guó),首先,公民生物特征的保護(hù)政策并不完善;其次,基于安防效率和成本方面的考慮,政府是計(jì)算機(jī)視覺(jué)產(chǎn)品最早、最積極的買(mǎi)家之一。由于政府信用和購(gòu)買(mǎi)力良好,加之安防行業(yè)成熟度高(利于計(jì)算機(jī)視覺(jué)技術(shù)集成)、圖像及視頻數(shù)據(jù)豐富(利于計(jì)算機(jī)視覺(jué)算法、模型訓(xùn)練),因此計(jì)算機(jī)視覺(jué)最先在安防領(lǐng)域落地。此外政策因素(如實(shí)名制、反洗錢(qián)等)也是導(dǎo)致國(guó)內(nèi)金融業(yè)主動(dòng)擁抱計(jì)算機(jī)視覺(jué)技術(shù)的主要原因。
企業(yè)核心競(jìng)爭(zhēng)壁壘,中短期看是技術(shù)能力和產(chǎn)品化能力,長(zhǎng)期看是生態(tài)構(gòu)建能力。
中短期來(lái)看,包括人臉識(shí)別、人體識(shí)別、圖像識(shí)別等在內(nèi)的主要計(jì)算機(jī)視覺(jué)技術(shù)均基于使用神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,而神經(jīng)網(wǎng)絡(luò)的種類(lèi)選擇、結(jié)構(gòu)設(shè)計(jì)以及參數(shù)調(diào)整等是一連串極其復(fù)雜的工作,因此算法的優(yōu)劣和迭代速度將直接取決于算法設(shè)計(jì)人員的知識(shí)和經(jīng)驗(yàn)儲(chǔ)備,也會(huì)進(jìn)一步?jīng)Q定計(jì)算機(jī)視覺(jué)技術(shù)的準(zhǔn)確率、可靠性等關(guān)鍵性能。ImageNet競(jìng)賽中神經(jīng)網(wǎng)絡(luò)隱含層數(shù)對(duì)圖像識(shí)別準(zhǔn)確率的影響最能說(shuō)明問(wèn)題。從10年至15年,隨著神經(jīng)網(wǎng)絡(luò)隱含層數(shù)的增多,圖像分類(lèi)Top-5錯(cuò)誤率隨之顯著降低(見(jiàn)下圖),但與此同時(shí)算法設(shè)計(jì)的復(fù)雜度越來(lái)越高,對(duì)技術(shù)人員的要求也越來(lái)越高。
此外,計(jì)算機(jī)視覺(jué)技術(shù)在場(chǎng)景中落地時(shí)需要企業(yè)具備大量的除算法以外的know how,例如在軟硬件結(jié)合以及保護(hù)終端用戶隱私上的知識(shí)和經(jīng)驗(yàn)等?,F(xiàn)階段,掌握技術(shù)的AI人才(尤其是頂級(jí)人才)主要分布在高校及科研院所,產(chǎn)業(yè)內(nèi)的人才供應(yīng)不足,加之多數(shù)場(chǎng)景下計(jì)算機(jī)視覺(jué)的落地能力不足,人才的爭(zhēng)奪與落地能力的競(jìng)爭(zhēng)將決定企業(yè)的發(fā)展速度。
但是,技術(shù)層面,隨著自動(dòng)機(jī)器學(xué)習(xí)技術(shù)AutoML的出現(xiàn),機(jī)器學(xué)習(xí)模型的設(shè)計(jì)門(mén)檻隨之降低。AutoML的出發(fā)點(diǎn)是用強(qiáng)大的算力通過(guò)更多次的訓(xùn)練提高模型的準(zhǔn)確度,其最大特點(diǎn)是將機(jī)器學(xué)習(xí)模型的設(shè)計(jì)過(guò)程自動(dòng)化。算法設(shè)計(jì)人員只需了解模型的基本概念并提供標(biāo)簽數(shù)據(jù)即可,神經(jīng)網(wǎng)絡(luò)的參數(shù)及結(jié)構(gòu)調(diào)整是自動(dòng)完成的,無(wú)需人工干預(yù)。目前AutoML已經(jīng)進(jìn)入落地階段。
例如,去年1 月谷歌發(fā)布了提供自定義圖像識(shí)別系統(tǒng)自動(dòng)開(kāi)發(fā)服務(wù)的 Cloud AutoML Vision,用戶從導(dǎo)入數(shù)據(jù)到訓(xùn)練模型都可以通過(guò)拖放式界面完成。AutoML已經(jīng)被谷歌應(yīng)用于CIFAR-10高度基準(zhǔn)測(cè)試數(shù)據(jù)集,并且訓(xùn)練出了與手工設(shè)計(jì)不相上下的模型。我們認(rèn)為,隨著AutoML技術(shù)的成熟,算法設(shè)計(jì)的門(mén)檻將越來(lái)越低,但相應(yīng)的,算力的重要性會(huì)越來(lái)越明顯,長(zhǎng)期來(lái)看有可能成為計(jì)算機(jī)視覺(jué)企業(yè)的核心競(jìng)爭(zhēng)力之一。
產(chǎn)品層面,我們認(rèn)為,隨著競(jìng)爭(zhēng)的加劇,成功的企業(yè)不僅要具備大量的跟技術(shù)落地相關(guān)的know how,還必須能夠主動(dòng)地挖掘甚至創(chuàng)造需求,具備類(lèi)似蘋(píng)果在智能手機(jī)上的理解力。這就要求企業(yè)在縱向上能夠主導(dǎo)整個(gè)產(chǎn)業(yè)鏈,橫向上能夠接入更多開(kāi)發(fā)者和場(chǎng)景,因此長(zhǎng)期看生態(tài)構(gòu)建能力將成為主要競(jìng)爭(zhēng)壁壘。
現(xiàn)階段,頭部算法企業(yè)橫向建立平臺(tái),垂直領(lǐng)域龍頭縱向深耕行業(yè),科技巨頭立體式打造全產(chǎn)業(yè)生態(tài)。
頭部算法企業(yè)的布局是橫向拓展基礎(chǔ)技術(shù),建立基礎(chǔ)平臺(tái)。例如,商湯以人臉識(shí)別技術(shù)起家,逐漸拓展到人體分析、機(jī)器人、無(wú)人駕駛等領(lǐng)域,加上GPU超算中心和云計(jì)算平臺(tái),逐漸將自身打造成一個(gè)基礎(chǔ)的人工智能平臺(tái),然后探索在應(yīng)用端的迅速落地。
垂直領(lǐng)域龍頭公司的布局是縱向打通計(jì)算機(jī)視覺(jué)框架,深耕所在行業(yè)。例如,安防設(shè)備龍頭??低曋饾u脫離了與初創(chuàng)算法企業(yè)的合作,自主研發(fā)關(guān)鍵技術(shù),并在ILSVRC(2016)圖像分類(lèi)獲得第一名;此外,還推出了AI Cloud平臺(tái),著力解決算力問(wèn)題。通過(guò)縱向打通基礎(chǔ)層、技術(shù)層和應(yīng)用層,垂直領(lǐng)域龍頭公司可以提出更加智能的行業(yè)解決方案。
科技巨頭公司的布局是以平臺(tái)為核心立體式地推進(jìn),打造全產(chǎn)業(yè)生態(tài)。例如,Google以TensorFlow及Google Cloud為核心,橫向上進(jìn)軍圖像分析、文字識(shí)別等技術(shù),推出Google Lens等視覺(jué)服務(wù)產(chǎn)品;縱向上向下拓展基礎(chǔ)硬件推出TPU芯片,向上拓展醫(yī)療(Verily)、無(wú)人駕駛(Waymo)等垂直領(lǐng)域,逐漸打造包括計(jì)算機(jī)視覺(jué)在內(nèi)的人工智能大生態(tài)。
2.智能語(yǔ)音:產(chǎn)業(yè)進(jìn)入爆發(fā)期,看好對(duì)話式人工智能發(fā)展
智能語(yǔ)音技術(shù)逐漸成熟,未來(lái)幾年市場(chǎng)將維持高速增長(zhǎng)。根據(jù)Gartner發(fā)布的2018年AI技術(shù)成熟度曲線,語(yǔ)音識(shí)別已經(jīng)進(jìn)入“實(shí)質(zhì)生產(chǎn)高峰期”,意味著語(yǔ)音識(shí)別技術(shù)已被廣泛接受,規(guī)?;涞丶磳㈤_(kāi)始。此外,像自然語(yǔ)言處理、虛擬助理等相關(guān)智能語(yǔ)音技術(shù)歷經(jīng)淘洗之后即將落入“泡沫化低谷期”,商業(yè)模式越來(lái)越成熟,也將進(jìn)一步推動(dòng)智能語(yǔ)音的落地。根據(jù)ReportLinker的預(yù)測(cè),全球智能語(yǔ)音市場(chǎng)規(guī)模將從2018年的75億美元增長(zhǎng)至2024年的215億美元,其中醫(yī)療健康、移動(dòng)銀行以及智能終端智能語(yǔ)音技術(shù)快速增長(zhǎng)的需求將成為主要的驅(qū)動(dòng)因素。
國(guó)內(nèi)外市場(chǎng)均已相對(duì)集中,頭部企業(yè)占據(jù)大部分市場(chǎng)份額。根據(jù)中商產(chǎn)業(yè)研究院的數(shù)據(jù),2018年智能語(yǔ)音全球市場(chǎng)CR5達(dá)到88%,中國(guó)市場(chǎng)CR5達(dá)到84.6%,均已呈現(xiàn)出相對(duì)較為集中的市場(chǎng)格局。值得注意的是,國(guó)內(nèi)的市場(chǎng)格局與國(guó)外存在著明顯的差異,主導(dǎo)國(guó)外市場(chǎng)的巨頭玩家如Nuance、谷歌等并沒(méi)有在中國(guó)市場(chǎng)取得同樣的市場(chǎng)地位。
我們認(rèn)為,這種現(xiàn)象主要是由兩方面原因造成的:一是由于中文與外語(yǔ)在分詞及句法的邏輯等方面有著明顯的不同,并且中國(guó)有大量獨(dú)具特色的方言,這種語(yǔ)言上的差異使得國(guó)內(nèi)企業(yè)在中文處理上獨(dú)具優(yōu)勢(shì);二是受益于國(guó)內(nèi)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,智能語(yǔ)音在國(guó)內(nèi)具有更加豐富的落地場(chǎng)景和商業(yè)化環(huán)境。這種“天時(shí)”、“地利”的優(yōu)勢(shì)使得中國(guó)企業(yè)領(lǐng)跑?chē)?guó)內(nèi)市場(chǎng)。
現(xiàn)階段,產(chǎn)品化能力是智能語(yǔ)音初創(chuàng)企業(yè)核心壁壘。一方面,從技術(shù)的角度,在無(wú)噪音環(huán)境下,機(jī)器的語(yǔ)音識(shí)別準(zhǔn)確率已經(jīng)達(dá)到相當(dāng)高水平,未來(lái)上升空間有限??蒲薪鐚㈠e(cuò)詞率(Word Error Rate, WER)視為衡量語(yǔ)音識(shí)別技術(shù)的核心指標(biāo)(準(zhǔn)確率=1-WER),其中人類(lèi)的平均WER為5.9%(即94.1%的準(zhǔn)確率),受過(guò)嚴(yán)格專(zhuān)業(yè)訓(xùn)練的速記員平均WER為3%(即97%的準(zhǔn)確率)。
自2016年機(jī)器的語(yǔ)音識(shí)別準(zhǔn)確率首次超過(guò)人類(lèi)平均水平以來(lái),目前最好的算法已經(jīng)可以將準(zhǔn)確率做到97.03%,超越專(zhuān)業(yè)速記員。另一方面,從商業(yè)化角度,技術(shù)難以成為企業(yè)核心壁壘,產(chǎn)品化能力才是成長(zhǎng)的關(guān)鍵。這是因?yàn)榧夹g(shù)的門(mén)檻越來(lái)越低,單純依靠提供技術(shù)的商業(yè)模式將面臨越來(lái)越大的競(jìng)爭(zhēng)因而難以持續(xù),這一點(diǎn)從近幾年頭部智能語(yǔ)音初創(chuàng)企業(yè)如云知聲、思必馳等紛紛從技術(shù)提供商轉(zhuǎn)向產(chǎn)品/服務(wù)提供商就可以看出。
技術(shù)全?;殉蔀樾纶厔?shì),產(chǎn)業(yè)鏈延伸是當(dāng)前最好策略。對(duì)于智能語(yǔ)音而言,多數(shù)場(chǎng)景下普遍存在的問(wèn)題是落地體驗(yàn)不好,而這帶來(lái)了技術(shù)上和產(chǎn)業(yè)上的兩層影響:技術(shù)上,落地體驗(yàn)的改善有賴(lài)于從硬件到軟件、從算法到產(chǎn)品各個(gè)環(huán)節(jié)的緊密協(xié)調(diào),在這種情況下,頭部企業(yè)多傾向于走技術(shù)全?;肪€,即打通全鏈條上的技術(shù)環(huán)節(jié);產(chǎn)業(yè)上,為了實(shí)現(xiàn)更好地商業(yè)化,企業(yè)傾向于通過(guò)上下游延伸創(chuàng)造更多價(jià)值。最能說(shuō)明上述兩個(gè)趨勢(shì)的例證是當(dāng)前幾乎所有的頭部初創(chuàng)企業(yè)都在布局專(zhuān)用語(yǔ)音芯片,主要原因是專(zhuān)用語(yǔ)音芯片的應(yīng)用性能可以達(dá)到通用芯片的40-50倍,而同時(shí)成本只有通用芯片的1/4-1/3。
通用平臺(tái)商打造開(kāi)放語(yǔ)音生態(tài),專(zhuān)業(yè)應(yīng)用商搶占重點(diǎn)賽道。智能語(yǔ)音市場(chǎng)玩家大體上可以分為兩種,一種是通用平臺(tái)商,另一種是專(zhuān)業(yè)應(yīng)用商。通用平臺(tái)商如谷歌、百度等科技巨頭,致力于圍繞智能語(yǔ)音開(kāi)放系統(tǒng)打造智能語(yǔ)音生態(tài)。以百度為例,公司在2017年全面開(kāi)放了語(yǔ)音接口,目前依托DuerOS打造出較為完整的技術(shù)、開(kāi)發(fā)與商業(yè)生態(tài)系統(tǒng),截至2018年7月底搭載DuerOS的智能設(shè)備激活數(shù)量已突破1億臺(tái)。專(zhuān)業(yè)應(yīng)用商以垂直領(lǐng)域和細(xì)分場(chǎng)景為突破口,均有重點(diǎn)布局的賽道。例如,云知聲重點(diǎn)布局家居、車(chē)載與醫(yī)療,思必馳重點(diǎn)布局家居、車(chē)載與機(jī)器人,兩者多有重合但側(cè)重上有差異。
對(duì)話式人工智能即將規(guī)?;涞兀春弥悄芗揖?、隨身設(shè)備、智能車(chē)載三個(gè)場(chǎng)景。與一般的智能語(yǔ)音應(yīng)用相比,對(duì)話式人工會(huì)智能中人與機(jī)器之間是雙向交互的,機(jī)器在追求理解人的意圖的同時(shí)也會(huì)給人以反饋(比如要求人進(jìn)一步明確意圖或者給出選擇等)。對(duì)話式人工智能的整個(gè)人機(jī)交互過(guò)程可分為喚醒、識(shí)別、理解、反饋四個(gè)環(huán)節(jié)。
從供需角度,對(duì)話式人工智能的供給方為對(duì)話式人工智能的硬件開(kāi)發(fā)者與軟件開(kāi)發(fā)者,產(chǎn)品為對(duì)話式人工智能應(yīng)用與服務(wù),包括音樂(lè)、視頻、游戲等;需求方為終端消費(fèi)者,整個(gè)需求產(chǎn)業(yè)鏈條自下而上包括芯片商、方案集成商、終端設(shè)備商、渠道商以及消費(fèi)者。對(duì)話式人工智能的中間樞紐是對(duì)話式人工智能平臺(tái),由互聯(lián)網(wǎng)科技巨頭、初創(chuàng)AI語(yǔ)音公司等提供。
我們認(rèn)為對(duì)話式人工智能將率先在智能家居、隨身設(shè)備、智能車(chē)載三個(gè)場(chǎng)景中實(shí)現(xiàn)大規(guī)模落地,原因是:1)上述三個(gè)場(chǎng)景作為家庭IoT、個(gè)人IoT以及車(chē)聯(lián)網(wǎng)的重要入口,是頭部企業(yè)爭(zhēng)奪的重點(diǎn),例如亞馬遜的Echo、蘋(píng)果的Siri、思必馳的飛歌GS2正是分別瞄準(zhǔn)上述場(chǎng)景;2)上述三個(gè)場(chǎng)景對(duì)智能語(yǔ)音技術(shù)的要求相對(duì)較低,例如智能家居和智能車(chē)載都是在相對(duì)封閉的環(huán)境,語(yǔ)音喚醒成功率和語(yǔ)音識(shí)別的準(zhǔn)確率會(huì)相對(duì)較高;3)上述三個(gè)場(chǎng)景中C端用戶對(duì)交互式人工智能的接受程度較高,IDC調(diào)研數(shù)據(jù)顯示89%的人有意向在未來(lái)兩年內(nèi)采用對(duì)話式人工智能終端,其中智能手機(jī)、智能電視、智能音箱、汽車(chē)等終端在美中兩國(guó)用戶中期望度最高、使用最為頻繁。根據(jù)IDC預(yù)測(cè),到2020年中國(guó)對(duì)話式人工智能在智能家居、隨身設(shè)備以及智能車(chē)載的滲透率將分別達(dá)到27%、68%、51%。
FAMGA布局啟示:車(chē)載、醫(yī)療、住宿以及企業(yè)級(jí)應(yīng)用或是智能語(yǔ)音未來(lái)最主要的落地場(chǎng)景,用戶隱私和數(shù)據(jù)安全保護(hù)值得關(guān)注。
在對(duì)話式人工智能領(lǐng)域,F(xiàn)acebook、Amazon、Microsoft、Google、Apple五巨頭布局較早,整體上引領(lǐng)技術(shù)和產(chǎn)業(yè)潮流,相關(guān)動(dòng)向?qū)Ξa(chǎn)業(yè)和投資布局具有極大的指導(dǎo)意義。目前看來(lái),五家公司選擇了截然不同的發(fā)展路徑,背后主要原因是公司的業(yè)務(wù)基因與核心優(yōu)勢(shì)具有顯著差異。我們梳理了五家公司在對(duì)話式人工智能領(lǐng)域的布局和動(dòng)向,具體如下:
1)Amazon:優(yōu)勢(shì)領(lǐng)域在智慧家居,通過(guò)開(kāi)放合作拓展其它場(chǎng)景。Amazon是最早實(shí)現(xiàn)對(duì)話式人工智能規(guī)模落地的巨頭之一,其智能音箱產(chǎn)品Amazon Echo系列(包括Echo、Echo Dot等)自2014年推出以來(lái),至去年年出貨量已經(jīng)達(dá)到2420萬(wàn)臺(tái),全球市場(chǎng)份額始終維持第一。
由于在電商領(lǐng)域具有絕對(duì)優(yōu)勢(shì),Amazon在對(duì)話式人工智能領(lǐng)域的主要目標(biāo)之一是主導(dǎo)語(yǔ)音購(gòu)物市場(chǎng)。目前語(yǔ)音購(gòu)物主要發(fā)生在智能家居場(chǎng)景中,以智能音箱為載體實(shí)現(xiàn)。但是除語(yǔ)音購(gòu)物以外,Amazon在提供其他服務(wù)上并不具備優(yōu)勢(shì),主要原因在于相對(duì)缺乏豐富的軟件應(yīng)用支持。因此,公司采取了相對(duì)開(kāi)放的策略,最值得關(guān)注的動(dòng)作之一是創(chuàng)建了Amazon Connect Kit協(xié)助開(kāi)發(fā)者為用戶提供更多可以接入Alexa的定制化硬件產(chǎn)品和應(yīng)用服務(wù)。截至2月份,全球已經(jīng)有超過(guò)4500個(gè)品牌、2.8萬(wàn)個(gè)智能家居終端接入到了Alexa上,家電巨頭如LG、三星、GE等都有產(chǎn)品接入。
除智能家居場(chǎng)景外,Amazon也在拓展其他場(chǎng)景,例如去年8月推出了Alexa Auto SDK以幫助汽車(chē)制造商將Alexa語(yǔ)音控制功能集成到汽車(chē)娛樂(lè)信息系統(tǒng)上。我們認(rèn)為Amazon在對(duì)話式人工智能的場(chǎng)景拓展上的主要劣勢(shì)在于缺乏其競(jìng)爭(zhēng)對(duì)手如 Google、Apple等均具備的手機(jī)、平板、PC等多種硬件級(jí)入口。根據(jù)IHS的預(yù)測(cè),到2020年Amazon Alexa的市場(chǎng)份額將被顯著壓縮,跟我們的觀點(diǎn)相符。
2)Google:背靠強(qiáng)大的自然語(yǔ)言處理技術(shù)及豐富的軟件群發(fā)力服務(wù)領(lǐng)域。Google有著多年的自然語(yǔ)言處理技術(shù)沉淀,在底層對(duì)話式人工智能技術(shù)上占據(jù)相對(duì)優(yōu)勢(shì)。根據(jù)公開(kāi)信息,2019年Google將支持超過(guò)30種語(yǔ)言的語(yǔ)音識(shí)別與自然語(yǔ)言處理,并具備同時(shí)理解兩種以上語(yǔ)言的能力。此外,Google還擁有包括郵件、地圖、搜索等在內(nèi)的龐大SaaS軟件群,同時(shí)擁有手機(jī)、平板、PC等多種硬件終端,使其可以收集并使用更豐富的場(chǎng)景下用戶的語(yǔ)音數(shù)據(jù)來(lái)提升自身處理語(yǔ)音請(qǐng)求的能力。我們認(rèn)為,上述兩個(gè)優(yōu)勢(shì)是Google在智能音箱出貨量上能夠快速追趕Amazon的主要原因(見(jiàn)圖表27),同時(shí)也是Google在個(gè)人服務(wù)領(lǐng)域和公共服務(wù)領(lǐng)域落地對(duì)話式人工智能技術(shù)時(shí)的獨(dú)特競(jìng)爭(zhēng)力所在。
在個(gè)人服務(wù)領(lǐng)域,Google推出了Duplex聊天機(jī)器人,該機(jī)器人最大特點(diǎn)是可以模仿人聲撥打和接聽(tīng)電話,在對(duì)話時(shí)能實(shí)時(shí)理解對(duì)方意圖并做出及時(shí)反饋,同時(shí)輸出的語(yǔ)音中還會(huì)包含停頓以及“嗯”、“額”等常見(jiàn)的口語(yǔ)用詞,已經(jīng)很大程度上做到了擬人化。此前Google收購(gòu)API.AI也是為了增強(qiáng)其聊天機(jī)器人的技術(shù)實(shí)力。API.AI提供聊天機(jī)器人的開(kāi)發(fā)框架,具備意圖識(shí)別、上下文管理等多種功能,使得Google可以強(qiáng)化聊天機(jī)器人的智能水平。
在公共服務(wù)領(lǐng)域,Google重點(diǎn)關(guān)注醫(yī)療及住宿。醫(yī)療領(lǐng)域,Google將智能音箱、谷歌助手等產(chǎn)品部署到了醫(yī)院及療養(yǎng)院,用戶可以通過(guò)上述產(chǎn)品尋求醫(yī)生幫助,醫(yī)生也可以通過(guò)手機(jī)App追蹤用戶請(qǐng)求;住宿領(lǐng)域,Google通過(guò)投資酒店聊天機(jī)器人公司GoMoment以及開(kāi)發(fā)谷歌助手的翻譯模式等方式使得酒店從前臺(tái)接待(如登記住房)到客房服務(wù)(如點(diǎn)外賣(mài))實(shí)現(xiàn)自動(dòng)化及智能化,搶占酒店服務(wù)市場(chǎng)。
3)Microsoft:避開(kāi)直接競(jìng)爭(zhēng),劍指企業(yè)領(lǐng)域。Microsoft在對(duì)話式人工智能領(lǐng)域的起步稍晚于Amazon和Google,同時(shí)在消費(fèi)級(jí)市場(chǎng)也并不具備入口與應(yīng)用優(yōu)勢(shì),因此Microsoft主要拓展對(duì)話式人工智能在其傳統(tǒng)優(yōu)勢(shì)領(lǐng)域——企業(yè)領(lǐng)域的應(yīng)用,從策略上避開(kāi)了與Google、Amazon等巨頭的直接競(jìng)爭(zhēng)。公司還跟Amazon進(jìn)行合作,跨系統(tǒng)打通了Cortana和Alexa,使得用戶可以通過(guò)Cortana喚醒Alexa進(jìn)行購(gòu)物,也可以通過(guò)Echo或者其它Alexa設(shè)備喚醒Cortana進(jìn)行辦公。由于Amazon和Microsoft的優(yōu)勢(shì)領(lǐng)域不同,這種合作的互補(bǔ)顯而易見(jiàn)。
此外,Microsoft還申請(qǐng)了一項(xiàng)專(zhuān)利,該專(zhuān)利使得用戶可以輕聲喚醒數(shù)字助理,為用戶在公共場(chǎng)合使用對(duì)話式人工智能終端提供了便利,凸顯了公司對(duì)企業(yè)領(lǐng)域的重視。
4)Apple:關(guān)注用戶隱私和數(shù)據(jù)安全。Apple于去年11月收購(gòu)了致力于開(kāi)發(fā)可以部署在消費(fèi)級(jí)終端上的輕量級(jí)的AI應(yīng)用的初創(chuàng)企業(yè)Silk Labs,此外還申請(qǐng)了離線喚醒Siri以及聲紋識(shí)別兩項(xiàng)專(zhuān)利。公司的主要目標(biāo)是使對(duì)話式人工智能技術(shù)可以在終端而非云端實(shí)現(xiàn),從而排除用戶對(duì)個(gè)人隱私和數(shù)據(jù)安全的憂慮。Apple發(fā)力隱私和安全與其過(guò)往遭受多起關(guān)于侵犯用戶隱私的集體訴訟有關(guān),可以說(shuō)公司對(duì)C端用戶的痛點(diǎn)具有超越競(jìng)爭(zhēng)對(duì)手的深刻認(rèn)知。
5)Facebook:戰(zhàn)略聚焦聊天機(jī)器人。Facebook也采取了跟Amazon合作的策略,我們認(rèn)為主要原因有兩個(gè):一是公司在對(duì)話式人工智能領(lǐng)域起步較晚,2018年才推出智能音箱Portal,在五巨頭中已處于相對(duì)落后地位;二是公司在去年遭遇了關(guān)于泄露用戶數(shù)據(jù)和隱私的巨大丑聞,跟Amazon合作可以緩解外界對(duì)公司獲得和濫用數(shù)據(jù)的擔(dān)憂。公司主要關(guān)注對(duì)話式人工智能在社交領(lǐng)域的應(yīng)用,2015年初收購(gòu)了語(yǔ)音指令創(chuàng)業(yè)公司wit.ai,此后在Messenger應(yīng)用上大規(guī)模部署了聊天機(jī)器人。在2016年4月的Facebook F8開(kāi)發(fā)者大會(huì)上,F(xiàn)acebook宣布Messenger為未來(lái)十年重點(diǎn)項(xiàng)目之一,并邀請(qǐng)開(kāi)發(fā)者加入Messenger一同開(kāi)發(fā)聊天機(jī)器人。
3.重點(diǎn)公司介紹
3.1商湯:AI算法提供商龍頭,平臺(tái)化戰(zhàn)略賦能公司和行業(yè)
AI算法提供商龍頭,“1+1+X”打造核心平臺(tái)。公司成立于2014年,創(chuàng)始人為香港中文大學(xué)工程學(xué)院教授湯曉鷗,業(yè)務(wù)聚焦于計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)領(lǐng)域,擁有2200位員工,其中約150位擁有世界頂級(jí)大學(xué)博士學(xué)位。2018年9月,公司被科技部選為“智能視覺(jué)”國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái)建設(shè)依托單位。公司采取平臺(tái)化戰(zhàn)略,主要的業(yè)務(wù)模式是首先進(jìn)行前期基礎(chǔ)技術(shù)研究,然后結(jié)合當(dāng)前行業(yè)應(yīng)用熱點(diǎn)生成相關(guān)產(chǎn)品和服務(wù),最后進(jìn)行營(yíng)銷(xiāo)和推廣,即“1(基礎(chǔ)研發(fā))+1(產(chǎn)品和服務(wù)化)+X(行業(yè)應(yīng)用)”打法。當(dāng)前公司戰(zhàn)略推進(jìn)順利,去年5月31日公司公告表示2017年已實(shí)現(xiàn)全面盈利,業(yè)務(wù)營(yíng)收連續(xù)三年保持400%同比增長(zhǎng),2018年主營(yíng)業(yè)務(wù)合同收入同比增長(zhǎng)10多倍。
內(nèi)生+外延,圍繞計(jì)算機(jī)視覺(jué)展開(kāi)全方位布局。公司通過(guò)內(nèi)生和外延不斷拓展技術(shù)和業(yè)務(wù)邊界,提前進(jìn)行產(chǎn)業(yè)布局。內(nèi)生上,公司以人臉識(shí)別技術(shù)起家,當(dāng)前核心技術(shù)已覆蓋人臉、人體、圖像、視頻、SLAM與3D、機(jī)器人、無(wú)人駕駛等多領(lǐng)域計(jì)算機(jī)視覺(jué)技術(shù),并且仍在不斷橫向拓展,進(jìn)而衍生出智能視頻、身份驗(yàn)證、移動(dòng)互聯(lián)網(wǎng)、智慧商業(yè)等多類(lèi)產(chǎn)品和服務(wù),覆蓋智慧城市、智能終端、互聯(lián)網(wǎng)娛樂(lè)、智慧金融、智慧商業(yè)、遙感、移動(dòng)運(yùn)營(yíng)商、無(wú)人駕駛、AR/VR等多個(gè)應(yīng)用場(chǎng)景。外延上,公司通過(guò)成立投資部門(mén),通過(guò)直投或者產(chǎn)業(yè)基金方式向下游延伸布局新應(yīng)用和新場(chǎng)景,投資標(biāo)的以在垂直領(lǐng)域已建立起行業(yè)場(chǎng)景、占據(jù)一定地位或者已具備一定行業(yè)認(rèn)知及客戶資源但技術(shù)和產(chǎn)品尚不成熟的初創(chuàng)企業(yè)為主,例如醫(yī)療健康領(lǐng)域的AI初創(chuàng)企業(yè)禾連健康、VR看房企業(yè)51VR等。
2015-2016兩年,公司及其聯(lián)合實(shí)驗(yàn)室的CVPR、ICCV 和 ECCV論文數(shù)量高達(dá) 76 篇,超過(guò)加州大學(xué)伯克利分校、斯坦福、麻省理工等國(guó)際頂級(jí)名校及 Google、Facebook 等科技巨頭;2017年,公司以43篇CVPR 和 ICCV論文雄踞亞洲第一;2018年,公司再度以81篇CVPR和ECCV論文傲視群雄。
算法儲(chǔ)備豐富、算力供應(yīng)充沛,長(zhǎng)期發(fā)展具有深厚底蘊(yùn)。根據(jù)公開(kāi)資料統(tǒng)計(jì),公司2015-2017年在三大頂級(jí)計(jì)算機(jī)視覺(jué)會(huì)議(CPVR、ICCV及ECCV)上共發(fā)表了119篇論文,內(nèi)容涵蓋深度學(xué)習(xí)、無(wú)人駕駛、物體檢測(cè)等諸多領(lǐng)域,數(shù)量上僅次于微軟和CMU,遠(yuǎn)領(lǐng)先于國(guó)內(nèi)其他企業(yè)。2018年,公司以81篇CVPR和ECCV論文創(chuàng)下中國(guó)AI學(xué)術(shù)新紀(jì)錄,展示出越來(lái)越強(qiáng)的學(xué)術(shù)研究能力,也說(shuō)明公司在算法領(lǐng)域有著豐富的儲(chǔ)備。此外,公司自主研發(fā)了支持千億級(jí)參數(shù)模型、百億訓(xùn)練樣板、億級(jí)類(lèi)別分類(lèi)任務(wù)的深度學(xué)習(xí)框架Parrots,以及擁有超過(guò)6000塊GPU并支持千卡并行訓(xùn)練的亞洲最大超算中心,算力供應(yīng)充沛,保證了模型可以得到快速驗(yàn)證。
我們認(rèn)為,公司重視基礎(chǔ)研究,強(qiáng)調(diào)技術(shù)原創(chuàng),在算法、算力上都能充分保障自身技術(shù)順暢迭代,長(zhǎng)期發(fā)展具有深厚底蘊(yùn)。
3.2曠視:優(yōu)秀的人臉識(shí)別平臺(tái)企業(yè),戰(zhàn)略進(jìn)軍AIoT
人臉識(shí)別先行者,軟硬件結(jié)合深入垂直場(chǎng)景。公司早于“四小龍”其它三家公司成立,三位聯(lián)合創(chuàng)始人印奇、唐文斌、楊沐均畢業(yè)于清華姚班,當(dāng)前擁有約1500名員工。公司早期業(yè)務(wù)以開(kāi)發(fā)C端人臉識(shí)別相關(guān)互聯(lián)網(wǎng)應(yīng)用為主,后轉(zhuǎn)向提供B端計(jì)算機(jī)視覺(jué)相關(guān)產(chǎn)品和服務(wù),旗下Face++是當(dāng)前世界上使用量最大的人臉識(shí)別引擎。公司主要的業(yè)務(wù)模式是基于核心計(jì)算機(jī)視覺(jué)技術(shù)深入垂直場(chǎng)景提供行業(yè)解決方案。目前,公司相關(guān)產(chǎn)品和服務(wù)已經(jīng)廣泛應(yīng)用于金融、安防、手機(jī)等多個(gè)領(lǐng)域,擁有包括阿里、螞蟻金服、富士康等在內(nèi)的上千家核心客戶。公開(kāi)信息顯示,依靠多領(lǐng)域的業(yè)務(wù)落地,公司近年來(lái)實(shí)現(xiàn)了5至7倍的營(yíng)收增長(zhǎng),2017年已實(shí)現(xiàn)盈利,主要收入來(lái)自于金融和安防。
戰(zhàn)略進(jìn)軍AIoT,打造個(gè)人、城市、供應(yīng)鏈“大腦”。2019年1月16日,公司公布了從AI到AIoT的全新戰(zhàn)略,戰(zhàn)略定位從算法提供商全面升級(jí)為AIoT解決方案提供商,并推出了智能供應(yīng)鏈操作系統(tǒng)“河圖”。根據(jù)我們的梳理,公司目前個(gè)人生活大腦、智慧城市大腦、智能供應(yīng)鏈大腦三大“大腦”場(chǎng)景業(yè)務(wù)群,其中:個(gè)人生活大腦以連接個(gè)人終端為主,聚焦于為C端用戶提供人臉解鎖、人臉支付等服務(wù),應(yīng)用場(chǎng)景包括手機(jī)解鎖、身份驗(yàn)核等;智慧城市大腦以連接城市攝像終端為主,聚焦于為G端客戶提供智能門(mén)禁、智能迎賓等產(chǎn)品/服務(wù),應(yīng)用場(chǎng)景包括智慧社區(qū)、教育管理等;供應(yīng)鏈大腦以連接工業(yè)機(jī)器人為主,聚焦于為B端客戶提供“貨到人”、“訂單到人”等解決方案,應(yīng)用場(chǎng)景包括智能工廠、智能倉(cāng)儲(chǔ)、新零售等。近兩年公司在外延方面表現(xiàn)活躍,先后投資了機(jī)器人、娛樂(lè)、零售等多個(gè)領(lǐng)域的初創(chuàng)企業(yè),業(yè)務(wù)布局持續(xù)延伸。
強(qiáng)大的軟硬件結(jié)合能力以及“阿里系”背景是公司核心差異化優(yōu)勢(shì)。公司自2015年起涉足硬件,陸續(xù)推出了攝像頭、人臉識(shí)別面板機(jī)、人證核驗(yàn)一體機(jī)、服務(wù)器、搬運(yùn)機(jī)器人等十余款軟硬件結(jié)合產(chǎn)品,在初創(chuàng)企業(yè)中處于絕對(duì)領(lǐng)先地位。我們認(rèn)為,從算法到產(chǎn)品/服務(wù)有天然隔閡,優(yōu)秀的算法并不能保證優(yōu)秀的產(chǎn)品。
公司的歷史發(fā)展表明其具有強(qiáng)大的軟硬件結(jié)合能力,能夠保障其技術(shù)端領(lǐng)先優(yōu)勢(shì)在產(chǎn)品端的延續(xù)。我們認(rèn)為,軟硬件一體化是打造商業(yè)閉環(huán)的必要條件,僅依靠算法無(wú)法滿足行業(yè)客戶的整體需求,安防行業(yè)內(nèi)AI算法提供商可以獲得部分項(xiàng)目機(jī)會(huì)但始終無(wú)法撼動(dòng)安防設(shè)備龍頭的地位即是最明顯的例證。此外,公司還是“四小龍”中唯一一家兩次獲得“阿里系”投資的企業(yè),我們判斷公司是阿里在計(jì)算機(jī)視覺(jué)領(lǐng)域選定的戰(zhàn)略抓手,未來(lái)“阿里系”可能會(huì)有更多資源注入,從支付寶、滴滴、天貓超市等“阿里系”公司相繼采用公司產(chǎn)品來(lái)看也能部分驗(yàn)證該想法。
我們認(rèn)為,公司軟硬件結(jié)合能力突出,保障了技術(shù)端優(yōu)勢(shì)在產(chǎn)品端的延續(xù),具備打造商業(yè)閉環(huán)的潛力;同時(shí),公司背靠股東“阿里系”,在金融、出行等多個(gè)領(lǐng)域有望被注入更多資源,有較強(qiáng)的盈利支撐,因此具備極大競(jìng)爭(zhēng)優(yōu)勢(shì)。
3.3依圖:注重實(shí)戰(zhàn),業(yè)務(wù)聚焦于安防和醫(yī)療
實(shí)戰(zhàn)型AI公司,善于從行業(yè)里尋找研究課題。公司成立于2012年,創(chuàng)始人為ULCA統(tǒng)計(jì)學(xué)博士朱瓏及前阿里資深云計(jì)算專(zhuān)家林晨曦,當(dāng)前擁有約700名員工。公司與“四小龍”中其他幾家企業(yè)最大的不同點(diǎn)是其技術(shù)并非來(lái)自創(chuàng)始團(tuán)隊(duì)的科研成果轉(zhuǎn)化,而是從零開(kāi)始,先選擇行業(yè),然后針對(duì)企業(yè)需求進(jìn)行課題研究?;谶@種打法,公司于2013年為蘇州公安開(kāi)發(fā)了車(chē)輛識(shí)別系統(tǒng),將套牌車(chē)的識(shí)別率從不足30%提高到90%,在初戰(zhàn)告捷后又推出了人臉識(shí)別系統(tǒng)并同樣取得成功,吸引了公安客戶。我們認(rèn)為,公司的這種基因和業(yè)務(wù)模式?jīng)Q定了其更加注重實(shí)戰(zhàn),也意味著具有更強(qiáng)的行業(yè)痛點(diǎn)挖掘能力。
業(yè)務(wù)聚焦于安防和醫(yī)療,積極布局智慧金融。公司的戰(zhàn)略是深耕行業(yè)、深挖痛點(diǎn),業(yè)務(wù)聚焦于安防和醫(yī)療兩個(gè)行業(yè):安防領(lǐng)域,公司的主要產(chǎn)品為“蜻蜓眼”系列,包括蜻蜓眼人像大平臺(tái)和蜻蜓眼車(chē)輛大平臺(tái),目前已在全國(guó)二十多個(gè)省份、上百個(gè)地市公安系統(tǒng)以及海關(guān)總署、中國(guó)邊檢等得以應(yīng)用;醫(yī)療領(lǐng)域,公司的主要產(chǎn)品為care.ai系列,深入疾病預(yù)防、檢查、診斷、治療和科研等各個(gè)環(huán)節(jié),目前已落地全國(guó)100多家三甲醫(yī)院。除安防和醫(yī)療外,2015年公司通過(guò)為招商銀行提供人臉識(shí)別技術(shù)切入金融領(lǐng)域,相繼提出了、遠(yuǎn)程核身、刷臉取款、智能網(wǎng)點(diǎn)等多個(gè)解決方案,客戶以銀行和互聯(lián)網(wǎng)金融公司為主。此外,公司還通過(guò)外延方式進(jìn)一步布局,除繼續(xù)深化在醫(yī)療領(lǐng)域的布局外,還投資了芯片初創(chuàng)企業(yè)ThinkForce,展示了進(jìn)軍芯片的意圖。
先發(fā)優(yōu)勢(shì)明顯,實(shí)戰(zhàn)指標(biāo)領(lǐng)先。公司是最早進(jìn)入智能安防領(lǐng)域的AI企業(yè)之一,2014年起即已實(shí)現(xiàn)智能安防產(chǎn)品的規(guī)?;涞?。公司實(shí)戰(zhàn)指標(biāo)處于國(guó)內(nèi)領(lǐng)先地位。以人臉識(shí)別的準(zhǔn)確率為例,公司在由美國(guó)國(guó)家標(biāo)準(zhǔn)局NIST組織的人臉識(shí)別供應(yīng)商測(cè)試FRVT(2018)最新報(bào)告中綜合排名世界第一。不同于由學(xué)術(shù)機(jī)構(gòu)組織的人臉識(shí)別競(jìng)賽,F(xiàn)RVT更貼近安防實(shí)戰(zhàn),測(cè)試集來(lái)自美國(guó)國(guó)土安全局真實(shí)業(yè)務(wù)場(chǎng)景,數(shù)據(jù)更加復(fù)雜和多樣,因此參賽者的成績(jī)很大程度上可以代表其實(shí)戰(zhàn)水平。我們認(rèn)為,公司實(shí)戰(zhàn)指標(biāo)之所以領(lǐng)先,是由于其人臉識(shí)別產(chǎn)品較早實(shí)現(xiàn)了規(guī)?;涞兀蚨谑褂谜鎸?shí)場(chǎng)景數(shù)據(jù)改善算法方面具有先發(fā)優(yōu)勢(shì),這對(duì)其技術(shù)進(jìn)步起到了巨大的推動(dòng)作用。
3.4云從:AI國(guó)家隊(duì),銀行、機(jī)場(chǎng)人臉識(shí)別產(chǎn)品第一大供應(yīng)商
公司是銀行和機(jī)場(chǎng)人臉識(shí)別產(chǎn)品第一大供應(yīng)商。公司成立于2015年,創(chuàng)始人是UIUC博士、中科院“百人計(jì)劃”人選周曦,當(dāng)前擁有員工400余人。公司聚焦于計(jì)算機(jī)視覺(jué)技術(shù),產(chǎn)品以人臉識(shí)別、文字識(shí)別、活體檢測(cè)為主,應(yīng)用方向集中在金融、交通、安防三大行業(yè),目前是國(guó)內(nèi)銀行和機(jī)場(chǎng)人臉識(shí)別產(chǎn)品的第一大供應(yīng)商:在銀行領(lǐng)域,截至2018年3月,在121家已完成招標(biāo)、具備自建系統(tǒng)能力的銀行中,公司中標(biāo)了包括四大行之內(nèi)的88家總行平臺(tái),市場(chǎng)占有率高達(dá)72.7%;在機(jī)場(chǎng)領(lǐng)域,截至2018年7月,已有54家機(jī)場(chǎng)選擇公司產(chǎn)品,覆蓋全國(guó)75%的樞紐機(jī)場(chǎng)。
公司深耕三大行業(yè),布局智慧商業(yè)。公司的業(yè)務(wù)布局思路為在金融、交通、安防三大行業(yè)內(nèi)深挖應(yīng)用場(chǎng)景,同時(shí)通過(guò)合作布局商業(yè)。例如,在金融行業(yè),公司積極拓展非銀機(jī)構(gòu),向杭州消費(fèi)金融、分期GO等互聯(lián)網(wǎng)金融公司提供實(shí)名認(rèn)證等服務(wù);在交通行業(yè),與中國(guó)民航管理干部學(xué)院共同成立智慧民航聯(lián)合研究中心引領(lǐng)機(jī)場(chǎng)智慧化等等。在商業(yè)領(lǐng)域,公司中標(biāo)中國(guó)電信生物識(shí)別平臺(tái)項(xiàng)目,將聯(lián)手電信實(shí)現(xiàn)全網(wǎng)實(shí)名制,杜絕電信詐騙。
“國(guó)家隊(duì)”背景有助于公司拓展安全敏感行業(yè)。公司是孵化于中科院重慶研究院的高科技企業(yè),股東名單中有多只國(guó)家戰(zhàn)略投資基金,是“四小龍”中唯一沒(méi)有外資入股的企業(yè)。此外,公司還是唯一一家參與人臉識(shí)別國(guó)標(biāo)、部標(biāo)、行標(biāo)制定的研發(fā)企業(yè),并且承擔(dān)了發(fā)改委牽頭的國(guó)家人工智能基礎(chǔ)平臺(tái)重大項(xiàng)目。我們認(rèn)為,上述事實(shí)給公司貼上了“國(guó)家隊(duì)”的標(biāo)簽,在國(guó)內(nèi)核心技術(shù)自主可控的大趨勢(shì)下,公司的“國(guó)家隊(duì)”背景有助于其在安全敏感行業(yè)的拓展。
3.5云知聲:“云端芯”戰(zhàn)略,重點(diǎn)布局家居、車(chē)載及醫(yī)療三大領(lǐng)域
公司是優(yōu)秀的智能語(yǔ)音專(zhuān)業(yè)應(yīng)用提供商,多個(gè)垂直領(lǐng)域市場(chǎng)地位領(lǐng)先。公司成立于2012年,發(fā)展至今歷經(jīng)三個(gè)階段:第一個(gè)階段為以發(fā)育云端語(yǔ)音識(shí)別能力為主,通過(guò)開(kāi)放語(yǔ)音平臺(tái)吸引了近一萬(wàn)家企業(yè)客戶接入;第二個(gè)階段定位做AIoT,開(kāi)始在'端’上發(fā)力,探索技術(shù)的產(chǎn)品化,例如與樂(lè)視合作推出可以進(jìn)行遠(yuǎn)距離自然語(yǔ)言交互的樂(lè)視第三代TV;第三個(gè)階段場(chǎng)景落地階段,通過(guò)為家電廠商美的、汽車(chē)廠商上海通用、公立醫(yī)院北京協(xié)和等提供智能語(yǔ)音解決方案,落地智能家居、智能車(chē)載、智能醫(yī)療等場(chǎng)景。
公司官網(wǎng)顯示,公司目前的合作伙伴已經(jīng)超過(guò)2萬(wàn)家,覆蓋用戶達(dá)2億,其中開(kāi)放語(yǔ)音云覆蓋的城市超過(guò)470個(gè),覆蓋設(shè)備超過(guò)9000萬(wàn)臺(tái)。此外,公開(kāi)資料顯示,在智慧教育領(lǐng)域,公司的教育評(píng)測(cè)平臺(tái)的高峰調(diào)用量達(dá)到每天3億次;在智能車(chē)載領(lǐng)域,已經(jīng)落地30多個(gè)車(chē)型;在智慧醫(yī)療領(lǐng)域,已與500多家醫(yī)院達(dá)成合作,均處于同行業(yè)領(lǐng)先地位。
“云端芯”全產(chǎn)業(yè)鏈布局,重點(diǎn)經(jīng)營(yíng)家居、車(chē)載、醫(yī)療三大領(lǐng)域,搶占教育、機(jī)器人賽道。公司2014年正式定位做AIoT服務(wù)商,確立了“云端芯”戰(zhàn)略,即將基于云端的智能語(yǔ)音技術(shù)與終端設(shè)備和芯片緊密聯(lián)合,通過(guò)云端提供服務(wù)、設(shè)備端實(shí)現(xiàn)算法、芯片提供算力的全棧方式打造生態(tài)閉環(huán)。公司近一年在芯片端的發(fā)力跡象比較明顯,于2018年5月制定了UniOne系列芯片計(jì)劃,并推出了面向智能家居和智能音箱的第一代芯片“雨燕”,同時(shí)計(jì)劃于2019年和2020年推出面向智能車(chē)載領(lǐng)域的第二代芯片“雪豹”和面向智慧城市的第三代芯片“旗魚(yú)”。
在落地場(chǎng)景上,公司重點(diǎn)經(jīng)營(yíng)家居、車(chē)載以醫(yī)療三大領(lǐng)域:家居領(lǐng)域,面向家電廠商推出了UniHome智能語(yǔ)音解決方案芯片;車(chē)載領(lǐng)域,面向車(chē)聯(lián)網(wǎng)產(chǎn)品開(kāi)發(fā)商以及整車(chē)廠商推出了UniCar“云端芯”一體化解決方案;醫(yī)療領(lǐng)域,面向醫(yī)生推出了智能語(yǔ)音錄入軟硬件一體化解決方案。除上述三大領(lǐng)域外,公司還積極搶占教育和機(jī)器人賽道:教育領(lǐng)域,推出了面向教育機(jī)構(gòu)的智能語(yǔ)音評(píng)測(cè)系統(tǒng);機(jī)器人領(lǐng)域,推出了軟硬件一體的行業(yè)服務(wù)機(jī)器人和面向兒童早教的UniToy機(jī)器人解決方案,此外還有面向客服的SaaS 模式的SAMANTHA智能電話機(jī)器人。
人才優(yōu)勢(shì)、先發(fā)優(yōu)勢(shì)鑄就公司核心競(jìng)爭(zhēng)力。根據(jù)IDC的調(diào)研,對(duì)話式人工智能落地面臨的兩個(gè)最大問(wèn)題是人才及落地案例的缺乏。公司的核心團(tuán)隊(duì)來(lái)自IBM、摩根大通、中科院、劍橋等全球頂尖公司和院校,人工智能研究院研究員中博士占比超過(guò)45%,產(chǎn)品和運(yùn)營(yíng)團(tuán)隊(duì)來(lái)自Nuance、阿里巴巴等國(guó)內(nèi)外知名公司,人才優(yōu)勢(shì)明顯;另外,公司較早進(jìn)入家居、車(chē)載、醫(yī)療領(lǐng)域,在跟B端企業(yè)合作上以及終端用戶需求的理解和隱私保護(hù)等方面都具備較多know how,后進(jìn)者難以在短時(shí)間內(nèi)完成追趕。我們認(rèn)為,人才優(yōu)勢(shì)結(jié)合先發(fā)優(yōu)勢(shì)助力公司在場(chǎng)景拓展和深耕上都具備極大競(jìng)爭(zhēng)優(yōu)勢(shì),看好公司發(fā)展。
聯(lián)系客服