時(shí)間:2016年3月29日
出席高管:CEO 徐立
一、介紹環(huán)節(jié)
公司主要做的是人工智能中的視覺智能領(lǐng)域。目前人工智能在工業(yè)級(jí)的應(yīng)用主要在三個(gè)方面:第一是語音識(shí)別,第二是視覺智能,第三是自然語言處理。相對(duì)于60年前達(dá)特茅斯會(huì)議當(dāng)時(shí)定義的人工智能,我們現(xiàn)在實(shí)際上叫機(jī)器智能,主要與機(jī)器學(xué)習(xí)相關(guān)的工作。在發(fā)展過程中一個(gè)主要的流派是統(tǒng)計(jì)學(xué)習(xí)推理,主要當(dāng)數(shù)據(jù)量比較少的情況下可以做相對(duì)比較準(zhǔn)的預(yù)測(cè),早期我們叫專家系統(tǒng);另外一個(gè)就是深度學(xué)習(xí)這一流派,鼻祖是加拿大的教授Hinton,這類算法不對(duì)現(xiàn)實(shí)世界有數(shù)學(xué)假設(shè),主要是通過神經(jīng)網(wǎng)絡(luò)模擬大腦皮層刺激模式來進(jìn)行機(jī)器學(xué)習(xí),2006年改名叫深度學(xué)習(xí),就是把神經(jīng)網(wǎng)絡(luò)的層級(jí)變深。但當(dāng)時(shí)還沒有找到殺手級(jí)的應(yīng)用,2010年和微軟的鄧力合作第一次用深度學(xué)習(xí)將語音識(shí)別帶入實(shí)用,取得了巨大的突破。目前幾乎所有的語音識(shí)別都是基于深度學(xué)習(xí)的理論,所以大家立馬想到在視覺領(lǐng)域應(yīng)用,因?yàn)榛ヂ?lián)網(wǎng)上70%以上內(nèi)容都是圖像。從機(jī)器視覺角度分為三個(gè)層次:第一是延伸人眼能力,看得更清楚,第二層次就是感知層,算出場(chǎng)景深度和運(yùn)動(dòng)等,看圖片背后的東西;第三就是識(shí)別理解,當(dāng)時(shí)深度學(xué)習(xí)直接奔第三個(gè)層次去應(yīng)用。而目前已經(jīng)在視覺各個(gè)方面展開。
從全球來看,深度學(xué)習(xí)方面人才爭(zhēng)奪很激烈。Google收購了Hinton的研究團(tuán)隊(duì),并在其搜索引擎排序都用了深度學(xué)習(xí),其點(diǎn)擊轉(zhuǎn)化率據(jù)說有很大提升,百度也挖了吳恩達(dá)做深度學(xué)習(xí)。Google后來花4億英鎊收購只有12人的團(tuán)隊(duì)Deepmind,在2014到1月份據(jù)說當(dāng)時(shí)全球做深度學(xué)習(xí)的50個(gè)人中deepmind就有12個(gè)人。另一個(gè)專注人工智能公司是Facebook,領(lǐng)軍人物Yann LeCun是紐約大學(xué)終身教授。在深度學(xué)習(xí)領(lǐng)域,大公司把學(xué)術(shù)上最頂尖負(fù)責(zé)人來做工業(yè)和學(xué)術(shù)結(jié)合是個(gè)必然的趨勢(shì)。
從我們自己公司來看,公司創(chuàng)業(yè)這批人都是學(xué)術(shù)圈來,辭掉終身教職,有谷歌、微軟、BAT等公司員工一起來創(chuàng)辦的。我們主要應(yīng)用在移動(dòng)互聯(lián)網(wǎng)、互聯(lián)網(wǎng)金融、安防監(jiān)控、大數(shù)據(jù)分析四個(gè)方向。從看一個(gè)人工智能公司來看需要觀察他們?nèi)竽K:1、深度學(xué)習(xí)引擎,“大腦”怎么樣;2、是否有足夠的應(yīng)用場(chǎng)景和大數(shù)據(jù)資源;3、超算能力如何。最早深度學(xué)習(xí)在CPU上運(yùn)行,改用GPU之后,效率提升很多。我們現(xiàn)在連接200塊GPU作為大的超算系統(tǒng),作為參考,百度MINWA機(jī)器人連接144塊GPU, alphgo是170塊GPU。公司目前三地員工200多人,核心員工來自業(yè)界著名高校和企業(yè)。公司擁有50名博士,3名高考狀元,5名微軟的FELLOW。公司研發(fā)上面有很大的投入,員工曾在視覺頂級(jí)會(huì)議上論文超過150篇。2014年ImageNet全球物體檢測(cè)比賽中亞軍,僅次于谷歌,同年我們公司團(tuán)隊(duì)人員是全球首次實(shí)現(xiàn)LFW上人臉識(shí)別率超過人肉眼。2015年我們?cè)谝曨l識(shí)別的一項(xiàng)比賽是全球第一。我們認(rèn)為學(xué)術(shù)熱點(diǎn)和工業(yè)熱點(diǎn)的結(jié)合是未來人工智能的必然趨勢(shì)。
金融行業(yè)應(yīng)用:人證比對(duì)、刷臉登錄、刷臉支付、活體檢測(cè)、身份證掃描識(shí)別、銀行卡掃描識(shí)別,消費(fèi)小票的文字識(shí)別(和京東白條合作),客戶包括移動(dòng)、銀聯(lián)、融360、拉卡拉、借貸寶等。
防攻擊:利用平臺(tái)大量攻擊數(shù)據(jù),如偽造人臉識(shí)別等,用機(jī)器學(xué)習(xí)方式做了防攻擊。
移動(dòng)互聯(lián)網(wǎng):1、相機(jī),FACEU、微博相機(jī)背后所有的人臉技術(shù)都是我們的;2、相冊(cè),小米MIUI的人臉識(shí)別云相冊(cè),華為MATE8,人臉分類,場(chǎng)景分類。
安防監(jiān)控行業(yè):深度學(xué)習(xí)驅(qū)動(dòng)智能監(jiān)控類產(chǎn)品,人臉布控系統(tǒng)、行人搜索平臺(tái)、車輛搜索平臺(tái)、人群分析,我們做了遠(yuǎn)距離識(shí)別攝像頭,百米以上都可以人臉識(shí)別。
深度學(xué)習(xí)機(jī)器:打造sensebox自己深度學(xué)習(xí)機(jī)器,自主研發(fā)的深度學(xué)習(xí)平臺(tái)操作系統(tǒng)parrots。
二、問答環(huán)節(jié)
問:互聯(lián)網(wǎng)公司是否在人工智能領(lǐng)域無論在深度學(xué)習(xí)算法人才還是計(jì)算和數(shù)據(jù)資源都更有優(yōu)勢(shì)?
答:大公司的問題是不聚焦,不能很好統(tǒng)一調(diào)配,另外大公司主要2C,企業(yè)級(jí)服務(wù)比較少,而我們是B2B的一個(gè)中立平臺(tái),更多企業(yè)愿意用我們的技術(shù)產(chǎn)品,比如我們和東方網(wǎng)力合作視云天下平臺(tái),利用行業(yè)應(yīng)用平臺(tái)大量數(shù)據(jù)能把我們的產(chǎn)品技術(shù)打磨更好。
問:如何看待無監(jiān)督學(xué)習(xí)?是否會(huì)在大數(shù)據(jù)分析中有很好應(yīng)用?
答:無監(jiān)督學(xué)習(xí)最早是谷歌在互聯(lián)網(wǎng)圖片中自己學(xué)會(huì)認(rèn)識(shí)貓,實(shí)際上人有時(shí)候在學(xué)習(xí)外界的時(shí)候會(huì)改變目標(biāo),機(jī)器不會(huì)變目標(biāo),而無監(jiān)督學(xué)習(xí)機(jī)器目標(biāo)不一定明確,看能否找出大量數(shù)據(jù)背后的規(guī)律。目前大數(shù)據(jù)行業(yè)最關(guān)鍵問題是要有足夠的結(jié)構(gòu)化的數(shù)據(jù),結(jié)構(gòu)化信息的獲取是要解決的問題。在需要經(jīng)驗(yàn)累積領(lǐng)域的行業(yè)人工智能肯定是會(huì)有大的突。中國有13億龐大人口而且大數(shù)據(jù)資源利用比較靈活,實(shí)質(zhì)上有很大的數(shù)據(jù)紅利,這對(duì)中國是有機(jī)會(huì)彎道超車的機(jī)會(huì)。
問:是否會(huì)有專門針對(duì)深度學(xué)習(xí)應(yīng)用的新的硬件架構(gòu)的趨勢(shì)?
答:非常有可能,比如我們用200塊GPU搭建超算系統(tǒng)確實(shí)會(huì)有一定優(yōu)勢(shì),但可能需要更專門的芯片和硬件。intel去年也收購了全球著名的FPGA公司,也是出于這方面考慮。FPGA可擦寫,可以program,可以和芯片做一個(gè)輔助,為芯化打基礎(chǔ),硬件是深度學(xué)習(xí)關(guān)鍵點(diǎn)。
問:如何看待目前各大巨頭在人工智能領(lǐng)域的開源趨勢(shì)?
答:更多出于學(xué)術(shù)上考慮,促進(jìn)更多人投身這個(gè)領(lǐng)域,但是從谷歌開源來看,其開源的是單機(jī)版如果沒有足夠計(jì)算資源很難與其競(jìng)爭(zhēng),另外很多巨頭開源系統(tǒng)能否商用都是很難說的。
問:我們主要的商業(yè)模式?
答:B2B2C的模式,另外和有股權(quán)綁定的分成模式。
問:我們和科大訊飛合作情況?
答:科大訊飛圖像識(shí)別類的應(yīng)用主要是與我們合作的。
問:我們和FACE++的比較?
答:他們專注于人臉識(shí)別垂直領(lǐng)域,我們專注于背后的深度學(xué)習(xí)引擎,應(yīng)用更廣泛。
問:深度學(xué)習(xí)引擎是否會(huì)走向比較成熟的階段?
答:目前這么多學(xué)術(shù)界人在做是因?yàn)槟壳翱梢钥吹绞翘幵谝粋€(gè)可以不斷提升的過程,我們自己判斷是在3年左右。
問:人工智能對(duì)于金融投資應(yīng)用如何看?
答:量化分析運(yùn)用深度學(xué)習(xí)是可以的,但在長線做準(zhǔn)確預(yù)測(cè)一個(gè)問題是收集結(jié)構(gòu)化信息需要考慮哪些因素是不確定的,比如不只是市場(chǎng)數(shù)據(jù),其他天氣、宏觀等各方因素是否會(huì)對(duì)投資有影響,是否需要都收集結(jié)構(gòu)化數(shù)據(jù)來訓(xùn)練,這個(gè)很難確定。
問:和東方網(wǎng)力合資公司情況?
答:和東方網(wǎng)力合作公司會(huì)發(fā)展100人,我們?cè)谌巳悍治龊?/span>person reID兩類技術(shù)放在合資公司,其他技術(shù)東方網(wǎng)力都可以作為我們技術(shù)的代理商。
問:我們無人駕駛領(lǐng)域布局?
答:我們和nividia有合作,因?yàn)樗惴òl(fā)展很快,NVIDIA ptx1車上裝了GPU卡,可以用空閑空間自帶ADAS,通過可擦寫進(jìn)入,實(shí)現(xiàn)快速迭代。深度學(xué)習(xí)應(yīng)用終端化、云化是兩大趨勢(shì)。
最大的區(qū)別是2011年是深度學(xué)習(xí)出現(xiàn),AI技術(shù)走向成熟。深度學(xué)習(xí)簡單來說就是用數(shù)學(xué)model人腦。應(yīng)用包括圖像、語音、游戲博弈、自動(dòng)駕駛、生命科學(xué)等?;蛐蛄衅鋵?shí)類似于人臉識(shí)別。中國人臉識(shí)別準(zhǔn)確率首次超過人眼是我們做的,今年我們獲得5項(xiàng)比賽中3項(xiàng)公司。
技術(shù)實(shí)力:創(chuàng)始團(tuán)隊(duì)是亞洲第一個(gè)大規(guī)模從事深度學(xué)習(xí)的團(tuán)隊(duì),現(xiàn)在是全亞洲最大的深度學(xué)習(xí)研究團(tuán)隊(duì)。計(jì)算能力是亞洲唯一能夠批量用HPC的公司,最大能夠用400塊GPU,擁有世界上最深的神經(jīng)網(wǎng)絡(luò)1207層。
商業(yè)化:200+國內(nèi)外戰(zhàn)略合作伙伴和大客戶建立合作。
判斷深度學(xué)習(xí)三個(gè)核心指標(biāo):大數(shù)據(jù)、高性能計(jì)算、深度學(xué)習(xí),
1、深度學(xué)習(xí):關(guān)鍵在于算法能力,底層設(shè)計(jì)能力
人工智能開源平臺(tái):類似于操作系統(tǒng),但真正核心平臺(tái)都是在內(nèi)部的。
caffe:最早的開源平臺(tái),不支持分布式。
torch:分布式訓(xùn)練,靈活但以寫底層代碼為代價(jià),生產(chǎn)力低。
tensorflow:支持分布式,顯存使用過高,性能欠佳。
依賴開源平臺(tái):效能不理想、技術(shù)發(fā)展受制、知識(shí)產(chǎn)權(quán)問題
商湯科技自主平臺(tái)Parrots:超深網(wǎng)絡(luò)(1207層網(wǎng)絡(luò))、超大數(shù)據(jù)學(xué)習(xí)能力(6000萬)、復(fù)雜關(guān)聯(lián)應(yīng)用(多模態(tài)數(shù)據(jù)學(xué)習(xí)能力)
2、超算能力
目前建成4個(gè)超算,2015年11月第一個(gè)HPC連接200塊GPU超過百度的144塊GPU、國內(nèi)唯一購買邁絡(luò)思1臺(tái)100萬,連接20-40臺(tái)機(jī)器。
平安城市:視頻結(jié)構(gòu)化平臺(tái)(本質(zhì)上將大量視頻監(jiān)控?cái)?shù)據(jù)提取有效數(shù)據(jù)),??翟谕?,我們識(shí)別率比他領(lǐng)先20%。據(jù)??倒浪阋荒暧?00億采購額
金融:人臉身份認(rèn)證,借貸寶(超過1億人)、中國移動(dòng)三年獨(dú)家、超過3億手機(jī)實(shí)名化、樂視刷臉。
智慧商業(yè):商業(yè)地產(chǎn)視頻實(shí)時(shí)監(jiān)測(cè)人臉屬性
移動(dòng)智能:增強(qiáng)現(xiàn)實(shí)特效(faceu)每年收年費(fèi)、智能相冊(cè)(小米、華為)
無人駕駛:某世界前五大車廠已經(jīng)選擇商湯為
芯片ip:壓縮神經(jīng)網(wǎng)絡(luò)、一般訓(xùn)練好幾百兆幾G
人機(jī)交互:AR/VR
問:子公司行業(yè)?
答:四個(gè)子公司,第一個(gè)安防領(lǐng)域主要是東方網(wǎng)力,另外一個(gè)金融領(lǐng)域有一個(gè)子公司做征信。
問:深度學(xué)習(xí)黑箱、不可解釋性限制其應(yīng)用?
答:并不是黑盒子,可以重新設(shè)計(jì)、對(duì)應(yīng)網(wǎng)絡(luò)結(jié)構(gòu)都是不一樣的。
問:開源人工智能平臺(tái)?
答:建立學(xué)術(shù)界、工業(yè)界名望,來建立自己的生態(tài)。
標(biāo)注成本:1、生成數(shù)據(jù),對(duì)我們是真實(shí)場(chǎng)景的補(bǔ)充,自帶某些信息,視覺領(lǐng)域沒有真正大的C的空間,還是會(huì)做在線服務(wù),有數(shù)據(jù)閉環(huán),一定程度上
標(biāo)注1一個(gè)小時(shí)50元,需要人的照片和五官輪廓點(diǎn)延,標(biāo)注一張圖500個(gè)點(diǎn),半自動(dòng),1分鐘一張兩張。
聯(lián)系客服