近日,愛(ài)分析在京舉辦了2019愛(ài)分析·中國(guó)數(shù)據(jù)智能高峰論壇,數(shù)據(jù)智能領(lǐng)域眾多獨(dú)角獸企業(yè)、投資人和專(zhuān)業(yè)人士共聚一堂,共同分享、探討行業(yè)趨勢(shì)。愛(ài)分析邀請(qǐng)到了一覽群智CEO胡健進(jìn)行了主題演講。
胡健認(rèn)為,過(guò)去幾十年,人工智能經(jīng)歷了發(fā)展的三個(gè)階段:專(zhuān)家智能、數(shù)據(jù)驅(qū)動(dòng)的AI、大數(shù)據(jù)驅(qū)動(dòng)的AI。接下來(lái)在五到十年之內(nèi),肯定會(huì)出現(xiàn)下一代的人工智能的進(jìn)步,大知識(shí)驅(qū)動(dòng)的AI。
現(xiàn)將其主題演講實(shí)錄分享給讀者。
胡?。悍浅s幸愛(ài)分析邀請(qǐng),有機(jī)會(huì)跟大家分享數(shù)據(jù)智能方面的思考以及我們?cè)谶@方面的實(shí)踐。
我喜歡兩部電影,一個(gè)是《終結(jié)者》,一個(gè)是《鋼鐵俠》,完全不同的設(shè)計(jì)場(chǎng)景,最終產(chǎn)生的結(jié)果也是完全不一樣。
《終結(jié)者》設(shè)計(jì)場(chǎng)景是,機(jī)器完全具有智能,要消滅人類(lèi),或者奴役人類(lèi)。
《鋼鐵俠》是輔助人,是智能的助理?!朵撹F俠》產(chǎn)生的結(jié)果是,讓人成為一個(gè)超人,成為美國(guó)的英雄。
對(duì)人來(lái)說(shuō),從倫理上的選擇非常明確,我們的目標(biāo)是讓機(jī)器服務(wù)我們,讓我們成為超人,而不是讓我們成為機(jī)器的奴隸。
從技術(shù)角度來(lái)看,雖然現(xiàn)在的人工智能技術(shù)能在很多決策上幫助我們,但是機(jī)器更擅長(zhǎng)計(jì)算、存儲(chǔ)以及模式識(shí)別的能力,人更有同理心,具備理解、分析和決策能力,這兩者是天然的互補(bǔ)。
機(jī)器加上人工,讓機(jī)器取代簡(jiǎn)單的重復(fù)性的工作,讓人做一些更有創(chuàng)造性,更加重要的工作。所以無(wú)論從倫理角度,還是技術(shù)角度來(lái)說(shuō),我相信人機(jī)結(jié)合肯定是未來(lái)大勢(shì)所趨。
但理想很豐滿(mǎn),現(xiàn)實(shí)很骨感。某種意義上,現(xiàn)階段的人工智能屬于弱人工智能,就是“弱智”階段。
當(dāng)前的人工智能完全是基于數(shù)據(jù)推理的方式。第一,沒(méi)法理解人類(lèi)的情感,沒(méi)法跟人進(jìn)行正常乃至深度的交流;第二,無(wú)法應(yīng)對(duì)在復(fù)雜場(chǎng)景下的決策和規(guī)劃的問(wèn)題。
現(xiàn)階段人工智能的落地都是快速反饋,單場(chǎng)景感知的智能。就像剛出生的孩子一樣,看得見(jiàn),聽(tīng)得見(jiàn),但是需要長(zhǎng)時(shí)間的培訓(xùn)才能看得懂,聽(tīng)得懂。
因此,接下來(lái)人工智能和數(shù)據(jù)智能很重要的任務(wù)怎么讓機(jī)器或者軟件具有大腦。
整個(gè)數(shù)據(jù)智能或者人工智能發(fā)展有四步:專(zhuān)家智能、數(shù)據(jù)驅(qū)動(dòng)的AI、大數(shù)據(jù)驅(qū)動(dòng)的AI以及大知識(shí)驅(qū)動(dòng)的AI。
第一步是專(zhuān)家智能。60年代的時(shí)候,很多專(zhuān)家用一些規(guī)則,或者用一些符號(hào)邏輯的方式,把邏輯規(guī)則化,希望盡可能的用自動(dòng)化的流程取代工作。
的確,這在很多場(chǎng)景中是有價(jià)值的,能夠提升勞動(dòng)效率,但是本身用規(guī)則的方式去解決這個(gè)問(wèn)題,專(zhuān)家就只有這么多,寫(xiě)的規(guī)則非常復(fù)雜,適用性非常有限。
因此,很長(zhǎng)一段時(shí)間專(zhuān)家?guī)熘R(shí)庫(kù)陷入停滯狀態(tài)。
后來(lái)推出機(jī)器學(xué)習(xí)算法,我們?cè)诤芏嘈?shù)計(jì)算上實(shí)現(xiàn)非常大的突破,幫助我們?cè)诤芏鄨?chǎng)景中做預(yù)測(cè)。但此類(lèi)門(mén)檻比較高,需要做特征工程,另外,還要選擇不同的算法,它是比較小眾的應(yīng)用場(chǎng)景。
一直到2011年深度學(xué)習(xí)出現(xiàn),不需要懂算法,直接端到端的產(chǎn)品,里面具體參數(shù)不用設(shè)計(jì),直接出成果,直接到大數(shù)據(jù)驅(qū)動(dòng)的人工智能。
最近一直提“大力出奇跡”,它不是算法的進(jìn)步,是算力對(duì)于數(shù)據(jù)使用的進(jìn)步,是大數(shù)據(jù)驅(qū)動(dòng)的人工智能。
但這種深度學(xué)習(xí)有很大的瓶頸。
第一,特點(diǎn)性問(wèn)題,沒(méi)法解釋什么東西起作用,在很多關(guān)鍵的場(chǎng)景中沒(méi)法應(yīng)用。
第二,泛化性問(wèn)題,所謂大數(shù)據(jù)驅(qū)動(dòng)人工智能,需要大量的數(shù)據(jù)去學(xué)習(xí),才能學(xué)出很好的模型。這與人不同,人作為生物,有一套理論初步框架,有一套常識(shí)圖譜,常識(shí)圖譜的框架下,給幾張圖片就能產(chǎn)生非常好的泛化效果。
所以我們認(rèn)為接下來(lái)在五到十年之內(nèi),肯定會(huì)出現(xiàn)下一代的人工智能,很多人提到大知識(shí)驅(qū)動(dòng)的人工智能。
大知識(shí)驅(qū)動(dòng)的人工智能,我們面臨的挑戰(zhàn),首先是大。
傳統(tǒng)知識(shí)庫(kù)是有限的,但現(xiàn)在有大知識(shí),數(shù)據(jù)庫(kù)上云,包括人的數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)能夠構(gòu)建知識(shí)圖譜。
因?yàn)橐挥[群智大部分核心人員都是從微軟研究院出來(lái)的,曾經(jīng)在微軟研究院做搜索、數(shù)據(jù)挖掘。
搜索是人工智能、數(shù)據(jù)第一次大規(guī)模的商業(yè)應(yīng)用,很多人會(huì)問(wèn),NLP或者知識(shí)圖譜的市場(chǎng)規(guī)模和視覺(jué)相比,哪個(gè)大一點(diǎn)?
其實(shí)很顯然,因?yàn)樽匀徽Z(yǔ)言,知識(shí)圖譜已經(jīng)得到證明。搜索這個(gè)市場(chǎng)是巨大的市場(chǎng),搜索本身核心的技術(shù),都在用open的數(shù)據(jù)構(gòu)建超大規(guī)模的知識(shí)圖譜,用知識(shí)圖譜去理解文檔,理解用戶(hù)的查詢(xún),最終實(shí)現(xiàn)查詢(xún)跟文檔的精準(zhǔn)匹配。
本身從搜索角度,它是一個(gè)通用的查詢(xún)的決策引擎。
我們從微軟出來(lái)以后在想,是否能將這樣的技術(shù)應(yīng)用于企業(yè)與行業(yè),如何將通用的知識(shí)圖譜與行業(yè)知識(shí)圖譜相結(jié)合,解決行業(yè)的問(wèn)題。這是我們做一覽群智這家公司的初心。
最核心的問(wèn)題,是怎樣從海量的多源異構(gòu)數(shù)據(jù)中抽取知識(shí),構(gòu)建關(guān)系,把不同的數(shù)據(jù)進(jìn)行消歧融合,并構(gòu)建知識(shí),這是第一個(gè)知識(shí)構(gòu)建問(wèn)題。
第二個(gè)問(wèn)題,怎樣理解語(yǔ)義。比如,現(xiàn)在大部分人機(jī)對(duì)話(huà),siri以及各領(lǐng)域的人機(jī)對(duì)話(huà),不理解語(yǔ)義,這是現(xiàn)階段的困難。我堅(jiān)信接下來(lái)利用自然語(yǔ)言處理技術(shù),特別是語(yǔ)義理解技術(shù)的快速發(fā)展,會(huì)形成巨大的突破。就像前幾年視覺(jué)技術(shù)的突破一樣。
第三個(gè)是知識(shí)賦能的問(wèn)題,有大的知識(shí),怎么和生物技術(shù)、和語(yǔ)言技術(shù)結(jié)合?我們有通用的知識(shí)圖譜,怎么訓(xùn)練識(shí)別特定的引擎,目標(biāo)是基于四到五張圖片能做識(shí)別引擎。目前的情況是,現(xiàn)在還需要標(biāo)注成千上萬(wàn)張圖片。
我們的行業(yè)類(lèi)似于搜索行業(yè),我們現(xiàn)階段要做的事情是落地智能平臺(tái)。
一覽群智智能決策平臺(tái)包括四個(gè)基礎(chǔ)產(chǎn)品,分別解決了數(shù)據(jù)融合和快速打通數(shù)據(jù)閉環(huán)的問(wèn)題、知識(shí)圖譜的構(gòu)建問(wèn)題、關(guān)聯(lián)分析的問(wèn)題,以及AI模型的訓(xùn)練問(wèn)題,即為決策問(wèn)題。這是基于我們團(tuán)隊(duì)多年經(jīng)驗(yàn),總結(jié)出的一套產(chǎn)品,或者方法論。
具體而言,一覽群智智能決策平臺(tái)輔助決策系統(tǒng),由“感知-理解-分析-決策”四部分構(gòu)成。
首先,我們的產(chǎn)品解決的問(wèn)題是從多源異構(gòu)數(shù)據(jù),從公開(kāi)的行業(yè)數(shù)據(jù),包括物聯(lián)網(wǎng)數(shù)據(jù)中抽取出結(jié)構(gòu)化的信息,形成通用知識(shí)圖譜。這過(guò)程中我們需要用自然語(yǔ)言理解,以及知識(shí)抽取,去構(gòu)建知識(shí)圖譜。
當(dāng)有了知識(shí)圖譜以后,用基礎(chǔ)的機(jī)器學(xué)習(xí)產(chǎn)品,可以降低很多行業(yè)人員、從業(yè)人員使用人工智能產(chǎn)品的門(mén)檻,就能快速的構(gòu)建決策性產(chǎn)品。
有決策產(chǎn)品以后,產(chǎn)品不是取代人,而是幫助人在決策過(guò)程中理解數(shù)據(jù),在人機(jī)交互中,快速利用人的決策能力。
構(gòu)建了這樣一套框架體系后,用常識(shí)圖譜結(jié)合在公安、媒體具體的細(xì)分領(lǐng)域的數(shù)據(jù),去賦能行業(yè)。
接下來(lái)具體講講我們?cè)趲讉€(gè)細(xì)分領(lǐng)域做的應(yīng)用場(chǎng)景。
第一個(gè)智能決策平臺(tái)在公安行業(yè)應(yīng)用。
因?yàn)楣灿袛?shù)據(jù),能夠商業(yè)化落地。當(dāng)前的功能偏向于事后分析,歸類(lèi)完數(shù)據(jù)之后,出了案件,用圖譜也好,數(shù)據(jù)中臺(tái)也好,業(yè)務(wù)中臺(tái)也好,抓住犯人。
另外一個(gè)場(chǎng)景是銀行。
人工智能真正把人從簡(jiǎn)單工作中解放出來(lái),一覽群智智能審單專(zhuān)家系統(tǒng)去年在國(guó)內(nèi)某大型銀行成功上線(xiàn),首次將人工智能技術(shù)與國(guó)際單證業(yè)務(wù)相結(jié)合,實(shí)現(xiàn)了人工智能領(lǐng)域在單證業(yè)務(wù)中從無(wú)到有的突破。
效果非常明顯,從數(shù)量上看,原來(lái)審單團(tuán)隊(duì)需要2000名本碩高級(jí)人才,現(xiàn)在只需要100名通用人才。而且,審單效率大幅提高,基本杜絕了滯后的現(xiàn)象。對(duì)于大量票據(jù),將其關(guān)鍵要素處理出來(lái),同時(shí)用知識(shí)圖譜匹配,這個(gè)技術(shù)在保險(xiǎn)、銀行、證券等行業(yè),都有大量的需求。
另外一個(gè)是反洗錢(qián)的產(chǎn)品。
大家知道反洗錢(qián),整個(gè)金融的血液是資金,所有的金融犯罪都是跟資金有關(guān)系的,比如說(shuō)貪污受賄、恐怖性融資等。
所以對(duì)整個(gè)金融體系,像國(guó)家金融監(jiān)管要求的一樣,必須要上反洗錢(qián)的系統(tǒng)。
目的很明確。
第一,要做到預(yù)防,是通過(guò)人工加規(guī)則的方式。比如這個(gè)人以前沒(méi)有放款,突然對(duì)外打了一筆巨額的資金,可能有問(wèn)題。再比如你是做蘋(píng)果生意的,突然給做礦生意的人打了一筆巨額資金,這就需要上報(bào)給人民銀行。
這些可能的問(wèn)題,首先要經(jīng)過(guò)人工審核,比如一天一個(gè)銀行將近八萬(wàn)筆有可能的嫌疑,但是需要通過(guò)人工變成兩百筆。
現(xiàn)階段的方式存在的問(wèn)題是反應(yīng)很慢。如果用我們的模型,第一,可以快速識(shí)別是不是洗錢(qián)交易。第二,我們能做到實(shí)時(shí)交付,可以有效的杜絕金融犯罪的行為。
以上是我們的理解和一些落地的場(chǎng)景。
每一次技術(shù)革命,都會(huì)帶來(lái)焦慮,但是,每次的結(jié)果都是人活的更幸福。接下來(lái)人工智能的新篇章肯定是以人為本,最重要的問(wèn)題是讓機(jī)器具有人性,能跟人更好的理解交流,同時(shí)讓人成為超人,讓人的技能得到放大。
謝謝各位。
聯(lián)系客服