中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
遷移學習領軍人物戴文淵:人工智能=大數(shù)據(jù) 機器學習

3月19日,創(chuàng)新工場聯(lián)合中泰證券舉辦了智能化研討大會第一期:人工智能(AI),邀請了行業(yè)內(nèi)最頂尖的專家人才,從產(chǎn)業(yè)邏輯,一二級市場投資邏輯深入淺出分享行業(yè)內(nèi)的發(fā)展趨勢及關鍵節(jié)點,并探討一二級市場龐大的投資機會。 第四范式創(chuàng)始人兼CEO戴文淵分享了他的觀點。

戴文淵(第四范式創(chuàng)始人兼CEO,第四范式已獲得創(chuàng)新工場投資)

戴文淵,遷移學習全球領軍學者。2009-2013年就職于百度,是百度廣告變現(xiàn)算法的核心負責人,百度鳳巢的總架構師,是最年輕的百度高級科學家。曾指導百度鳳巢在線營銷系統(tǒng)、百度大腦等多個重量級核心產(chǎn)品, 使百度變現(xiàn)能力4年提升8倍,他的技術團隊是百度2010年至2012年變現(xiàn)能力持續(xù)超華爾街預期的核心驅(qū)動力。2012年獲得百度最高獎(百萬美元獎)。2013-2014年就職華為,任華為諾亞方舟實驗室主任科學家 。2005年曾獲得ACM國際大學生程序設計競賽世界總冠軍。

內(nèi)容預告

1,AI技術能提供三種能力:一是預測未來、二是數(shù)據(jù)集成、三是終生學習;

2,對于評價預測未來的能力,我認為最重要的有三點,一個細(細分人群),一個叫快(快速決策),一個叫變(動態(tài)變化);

3,人的智能和機器的智能的差別在處理細節(jié)信息能力;

4,AI有待改善的地方在于它還不能指導人的工作。

以下為演講原文:

謝謝大家,今天下午和大家分享一下這個領域最近比較熱點的,甚至是更早,早到幾十年前這么一路走過來的經(jīng)歷。實際上最近的兩周對我們來說有一個很大的利好,就是我們終于不用再去跟別人解釋我們是什么樣的大數(shù)據(jù)公司。剛才汪華也介紹了說我們公司是個大數(shù)據(jù)公司,其實這件事情對我們來說是很頭疼的事情,假如我們?nèi)ジ蛻粽f我們是一家大數(shù)據(jù)的公司,他們會問你們和百分點什么區(qū)別,然后我們要去解釋百分點是賣給你數(shù)據(jù)的,我們是在數(shù)據(jù)中為你帶來業(yè)務機制,然后他又會問你們和星環(huán)的差別是什么,我們又要去解決新環(huán)是給你儲存數(shù)據(jù)的一家公司,我們是給你從數(shù)據(jù)里面挖掘價值。然后我們現(xiàn)在終于可以解釋他們都是大數(shù)據(jù)公司,我們是人工智能公司。

今天主要會介紹這么幾個部分。第一部分是歷史,可以看到人工智能一路是怎么走過來的。第二部分看看我們現(xiàn)在做到的,以及不能做到的相關部分。第三部分是人工智能未來會往哪方面發(fā)展。

1以史為鑒,人工智能的科學發(fā)展

其實智能是什么東西,人類一直在探索。這個挺有意思,比如說智能手機很有智能嗎?iwatch是智能嗎?現(xiàn)在又說無人駕駛汽車是智能。在科學領域智能這個概念探索了很多年,因為科學家特別喜歡定義這些東西。最早定義智能的是這位科學家,圖靈,圖靈最重要的成就是發(fā)明了圖靈機。他特別感興趣圖靈機將來能體現(xiàn)怎樣的智能,所以他提出一個概念叫圖靈測試。圖靈測試是什么概念?他認為計算機智能發(fā)展到最高境界時,如果設置一道墻,讓一個人和一臺計算機在墻后面,另一個人在墻的前面問問題,墻后的人和計算機分別回答,如果無法區(qū)分回答問題的哪個是人哪個是計算機的話,那么計算機就通過了圖靈測試。當時圖靈認為人工智能最高境界就是讓人區(qū)分不出來哪個是計算機,哪個是人。當然圖靈測試到今天來看,已經(jīng)是個偽命題了。比方說我們不是區(qū)分不出來AlphaGo和李世石,而是看誰下得好,誰是AlphaGo。

圖靈之后又有一些別的科學家提出AI相關的概念,比方說Marvin Minsky,他其實是真正的深度學習的鼻祖,只不過他當時提出來的概念叫做神經(jīng)網(wǎng)絡,不叫深度學習。1970年,他提出三到八年內(nèi)我們將會得到一臺具有人的平均智商的機器。并且他也踐行了這個工作,但最后失敗了。他做出來的那個神經(jīng)網(wǎng)絡遠沒有達到人的平均智能。

為什么失???我們回過頭去看。人的大腦其實也是個由神經(jīng)元組成的網(wǎng)絡,如果我們把計算機的神經(jīng)元接起來做一個神經(jīng)網(wǎng)絡。那么是不是我們做到神經(jīng)元數(shù)量超過大腦時,機器智能就能超過人了?最后發(fā)現(xiàn)一個問題,即便擁有一個和人腦一樣的神經(jīng)網(wǎng)絡,當你沒有能力去訓練這個網(wǎng)絡的時候,其實仍然無法獲得智能。就好象我們自己的小孩,剛出生的時候,他的腦細胞數(shù)量就和成人差不多了,但是那時他沒有學過東西,所以他的智力水平是達不到成人水平的。這是回過頭去看這個事情為什么失敗,但是這個事情過程造成的影響就是“神經(jīng)網(wǎng)絡”這個概念臭了。到2005年的時候,給神經(jīng)網(wǎng)絡平反的時候,沒有人再敢說它叫神經(jīng)網(wǎng)絡了,于是又給它起了一個新的名字叫深度學習。

另外更激進H. A. Simon,他認為二十年內(nèi),機器將能完成人能做的一切工作。這都是建立在當時的判斷。這些失敗的結果就是我們把神經(jīng)網(wǎng)絡打入冷宮至少三十年。

在這之后,七八十年代提出了一個方向叫做智能來自專家,即專家系統(tǒng)。就是要設計一個系統(tǒng),這個系統(tǒng)的前端服務于客戶,后端有一個知識庫。這個知識庫是怎么來的?從專家的腦子里來。假設這是一個醫(yī)學的知識庫,那我們應該去找世界上最好的醫(yī)學專家,把他大腦里的知識寫到知識庫里面,寫成一系列的規(guī)則。然后這個系統(tǒng)將來就能更好的服務于人。當時設想挺好,比如一個人類的醫(yī)學專家可以看病,那我找一百個專家把他的知識都寫到這個機器里面,是不是應該比一個人更好。按理這個邏輯是對的,但最后這個方向也失敗了。為什么失敗了?因為發(fā)現(xiàn)專家自己都不知道自己會什么。我們發(fā)現(xiàn)一個專家可能掌握的知識有一百分,他能總結的知識是十分,問題在于他表達不出來。很多時候醫(yī)生要看到這個病人才知道應該如何去醫(yī)。

其實既是人的缺點,也是人工智能的缺點。現(xiàn)在神經(jīng)網(wǎng)絡有一個缺陷,我們發(fā)現(xiàn)比如說AlphaGo會下圍棋,但是它不能復盤,它下的每一步都說不出為什么這么下。人和機器的神經(jīng)網(wǎng)絡都有這個問題,我們擁有的技能,很多時候是沒有辦法表達出來的。專家系統(tǒng)基本上到90年代的時候就被死刑,認為它永遠都達不到人的智能水平。

再后來,也提出一些新的方向,Rodney Brooks他提出智能來自于本能,他認為智能不是一個集中式地集中在大腦,每個細胞都有智能,所以他去制造這種機器人,這個機器人完全沒有大腦,身體的每個部分在控制這個機器往哪里走。他制造了大量的機器人,這些機器人被應用到了美軍的作戰(zhàn)或者說一些危機,例如廠房失火時把重要的東西拿出來。但畢竟來說,他們還是離人的智能水平差很遠。

第一次讓人們感覺到人的智力可能玩不過機器是深藍。深藍現(xiàn)在來看其實是一個暴力搜索的方法,在國際象棋領域打敗了國際象棋的第一卡斯帕羅夫。深藍為什么能做到?是因為國際象棋棋盤比較局限,所以我們通過暴力搜索的方式,我們可以讓深藍往前推25步,而卡斯帕羅夫據(jù)分析能推22步。

深藍雖然說在國際象棋比賽中打敗了世界冠軍,但是人們還是不相信計算機能夠打敗人類。最簡單的方式就是圍棋,甚至不要說打敗世界冠軍了,在95年的時候他們甚至還下過我。

其實一個決定性的時刻是在2005年的時候,有位學者提出神經(jīng)網(wǎng)絡是有用的,甚至神經(jīng)網(wǎng)絡可以訓練很多層,當我們把層數(shù)增加到十層、十一層的時候,他能夠達到一個過去做不到的效果。比方說過去機器視覺被認為幾乎是不可行的,當我們把神經(jīng)網(wǎng)絡做的很深很深的時候,確實會發(fā)現(xiàn)神經(jīng)網(wǎng)絡能表現(xiàn)出一些人的視覺認知過程,剛才汪華也展示了一張圖。圖中我們發(fā)現(xiàn)神經(jīng)網(wǎng)絡可以學出人的眼睛、鼻子這些器官,這和人認知圖像的過程非常像。

那么為什么會在這個時候把這個技術拿出來?其實最重要的原因并不是說又發(fā)明了一個新的技術,而是說這個時代到這個時候,一方面是我們的計算能力提升,我們把神經(jīng)網(wǎng)絡做大做深需要很強的計算能力。到了這個05年、06年,我們的計算機計算成本下降到一個臨界點。另外一方面隨著互聯(lián)網(wǎng)公司的興起,我們積累了大量的數(shù)據(jù),過去我們用來訓練人臉的數(shù)據(jù)只有幾百上千張圖片,不足以把神經(jīng)網(wǎng)絡訓練好,現(xiàn)在我們在網(wǎng)上可以輕而易舉的獲得到至少百萬級甚至千萬級的人臉圖片,所以基于這些圖片我們訓練一個很深的神經(jīng)網(wǎng)絡模型,能夠遠遠好于過去的人臉識別效果。

就整個框架來說,重點有兩個:一個是技術,機器學習,另外一個是大數(shù)據(jù)。機器學習技術,說實話早就已經(jīng)出來了。其實是各個領域的發(fā)展,包括互聯(lián)網(wǎng)的發(fā)展帶來了大數(shù)據(jù)出現(xiàn),包括計算代價的降低,方方面面的條件都成熟了,造成了我們現(xiàn)在能夠看到的IBM沃森能夠在智能問答領域戰(zhàn)勝人類最強的選手,像谷歌的機器人能夠在圍棋戰(zhàn)勝人類最強的選手。這是一個時代帶來的結果,并非黑科技的出現(xiàn)。

圍棋只是一個特定的領域,如果考慮商業(yè)應用,還需要積累大量的商業(yè)領域的數(shù)據(jù)。所以很重要的是,我們需要積累大量有意義的數(shù)據(jù),如果沒有大數(shù)據(jù)的支撐,無法把人工智能給訓練出來。我們需要各行各業(yè)的服務,在服務里面去產(chǎn)生數(shù)據(jù)。這個事情對于中國來說是巨大的機會。因為在中國人口基數(shù)是最大的,中國做一個活動能夠獲得的數(shù)據(jù)量是海外很多地方不具備的。

我自己有一個深刻的感受,我在香港服務過PCCW,這是香港最大的運營商,他們能給我們提供的數(shù)據(jù)量是兩百萬用戶所產(chǎn)生的數(shù)據(jù),而在中國我們服務于一個福建的運營商就能夠獲得兩千萬用戶的數(shù)據(jù)??赡茉诤芏嗳丝磥?,福建移動影響力遠遠小于PCCW,但是放在大數(shù)據(jù)人工智能的時代,哪怕是中國一個省所能提供的有意義的數(shù)據(jù)也是巨量的,這些數(shù)據(jù)能夠在商業(yè)領域為我們創(chuàng)造價值。

2人工智能可以/不可以做什么?對經(jīng)營與生活的實際影響?

第二部分是關于AI技術提供什么樣的價值。首先是預測未來的能力。我們基于過去積累大量有意義的大數(shù)據(jù),可以自動分析總結,去預測未來會發(fā)生的事情。當你知道未來有三條路可以走,你就預測走每條路的結果,選擇最好的路去走。未來兩個方向,一個是數(shù)據(jù)集成的能力,怎么能夠讓各行各業(yè)產(chǎn)生的數(shù)據(jù)融合起來,共同去發(fā)揮價值。最后一個最終能夠達到最高的境界,叫做終生學習。

首先是預測未來,我們發(fā)現(xiàn)很多領域的應用,背后的原理都是預測。比方說搜索引擎,當你在搜索引擎輸入一個關鍵詞,現(xiàn)在假設有一千一萬個候選網(wǎng)頁,我需要去預測,把每個網(wǎng)頁推薦給你,滿意的概率是多少,然后推薦給你最滿意的網(wǎng)頁。這個滿意度可以用一些指標來度量,比如點擊率、瀏覽時長等。

同樣的道理,風險管控做的是什么?當你過來申請一筆貸款的時候,我要去預測你還不上的概率是多少。然后選擇最大概率能還上錢的人,我把錢借給他。

至于推薦引擎,就是預測我推薦給你的東西,你采納的概率是多少。

以上種種的應用看上去業(yè)務方向是差別很大,但是背后所有的能力都可以歸結到預測的能力。

如果我們要去衡量什么叫好的預測能力,我認為最重要的有三點:一個叫細,一個叫快,一個叫變。先解釋細。比如說我現(xiàn)在要精準的找到目標客戶,這個圖中有一個大的客群。其中橘黃色是我想要找到的客戶。我過去有些專家的經(jīng)驗,用一兩條規(guī)則去篩選,最后選擇這樣的客群作為目標客戶,我們會發(fā)現(xiàn)這里面錯誤其實是很多的。如果說我們對人群劃分的更細,就可以更精準的找到目標人群。精細,這是預測能力的第一個方面。

第二個方面,我們會發(fā)現(xiàn)AI跟時代有關系。隨著科技的發(fā)展,信息的傳遞速度越來越快,比如古代傳一封書信要十天半個月以上,到后來書信通過郵局數(shù)天可以送到,IT信息化以后,辦理業(yè)務的時效性基本縮短到T+1的時間,到了互聯(lián)網(wǎng)時代,我們對信息的時效性要求提升到分鐘級、秒級。信息傳遞速度的加快,對于做預測能力或者說決策能力的時效性要求也會大幅度提升。所以我們也會要求我們的AI系統(tǒng)要隨著信息的變化,過去我們是T+1,現(xiàn)在是T加幾分鐘,T加幾秒的變化。

我們知道隨著時間的變化,無論是時代的變遷,還是政策的變化,我們的環(huán)境是一直在改變。如果我們用一個過去的模型去預測未來,當你的環(huán)境變了,決策就會有問題。我們在實踐過程中曾發(fā)現(xiàn)這樣一個問題,在百度鳳巢廣告,如果有兩個星期我們不更新AI模型,最后帶來的收入下降是14%,基本上平均每天下降1%。于是,我們需要盡可能做到至少每天更新一次AI模型,甚至做到每小時、半小時以內(nèi)更新一次。

我們可以對比一下,人的智能和機器的智能,差別在哪里?人受限于精力,不可能把所有的信息都能夠覆蓋到。通常我們認為什么是好的決策者?好的決策者應該特別能抓主干,能夠抓大放小,這都是人的優(yōu)點。有個領域叫做BI,Business Intelligence。BI就是一個典型的基于數(shù)據(jù)的抓大放小的思路,我們拿到大量數(shù)據(jù)統(tǒng)計結果,分析數(shù)據(jù)抽出最主要的結論交給團隊去執(zhí)行,這里面會丟失掉大量的細枝末節(jié)的信息。

過去認為這種細枝末節(jié)的信息是沒有價值的,但是放在機器上,因為沒有精力的限制,不需要抓大放小。比方說一家大銀行一年有幾百億交易,過去我們主要看一些城市的交易分布,或者行業(yè)的交易分布,但是我們不會去分析一家店或者一個pos機的交易情況。但是當數(shù)據(jù)量大到一定的程度,我們發(fā)現(xiàn)哪怕你看一個pos機,一年數(shù)據(jù)量也是成千上萬的,你完全可以分析細到一個pos機的情況,針對一個pos機的行為,甚至一個pos在某一個時間段,比如七點到八點之間的行為,給設計不一樣的決策,這是AI能夠做到。人在目前來說做這個事情不是智商不夠,而是精力不夠,AI能在精力上補充人很大的一部分能力。所以現(xiàn)在這個階段我們要做一個AI系統(tǒng),去作為人的補充。很重要的是我們要開發(fā)人覆蓋不到的細枝末節(jié)的部分。而這部分我們認為是大數(shù)據(jù)里面80%以上的信息,過去人做分析的時候只看到了20%的頭部信息。

我可以分享一下我們現(xiàn)在能做到的一些case,首先是消費金融領域。這是一個招商銀行信用卡交易分期的case,信用卡的交易有一段時間免息期,如果在賬單前你把錢還上,對于一家信用卡公司來說是虧本的,那信用卡公司怎么盈利呢?我們發(fā)現(xiàn)有30%的客戶會做分期,分期就會產(chǎn)生利息,信用卡公司其實是用這部分利息來盈利的。所以一家信用卡公司如果要做營銷,增加它的盈利,最重要的是增加它的分期交易。有一種方式是主動營銷來獲得更多的分期交易。我們做的是,基于每天數(shù)十萬的信用卡的交易,更精準的定位哪些客戶是更有概率去做分期的,然后選擇更有概率做分期的客戶做營銷,最后在同等情況下提升60%的收益。

我們與招商銀行一起設計了一個新的思路。過去他們怎么使用數(shù)據(jù)?他們會從系統(tǒng)里面去收集一些數(shù)據(jù)。收集數(shù)據(jù)的時候,一個最頭疼的問題是不知道要收集哪些的數(shù)據(jù),這時候往往需要做規(guī)劃,什么數(shù)據(jù)要收,什么數(shù)據(jù)不要收,然后再把收的數(shù)據(jù)拿來看看能分析出什么結果,最后再看發(fā)揮什么作用。由于層層衰減,到最后產(chǎn)生價值的時候,往往已經(jīng)衰減得很厲害了。我們提出,不應該先討論要收什么數(shù)據(jù),應該先討論的是要完成什么目標。你的目標是什么?交易分期業(yè)務的目標是希望能夠提升交易分期的收入。然后我們把這個收入目標去做分解,交易分期我們是用短信主動營銷,我們把它拆解成:短信的發(fā)送量*短信的響應率*分期費率。然后,目標被確定為提升短信的響應率。在這個基礎上我們認為我們需要去預測給它發(fā)送短信的成功率,我們需要有一個短信成功率預測的模型。這個模型確定以后,我們基于這個模型去分析需要什么數(shù)據(jù)。

即便確定下來需要的數(shù)據(jù),這個時候我們?nèi)匀徊恢肋@些數(shù)據(jù)到底有還是沒有,但是我們先把這個數(shù)據(jù)需求規(guī)劃出來,然后再反過來從各個系統(tǒng)里面去找哪些系統(tǒng)里面有這些數(shù)據(jù),最后把這些數(shù)據(jù)找出來。我們找到了2 TB數(shù)據(jù),在里面設計出了超過五千萬特征。最后我們建立了這個模型,它能夠在一個短信還沒發(fā)出去之前,更精準的預測,這個短信發(fā)出去的成功概率。我會選擇成功概率最大的一些短信進行發(fā)送,最后與過去的專家模型相比,我們的模型能夠多定位68.6%的分期交易,提升61.7%的手續(xù)費。

所以從整個思路來說,首先是從目標出發(fā),到需要去建立什么模型,再到需要什么樣的數(shù)據(jù),再到各個系統(tǒng)里面去尋找數(shù)據(jù)——這樣的一個過程。基于類似的思路我們還做了很多其他的case,比如說信用卡的賬單分期模型,信用卡的汽車貸款精準營銷模型,例如賬單分期我們提升28%的收入,汽車分期能夠提升百分之二三百的收入。

第二個case不是我們做的,是我們公司一個聯(lián)合創(chuàng)始人在加入我們公司之前做的一個案子。相信大家都很熟悉,叫做今日頭條。今日頭條要干什么事?要給每個人推薦不一樣的閱讀,每個人看到的都是自己想看到的內(nèi)容。同樣是從目標出發(fā),我們要定義的是,你看到的新聞,什么叫好,什么叫不好。當時定義了很多指標,比方說點擊率、閱讀時長、收藏率、轉化率、用戶抱怨量。然后我們那個聯(lián)合創(chuàng)始人做的是什么事情呢?他建立各種各樣的模型,當你過來今日頭條訪問的時候,就可以預測給你推這個新聞的點擊率是多少,閱讀時長是多少,收藏率是多少,轉發(fā)率是多少,用戶抱怨量是多少?;谶@些預測指標,可以得到一個綜合的打分,基于這個分數(shù)推薦閱讀。個性化是怎么做到的?個性化的背后的原理其實也是預測能力。就是說我要基于不同的人的情況去預測,給不同人推薦新聞、商品、或者其他對象,你喜歡的概率是多少。

本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
GPT-4肆意揮刀下,量子人工智能還有多遠?
人工智能發(fā)展到哪個階段了
那些正在被人工智能顛覆和重塑的行業(yè)
人工智能為什么越來越聰明,從機器學習說起
青山遮不住——2020的10大技術趨勢
深度學習:像人類一樣成長
更多類似文章 >>
生活服務
熱點新聞
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服