01
文 / 楊強,遷移學習奠基人、國際人工智能聯(lián)合會IJCAI理事會主席、IEEE/ACM/AAAI院士;本文根據(jù)楊強院士在2019基石資本年會上的演講整理(未經(jīng)本人審核)
來源:華夏基石e洞察(ID:chnstonewx)
AI現(xiàn)在是一個非?;馃岬脑掝},全社會都在討論。而我們最關注的是,AI的下一站會向何處去?因為最近的一些事件,讓我們不得不繼續(xù)深思?,F(xiàn)在全社會對于AI的看法,已經(jīng)從全面看好轉向正面和負面看法兼而有之。我們提出A.I.向善,首先當然要看到,AI確實能做很多有益的事。比方說,AI可以讓一個產(chǎn)業(yè)實現(xiàn)普惠發(fā)展,從只面向VIP的小規(guī)模服務,變成大眾都可以得到的普惠服務。比如一系列的AI+,AI+金融、AI+教育、AI+智慧城市、AI+災難營救、AI+扶貧農(nóng)業(yè),等等,這里不一一列舉。
但是另一方面,我們大部分人可能不知道的是,AI還有很多內(nèi)在的缺陷。首先,AI技術極度依賴大數(shù)據(jù),數(shù)據(jù)不可避免的局限性會導致AI出現(xiàn)有偏性。如果說AI是一架汽車,數(shù)據(jù)就像石油一樣,為引擎提供燃料。數(shù)據(jù)的好壞,決定了AI到底能做什么。如果AI系統(tǒng)得到了一個比較偏頗的數(shù)據(jù),AI系統(tǒng)的有偏性就成為一個非常嚴重的問題。比如說,如果提供數(shù)據(jù)的人都是男性用戶,那么系統(tǒng)表現(xiàn)出來的就只是一種針對男性的服務模型,而不會刻意為女性服務。其次,AI和人類的合作現(xiàn)在仍有很大障礙。前一陣大家都在談論的波音飛機失事事件,就是駕駛員和自動駕駛系統(tǒng)惡性博弈的后果,最后人類輸給了自動系統(tǒng)。AI還有很多尚未解決的問題,比方說AI系統(tǒng)的可解釋性,AI系統(tǒng)的可靠性、可信性和公平性,這些都是我們現(xiàn)在研究的前沿。
01
大數(shù)據(jù)的不可得性
——大數(shù)據(jù)時代真的來臨了嗎?
首先,我們知道AI是離不開大數(shù)據(jù)的,而我要強調的是大數(shù)據(jù)的不可得性?,F(xiàn)在一般都說我們今天進入了大數(shù)據(jù)時代,但是我要告訴大家,這是不對的,我們并沒有進入一個大數(shù)據(jù)時代。雖然谷歌和Facebook等大公司在數(shù)據(jù)不斷增大的情況下,系統(tǒng)變得越來越優(yōu)秀,錯誤率變得越來越低,指標變得越來越好。但是,除了這些巨頭之外,誰還能有這么大的數(shù)據(jù)?谷歌的自然語言處理系統(tǒng),獲得了全世界幾乎所有網(wǎng)絡和自然語言的數(shù)據(jù)用來做訓練,但是畢竟只有谷歌才有這樣的數(shù)據(jù)資源。再看看我們周邊,不管是法律、金融,還是醫(yī)療,所面臨的都是小數(shù)據(jù),也就是說它不能夠得到我們想象中的大數(shù)據(jù)+AI的紅利。雪上加霜的事實是,現(xiàn)在社會對于大數(shù)據(jù)的監(jiān)管越來越嚴。比方說Facebook最近曝出的一系列數(shù)據(jù)泄露的事件,遭到了大眾巨大的質疑。歐洲也出臺了相應的個人數(shù)據(jù)保護法規(guī),歐盟就頒布了GDPR(《通用數(shù)據(jù)保護條例》)。在中國也有《網(wǎng)絡安全法》等數(shù)據(jù)網(wǎng)絡個人隱私保護法案和條例,還有更嚴格的相關法律正在醞釀當中。以上這些情況都說明,目前并非如我們普遍所感受的,覺得我們已經(jīng)進入了大數(shù)據(jù)時代;恰恰相反,我們現(xiàn)在面臨的是大量數(shù)據(jù)孤島的出現(xiàn),包括BAT公司一些內(nèi)部數(shù)據(jù)在部門之間都是隔離的。
02
新工具之一:遷移學習
——從大數(shù)據(jù)到小數(shù)據(jù)
作為AI技術的研究人員,我們現(xiàn)在正在做一些世界前沿的研究,嘗試解決大數(shù)據(jù)的缺陷對AI帶來的挑戰(zhàn)。第一個叫做遷移學習,就是在一個大數(shù)據(jù)的環(huán)境下,已經(jīng)訓練出一個非常不錯的通用模型,再把這個模型遷移到任意一個相關的任務場景中,看是否可行。如果在新的場景中可行,就不需要重新去獲取大數(shù)據(jù)了。這個是解決大數(shù)據(jù)缺陷的一個很有力的做法。
遷移學習,是我們?nèi)祟惙浅J煜さ膶W習方式。如果我們學會了騎自行車,很容易就能學會騎摩托車。這種能力的遷移,使得我們學了一件事,就會舉一反三,去學很多其他的事情。而計算機在深度學習的場景下,是怎么實現(xiàn)這個過程的呢?假設我們已經(jīng)把藍色的模型建得非常完美了,有一個新的紅色任務還沒有足夠的數(shù)據(jù)和標注,模型也建得不好。如果我們能夠把兩者聯(lián)系起來,就可以很自如地從藍色遷移到紅色,就實現(xiàn)了遷移學習的效果。
首先,遷移學習的最大效用就是使一個模型的適用范圍廣泛擴大。我們在計算機領域稱之為“魯棒性”,就是說外部環(huán)境再怎么變化,系統(tǒng)的表現(xiàn)都會呈現(xiàn)出相對的穩(wěn)定性。
其次,遷移學習可以用來支持邊緣計算。“邊緣計算”現(xiàn)在是一個熱詞,大概意思是說,很多的模型和處理本身都可以在終端進行,不用把數(shù)據(jù)原封不斷地送到云端。這樣做的好處是帶寬的需求減少,隱私的泄露也大為減少,因為此時需要往云端傳的只是一些關鍵的參數(shù)而已。遷移學習為什么能達到這個效果?因為云端一旦得到了一個很強的模型,釋放給周圍的邊緣地帶,邊緣可以利用自己本身的計算能力來強大自身,來適配各自的任務。這就是邊緣計算的好處。所以遷移的最終目的就是實現(xiàn)從大數(shù)據(jù)到小數(shù)據(jù),從一舊場景新場景的轉接。
03
遷移學習如何實現(xiàn)?
在不同領域中發(fā)現(xiàn)不變量
那么,在深度學習的場景下,遷移學習是怎么實現(xiàn)的?舉個例子,國內(nèi)開車,司機坐在車的左邊,在香港開車,司機坐在車的右邊。如果我們到香港去租一輛車,還是能夠很快適應這種開車習慣的。背后的原因就是司機和路中線的相對位置是不變的。這就給我們一個啟發(fā),要做好遷移學習,就要在兩個不同的領域中發(fā)現(xiàn)二者的不變量。
深度學習的場景下,數(shù)據(jù)從輸入到輸出會分成不同的層次,如同深度學習的神經(jīng)元。我們觀察在不同的層次,從離輸入最近的最低層,到離任務最近的最高層,每層的遷移能力大有不同。越靠近輸入層的遷移能力就越強,學習效果就越好。對于圖像來說,如果我們能夠把靠近輸入的這些層次遷移過去的話,剩下的工作并沒有那么多,就不需要那么多數(shù)據(jù)來重新做訓練。用這個方法,我們就可以創(chuàng)造出一系列新的算法來,比如所謂的傳遞式的遷移學習,不是從一個領域直接遷移到任務領域,而是從第一個遷移到第二個、再從第二個遷移到第三個,這樣依次傳遞。這樣的傳遞效果很明顯。
最近斯坦福大學的一個例子給了我們很大的啟發(fā)。他們利用衛(wèi)星圖像觀察非洲大陸,以此來判定哪一個區(qū)域需要更多的聯(lián)合國資助。在過去,這樣的工作是需要人為調查的,成本昂貴,速度很慢。但是現(xiàn)在可以用遷移學習,尤其是傳遞式遷移學習來實現(xiàn)。最開始的照片甚至是網(wǎng)上隨意抓下來的照片,通過照片的比對,都可以遷移到扶貧的任務上,取得了非常大的成功。第四范式公司的一項實踐,也是一個從大數(shù)據(jù)到小數(shù)據(jù)的遷移學習的例子。當時的任務是要做一個豪車產(chǎn)品的營銷模型,這需要在大眾當中識別最有可能性的目標受眾。但問題就是沒有足夠的數(shù)據(jù)來訓練這個模型,因為豪車成交數(shù)量是非常少的。他們就利用遷移學習的方式,用大量小貸的場景,以上億的數(shù)據(jù)來做訓練,形成模型后再遷移到豪車買賣的場景。其效果就使得最后營銷的成果大為提升。
另外,我們可能都用過今日頭條,或者手機APP的推薦功能,這種推薦策略是因人而異的,是個性化的,這種策略也可以做遷移。比如在一個場景下,已經(jīng)用機器學習訓練出一個好的推薦模型,用戶看了這條內(nèi)容,劃下來的應該是哪幾個新聞或者視頻。這個系統(tǒng)完全可以從一個領域遷移到另一個領域,比如你看了相關主題的影視類視頻,然后算法可以遷移到一些故事片的視頻、新聞片的視頻。這種算法叫做強化學習算法,也可以用來做遷移。
輿情分析也是一個特別有利的應用場景,比如電商下面會有很多用戶留言,一般我們會讓計算機來把這幾十萬的用戶留言分成正面和反面。這就需要大量的標注,把一些關鍵詞標出來。當我們到了一個新的場景,比如賣書、賣游戲,用了遷移學習以后,就可以大為節(jié)省重新標注的工作量,很好地提升效果。這里,我們提出來一個概念叫做對抗學習。這也是最近在機器學習、深度學習領域發(fā)展非常迅猛的一個方向??偨Y起來就是,如果我們面臨一個小數(shù)據(jù)的場景,不知道需要花多大的力量去重新標注數(shù)據(jù),這時候一個好辦法就是找到一個已經(jīng)有的場景、已經(jīng)有的模型,把它遷移過來。這個概念是我們在香港科技大學20年以前就開始做的,在全世界范圍都有引領的作用。我們的文章被引用率已經(jīng)超過5000,是非??捎^的一個數(shù)字。目前,BAT、谷歌、Facebook都在用遷移學習,試圖擴大應用場景。吳恩達甚至說,遷移學習是監(jiān)督學習的下一個戰(zhàn)場。
04
新工具之二:聯(lián)邦學習
——從小數(shù)據(jù)到“大數(shù)據(jù)”
第二個領域是聯(lián)邦學習。數(shù)據(jù)本身是割裂的,是以孤島的形式存在的,如果能在安全的前提下把這些數(shù)據(jù)在虛擬世界聚合起來,同時不泄露各自的隱私,并且能建立像以前一樣好的模型,就可以形成從小數(shù)據(jù)到大數(shù)據(jù)的聚合能力。
當出現(xiàn)很多數(shù)據(jù)孤島,沒有辦法整合,就會有人作假。像Facebook把數(shù)據(jù)給了另一家公司,結果被用來傳播假消息,因此Facebook也受到連累。這個消息曝光的當天,F(xiàn)acebook的股價隨之暴跌。為了防止類似事件發(fā)生,歐洲引入GDPR法案,從立法上給予個人隱私可靠的保護。加州最近也出臺了類似的法規(guī),中國對數(shù)據(jù)安全的立法也已經(jīng)到了人大常委會的層面了。在層層約束下,如果一個公司收集了用戶的數(shù)據(jù),去做其他事情,一定要取得用戶的同意,否則就不被允許。如果用戶后悔了,不希望自己的數(shù)據(jù)被使用,這個公司就不能在模型里采用相關數(shù)據(jù)。這種情況,其實對機器學習、對AI的進一步發(fā)展提出了很大的挑戰(zhàn),導致整個算法系列都要重新建立。數(shù)據(jù)孤島,以及越來越收緊的相關法規(guī),已經(jīng)成為AI發(fā)展的巨大阻力。如果現(xiàn)在還有初創(chuàng)公司在做深度學習,做無人車,做推薦系統(tǒng),這樣的公司是沒有前途的。
05
整合:從小數(shù)據(jù)的孤島到大數(shù)據(jù)的聯(lián)盟
面對巨大的阻力,聯(lián)邦學習就應運而生。這需要從數(shù)據(jù)的整合說起。不同的機構擁有的數(shù)據(jù)是不同的,用戶本身的行為數(shù)據(jù)是X,結果數(shù)據(jù)是Y。例如一個用戶帶著手機走來走去,產(chǎn)生的GPS通信數(shù)據(jù)就是典型的X數(shù)據(jù)。一般來說,這種行為數(shù)據(jù)X是不帶有任何目的性的。而Y數(shù)據(jù)是有目的的,特別是商業(yè)目的。所以結果數(shù)據(jù)是非常值錢的。比如在金融領域,用戶到底有無貸款,還款與否,這就是我們所說的Y數(shù)據(jù)。只有當X數(shù)據(jù)和Y數(shù)據(jù)合到一起,才能用來訓練AI的系統(tǒng)。但我們面臨的情況是,有很多的X數(shù)據(jù)分布在不同的機構,擁有Y數(shù)據(jù)的一般都是一些持牌機構,像保險、銀行。首先很難獲取,其次也很難整合,并且要保證安全性。有人提出,可以用一些加密算法把數(shù)據(jù)加密,然后用一些數(shù)學工具進行聚合。但是,這些數(shù)學工具往往都是數(shù)學家們發(fā)明的,根本就沒有考慮實用性,實際的計算復雜度非常高,所以工具的計算能力應用起來非常差。
最近,計算機領域提出了新的工具。谷歌推出了“federated learning”的概念,即聯(lián)邦學習。在此之前,安卓系統(tǒng)訓練模型的方式是,每一個安卓系統(tǒng)都要往云端傳送本地數(shù)據(jù),像本地輸入法鍵盤的輸入,或者是照片,都會被進行標注并上傳到云端,幫助訓練云端的模型,最后再把訓練好的模型下傳到各個安卓手機上。但是自從歐洲的GDPR出臺以來,這個過程就成了違法行為,因為把用戶本地數(shù)據(jù)傳到云端是沒有經(jīng)過用戶同意的。現(xiàn)在他們的辦法是,先在每一個本地手機把模型建好,然后對模型進行加密封裝,把封裝好的模型運到云端,保證在云端也沒有辦法拆封,在這個狀態(tài)下進行重新建模,最后把重新建好的模型再下發(fā)到每個手機上。這就是谷歌所說的聯(lián)邦學習。但這種做法只是針對to C的做法,我們目前在研究to B的聯(lián)邦學習方式。兩個機構之間可能有一些用戶是共有的,但各自收集到的數(shù)據(jù)卻不同,比方銀行業(yè)和電信業(yè),這邊的數(shù)據(jù)是X1—X3,那邊收集到的是X和X5。如何能夠促成數(shù)據(jù)的聚合,同時又不泄露用戶的隱私?針對這種情況,我們提出了縱向聯(lián)邦的概念,專門解決to B的聯(lián)邦學習,目前正在嘗試推出新的算法。
06
從數(shù)據(jù)堆積模型,到模型傳遞數(shù)據(jù)
總的來說,聯(lián)邦學習是指,每一個本地就像一個個聯(lián)邦社會里的國家一樣,可以保留自己的數(shù)據(jù),但是要參與到聯(lián)邦里進行共同計算,來建立一個更好的模型。我們可以用聯(lián)邦學習的方式,建設整個數(shù)據(jù)模型的過程,同時使得各個數(shù)據(jù)集之間看不到對方的數(shù)據(jù),充分實現(xiàn)數(shù)據(jù)的保密性。在過程當中有很多數(shù)學的表達,其中一個很重要的表達是,在兩邊進行模型傳遞的時候,數(shù)據(jù)不可以被反向工程模擬出來。以前的深度學習需要把數(shù)據(jù)堆到一起來建模,而聯(lián)邦學習就是數(shù)據(jù)不動,而模型在動,讓模型在數(shù)據(jù)集之間傳遞。在模型傳播的過程中,可以規(guī)避在接到新模型時,把其他數(shù)據(jù)重造出來的風險。這是一種全新的思維,也是在目前嚴監(jiān)管的狀態(tài)下能夠挽救深度學習、挽救AI的一個技術方案。所以我們做了這么一系列的嘗試,研究了一系列的算法。同時還產(chǎn)生了一個很重要的副產(chǎn)品——比如我有多家銀行的數(shù)據(jù),還可以在保密的前提下發(fā)掘出多方借貸的情況。在過去,需要把多方數(shù)據(jù)加以重疊,才能發(fā)現(xiàn)多方借貸情況。用聯(lián)邦學習的方式,就不需要這么麻煩,可以自動發(fā)現(xiàn)并且不暴露各自數(shù)據(jù)的隱私。同時,我們可以把前面講的遷移學習引入兩個模型中,使得模型之間不僅可以做聯(lián)邦學習,同時可以把數(shù)據(jù)加以遷移,到最后同時壯大兩邊的數(shù)據(jù)。在這個方向上,目前我們是世界領先的?,F(xiàn)在我們還提出了一系列的專利,標準也正在建立,在學術上也建立了一系列新的算法。
最后要說的是,大家參與共同建模的聯(lián)盟,一定是因為有好處,那么這個好處是如何分配的?我們以博弈論為基礎,建立了一個經(jīng)濟學模型,已經(jīng)做到了把最后的收益公平地分配給參與方,并使得新的參與方不斷加入。現(xiàn)在有幾個跨行業(yè)的成功案例已經(jīng)建立了合作,一些金融、互聯(lián)網(wǎng)的企業(yè)和學術研究機構,通過這種加密安全合作,使得各自的效果指標都達到了提升。現(xiàn)在我在微眾銀行做指導人工智能的工作,就是關于互聯(lián)網(wǎng)和金融風控的合作,我們已經(jīng)取得了一系列成果。另外就是在智慧城市管理領域的實驗。我們知道城市的攝像頭背后都歸屬于不同的機構,但他們的數(shù)據(jù)不能傳遞。在這種場景下,我們能夠把這些視覺數(shù)據(jù)合而為一,同時又不暴露用戶隱私,能夠讓各自的模型都得到加強。最近我們在深圳做了一個相關實驗,非常成功,準確率效果提升了15%。
同時,我們發(fā)動領導了HPOE的國際標準,最近在深圳開了第一次全體會議,6月份在洛杉磯召開第二次全體會議,也得到了很多企業(yè)的支持。我們剛發(fā)布了聯(lián)邦學習第一個開源系統(tǒng),F(xiàn)EDAI,大家如果有興趣可以去參考。我們主辦了一些國際領先的會議,比如國際人工智能聯(lián)合會要舉辦的一些國際會議,請來了GDPR(歐洲個人隱私保護法)法案的發(fā)起人、google聯(lián)邦學習的小組領導,全世界都在關注我們的動向。
綜上所述,目前AI面臨的巨大挑戰(zhàn)就是數(shù)據(jù)挑戰(zhàn),數(shù)據(jù)孤島、數(shù)據(jù)割裂、安全隱私風險,等等。如果大家關心AI投資,應該關注被投企業(yè)有沒有對這一方面的考慮和長遠規(guī)劃。我們對此提出的兩個技術方案,遷移學習和聯(lián)邦學習,就是解決以上這些挑戰(zhàn)的有力工具,再加上我們運用經(jīng)濟學激勵機制,使得新型的合作模式能夠廣泛展開。
(整理/編輯 張曉倩)
對標華為、阿里、萬科、OPPO…
如何向事業(yè)合伙人平臺組織進化
聯(lián)系客服