為數(shù)據(jù)而生,為隱私而戰(zhàn):隱私計算產(chǎn)業(yè)加速崛起
在充分保護(hù)隱私的同時盡可能多地挖掘數(shù)據(jù)價值,不僅理論上可行,實踐中也有越來越多的團(tuán)隊為之努力并取得進(jìn)展。
數(shù)字經(jīng)濟(jì)時代,數(shù)據(jù)作為新的生產(chǎn)要素和戰(zhàn)略性資源,是科技進(jìn)步、政策制定和經(jīng)濟(jì)發(fā)展的重要動力。但是,只有在隱私和安全得到保障的前提下,數(shù)據(jù)的價值才能最大化。近年來,隨著《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》和《個人信息保護(hù)法》的頒布與實施,國家、行業(yè)、地方相繼出臺了一系列數(shù)據(jù)安全相關(guān)配套性政策文件,完善數(shù)據(jù)要素治理制度,保障數(shù)據(jù)流通交易安全。特別是 2022 年底發(fā)布的「數(shù)據(jù)二十條」,進(jìn)一步推動了公共數(shù)據(jù)、企業(yè)數(shù)據(jù)、個人數(shù)據(jù)合規(guī)高效流通使用,數(shù)據(jù)「可用不可見」「可控可計量」成為法定要求。在推動數(shù)據(jù)二十條理念落地的途徑中,隱私計算作為平衡數(shù)據(jù)流通與價值釋放的關(guān)鍵「技術(shù)解」,得到了越來越多的重視。在 2022 年 Gartner 技術(shù)成熟度曲線列出的 25 項值得關(guān)注的新興技術(shù)中,有 6 項與隱私計算相關(guān),足見其價值與潛力。今年 1 月,工信部、國家網(wǎng)信辦、國家發(fā)改委等 16 部門印發(fā)《關(guān)于促進(jìn)數(shù)據(jù)安全產(chǎn)業(yè)發(fā)展的指導(dǎo)意見》,明確提出加強(qiáng)隱私計算、數(shù)據(jù)流轉(zhuǎn)分析等關(guān)鍵技術(shù)攻關(guān),加強(qiáng)數(shù)據(jù)質(zhì)量評估、隱私計算等產(chǎn)品研發(fā)。隱私計算產(chǎn)業(yè)也在加速崛起。中國信息通信研究院報告指出,預(yù)計到 2025 年,中國的隱私計算市場規(guī)模將達(dá)到百億元人民幣。隱私計算是隱私保護(hù)計算(Privacy-preserving Computation)的簡稱,它能夠在保證數(shù)據(jù)提供方不泄露原始數(shù)據(jù)的前提下,對數(shù)據(jù)進(jìn)行分析、處理和使用,是一個廣義的概念,涉及人工智能、密碼學(xué)、數(shù)據(jù)科學(xué)等眾多學(xué)科和領(lǐng)域的交叉融合,涵蓋了安全多方計算、同態(tài)加密、差分隱私、零知識證明、聯(lián)邦學(xué)習(xí)、可信執(zhí)行環(huán)境等眾多技術(shù)子項,以及這些技術(shù)子項的組合及相關(guān)產(chǎn)品方案。
根據(jù)目前中國業(yè)界共識,隱私計算主要分為以安全多方計算為代表的密碼學(xué)路徑、以機(jī)密計算為代表的可信執(zhí)行環(huán)境(硬件)路徑,以及以聯(lián)邦學(xué)習(xí)為代表的人工智能路徑。安全多方計算(Secure Multi-Party Computation)由圖靈獎得主姚期智院士于 1982 年通過提出和解答「百萬富翁問題」而創(chuàng)立。安全多方計算能保證各參與方僅獲得正確計算結(jié)果,無法獲得除計算結(jié)果之外的任何信息,是多種密碼學(xué)基礎(chǔ)工具的綜合應(yīng)用,除混淆電路、秘密分享、不經(jīng)意傳輸?shù)让艽a學(xué)原理構(gòu)造的經(jīng)典多方安全計算協(xié)議外,其他所有用于實現(xiàn)多方安全計算的密碼學(xué)算法(如同態(tài)加密、零知識證明),都可以構(gòu)成多方安全計算協(xié)議。經(jīng)過 30 多年的理論研究,安全多方計算在技術(shù)上已趨成熟,在需要識別共同客戶或興趣但又要保護(hù)其他數(shù)據(jù)的場景下,例如醫(yī)療領(lǐng)域進(jìn)行共同研究,或是企業(yè)之間分享數(shù)據(jù)以提高業(yè)務(wù)效率,已經(jīng)發(fā)揮出重要的應(yīng)用價值。
機(jī)密計算(Confidential Computing) 機(jī)密計算的基本原理是將需要保護(hù)的數(shù)據(jù)或代碼存儲在可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE)中,對這些數(shù)據(jù)和代碼的任何訪問都必須經(jīng)過基于硬件的訪問控制,防止其在使用中未經(jīng)授權(quán)被訪問或修改,從而實現(xiàn)對數(shù)據(jù)處理流程的可驗證與控制,增強(qiáng)數(shù)據(jù)的安全性。其中,可信執(zhí)行環(huán)境定義為可在數(shù)據(jù)機(jī)密性、數(shù)據(jù)完整性和代碼完整性三方面提供一定保護(hù)水平的環(huán)境,也包括云環(huán)境。機(jī)密計算可追溯至 2002 年 ARM 推出 TrustZone 技術(shù),2015 年Intel 推出 SGX 技術(shù)標(biāo)志著機(jī)密計算進(jìn)入快速發(fā)展階段,如今 AMD、華為等廠商也推出了各自的機(jī)密計算技術(shù)。使用聯(lián)邦學(xué)習(xí)在多個移動端聯(lián)合訓(xùn)練機(jī)器學(xué)習(xí)模型。圖片來源:Wikipedia
聯(lián)邦學(xué)習(xí)(Federated Learning) 聯(lián)邦學(xué)習(xí)由 Google 在 2016 年提出,其核心思想是允許兩個或多個參與方在數(shù)據(jù)不出域的情況下,協(xié)同完成模型的構(gòu)建與使用,強(qiáng)調(diào)「數(shù)據(jù)不動模型動,數(shù)據(jù)可用不可見」,適用于參與用戶多、數(shù)據(jù)特征多且分布廣泛的聯(lián)合計算應(yīng)用場景。根據(jù)參與計算的數(shù)據(jù)在數(shù)據(jù)方之間分布的情況不同,可以分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí)。通常情況下,聯(lián)邦學(xué)習(xí)需要與其他隱私保護(hù)技術(shù)聯(lián)合使用,才能在計算過程中實現(xiàn)對數(shù)據(jù)的保護(hù)。中國互聯(lián)網(wǎng)巨頭隱私計算產(chǎn)業(yè)落地情況目前,隱私計算正處于飛速發(fā)展階段,單點技術(shù)持續(xù)優(yōu)化,在實際應(yīng)用中呈現(xiàn)出多技術(shù)融合的態(tài)勢,以應(yīng)對不同場景下的數(shù)據(jù)安全和隱私保護(hù)需求。根據(jù) Gartner《2022 隱私技術(shù)成熟度曲線》報告,預(yù)計未來 5-10 年隱私計算技術(shù)會被大規(guī)模商業(yè)化應(yīng)用,到 2025 年 60% 以上的大型組織將在數(shù)據(jù)分析、商業(yè)智能或云計算中使用一種或多種隱私計算技術(shù)。隨著技術(shù)增益與商業(yè)落地場景逐步豐滿,大數(shù)據(jù)、人工智能、區(qū)塊鏈、云服務(wù)等類型的企業(yè)紛紛入局隱私計算,各類玩家在積極推高技術(shù)滲透率與拓展應(yīng)用邊界的過程中,一同構(gòu)成中國隱私計算產(chǎn)業(yè)圖景。其中,騰訊、螞蟻、阿里、百度、字節(jié)跳動等互聯(lián)網(wǎng)巨頭有強(qiáng)大的技術(shù)實力,龐大的用戶群與合作伙伴,坐擁海量高價值數(shù)據(jù),是隱私計算入局者中不可忽視的力量。這些企業(yè)不僅能推動隱私計算技術(shù)加速發(fā)展,催生出新的產(chǎn)業(yè)機(jī)會與發(fā)展空間,還有望重塑企業(yè)與用戶之間的關(guān)系,甚至影響行業(yè)力量對比與市場格局。騰訊早在 2009 年便自主研發(fā)大數(shù)據(jù)處理平臺, 2015 年發(fā)布高性能計算框架 Angel,支持 10 億維度的算法訓(xùn)練和非結(jié)構(gòu)化數(shù)據(jù)處理,被廣泛用于微信支付、QQ、騰訊視頻等業(yè)務(wù)。為了更好應(yīng)對數(shù)據(jù)安全和隱私保護(hù)需求,騰訊積極探索隱私計算技術(shù),在 2019 年組建了專門的研發(fā)團(tuán)隊,并發(fā)力內(nèi)部人才培養(yǎng)。2021 年,騰訊第四代大數(shù)據(jù)平臺「天工」發(fā)布,旨在以安全的形式打通數(shù)據(jù)孤島,打造安全、智能、統(tǒng)一的新型數(shù)據(jù)基礎(chǔ)設(shè)施。其中,隱私計算作為核心技術(shù),確保機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析在各個場景中落地時調(diào)用數(shù)據(jù)的安全。天工平臺的核心產(chǎn)品 Angel PowerFL 安全聯(lián)合計算平臺,是騰訊聚焦隱私計算前沿技術(shù)領(lǐng)域的落地成果,目前已通過中國金融認(rèn)證中心(CFCA)、中國信通院等權(quán)威組織機(jī)構(gòu)評測,在金融、廣告、醫(yī)療、政務(wù)等場景落地,并取得了較好的應(yīng)用效果。另一個核心產(chǎn)品騰訊云安全隱私計算平臺,是一個基于聯(lián)邦學(xué)習(xí)、多方安全計算、區(qū)塊鏈、TEE 等安全技術(shù)的分布式計算平臺,依托 Angel PowerFL 能力支持,圍繞強(qiáng)安全、高性能、強(qiáng)穩(wěn)定、易使用四大核心能力特性,使原始合作數(shù)據(jù)不出本地便可實現(xiàn)聯(lián)合建模、安全求交(PSI)、隱匿查詢、安全統(tǒng)計分析等功能,助力產(chǎn)品應(yīng)用層全方位滿足行業(yè)需求與用戶的痛點,已實際應(yīng)用于跨機(jī)構(gòu)數(shù)據(jù)合作、銀行信貸、保險、政務(wù)、在線教育等多個場景。騰訊 Angel PowerFL 隱私計算團(tuán)隊也是國內(nèi)較早開展隱私計算與聯(lián)邦學(xué)習(xí)技術(shù)研究和應(yīng)用的團(tuán)隊,在大數(shù)據(jù)、分布式計算、分布式機(jī)器學(xué)習(xí)、分布式消息中間件、多方安全計算、應(yīng)用密碼學(xué)等領(lǐng)域都有豐富的研發(fā)和應(yīng)用經(jīng)驗,已發(fā)表近 10 篇隱私計算研究論文,提交了 60 多件隱私計算技術(shù)發(fā)明專利申請,有多個商用隱私計算和聯(lián)邦學(xué)習(xí)的平臺產(chǎn)品目前已經(jīng)通過騰訊云對外開放。團(tuán)隊連續(xù)三年獲得隱私計算業(yè)內(nèi)最具影響力的權(quán)威獎項,分別是 2020 年 iDASH 國際隱私計算大賽可信計算賽道冠軍、2021 年 iDASH 聯(lián)邦學(xué)習(xí)賽道冠軍、2022 年 iDASH 同態(tài)加密賽道冠軍。目前,騰訊隱私計算匯聚了來自騰訊大數(shù)據(jù)、騰訊安全、騰訊計費、騰訊云、騰訊廣告 AI,華中科技大學(xué)的密碼學(xué)、隱私計算、大數(shù)據(jù)和機(jī)器學(xué)習(xí)領(lǐng)域的技術(shù)專家。通過結(jié)合騰訊多元的科技能力,深度融合聯(lián)邦學(xué)習(xí)、安全多方計算、區(qū)塊鏈等技術(shù),幫助客戶打破數(shù)據(jù)孤島,激活數(shù)據(jù)使用的最大價值。未來將繼續(xù)融合隱私計算與云上 AI 安全技術(shù),并與其他企業(yè)和機(jī)構(gòu)合作,推動隱私計算更廣泛的落地。螞蟻集團(tuán)從 2016 年起布局隱私計算,在技術(shù)研發(fā)、產(chǎn)品服務(wù)、生態(tài)共建等方面取得諸多成果。螞蟻擁有業(yè)內(nèi)第一的隱私計算專利數(shù)量,并且提出了可信密態(tài)計算、受控匿名化等新的技術(shù)。產(chǎn)品和服務(wù)方面,開源可信隱私計算框架隱語(SecretFlow),支持目前幾乎所有主流的隱私計算技術(shù),并且積極支持互聯(lián)互通;開源可信執(zhí)行環(huán)境隱私計算操作系統(tǒng) Occlum,兼容 Linux 環(huán)境的 API,使現(xiàn)有應(yīng)用幾乎不需改造即可運行于可信執(zhí)行環(huán)境,大幅降低 TEE 應(yīng)用開發(fā)門檻;商用方面,螞蟻隱私計算一體機(jī),提供集軟硬件全??尚庞谝惑w的系統(tǒng)平臺,為組織機(jī)構(gòu)之間的數(shù)據(jù)聯(lián)合計算提供一站式安全解決方案;大規(guī)模多方安全計算商用平臺螞蟻鏈摩斯,是業(yè)內(nèi)首家通過多方安全計算產(chǎn)品測評(信通院 MPC 測評)和首批通過金標(biāo)委 MPC 測評的產(chǎn)品,截止 2022 年 2 月已服務(wù) 150 余家行業(yè)客戶。生態(tài)方面,螞蟻也積極推動國際國內(nèi)的行業(yè)標(biāo)準(zhǔn)制定,是多項重要標(biāo)準(zhǔn)的牽頭機(jī)構(gòu)。阿里集團(tuán)在隱私計算領(lǐng)域廣泛涉足,旗下的阿里安全、阿里云和達(dá)摩院均開展相關(guān)研究。阿里安全的雙子座實驗室專注于同態(tài)加密、安全多方計算等方向,其研發(fā)技術(shù)已廣泛應(yīng)用于阿里系業(yè)務(wù),部分技術(shù)達(dá)到業(yè)界領(lǐng)先。阿里云在 2020 年首次發(fā)布基于芯片安全的可信虛擬化實例,2021 年發(fā)布 DataTrust 隱私增強(qiáng)計算平臺,基于同態(tài)加密與可信執(zhí)行環(huán)境,在保障數(shù)據(jù)安全和隱私的同時支持多方數(shù)據(jù)協(xié)同分析與預(yù)測,不受數(shù)據(jù)規(guī)?;驈?fù)雜性影響,是國內(nèi)首個公有云原生加密計算產(chǎn)品。達(dá)摩院在 2022 年發(fā)布了 FederatedScope 聯(lián)邦學(xué)習(xí)框架并開源,支持在豐富應(yīng)用場景中進(jìn)行大規(guī)模、高效率的聯(lián)邦學(xué)習(xí)異步訓(xùn)練,能兼容 PyTorch、Tensorflow 等不同設(shè)備運行環(huán)境,大幅降低了聯(lián)邦學(xué)習(xí)在科研與實際應(yīng)用中的開發(fā)難度和成本。百度 2012 年便發(fā)布《數(shù)據(jù)安全策略》,2018 年成立數(shù)據(jù)隱私保護(hù)委員會,目前隱私計算作為底層基礎(chǔ)技術(shù),在百度智能云、百度安全、百度超級鏈等平臺上部署,并結(jié)合多種技術(shù)推出解決方案實現(xiàn)應(yīng)用落地。百度智能云還與區(qū)塊鏈平臺融合,通過將區(qū)塊鏈技術(shù)納入云計算與隱私計算的過程,推動隱私計算在各種場景中落地。百度大腦旗下的大數(shù)據(jù)服務(wù)平臺百度點石,基于聯(lián)邦學(xué)習(xí)、多方安全計算、可信執(zhí)行環(huán)境等主流隱私計算技術(shù),安全高效實現(xiàn)數(shù)據(jù)賦能,助力客戶提升數(shù)據(jù)價值。百度點石安全計算平臺(MesaTEE)是百度安全在隱私計算面向企業(yè)落地的重要平臺。基于百度飛槳開發(fā)的開源聯(lián)邦學(xué)習(xí)框架 PaddleFL,讓企業(yè)之間的合作能夠在數(shù)據(jù)層面安全開展。PaddleFL 提供多種聯(lián)邦學(xué)習(xí)策略及其在計算機(jī)視覺、自然語言處理、推薦算法等領(lǐng)域的應(yīng)用。字節(jié)跳動在隱私計算領(lǐng)域布局較為集中,最主要的產(chǎn)品是 Fedlearner 聯(lián)邦學(xué)習(xí)平臺。該項目于 2019 年啟動,最初是針對單個企業(yè)進(jìn)行定制化適配,基于神經(jīng)網(wǎng)絡(luò)縱向聯(lián)邦學(xué)習(xí)技術(shù),幫助企業(yè)提高廣告投放效率,后續(xù)通過迭代,逐步在電商、互聯(lián)網(wǎng)金融和教育領(lǐng)域落地。2020 年,F(xiàn)edlearner 開源,支持多類聯(lián)邦學(xué)習(xí)模式,整個系統(tǒng)包括控制臺、訓(xùn)練器、數(shù)據(jù)處理、數(shù)據(jù)存儲等模塊,各模塊對稱部署在參與聯(lián)邦的雙方集群上,透過代理互相通信實現(xiàn)訓(xùn)練。字節(jié)跳動作為隱私計算聯(lián)盟(CCC)成員之一,也參與推動隱私計算市場的發(fā)展,影響技術(shù)和法規(guī)標(biāo)準(zhǔn),協(xié)助提高下一代互聯(lián)網(wǎng)的計算信任度和安全性。隨著數(shù)據(jù)安全合規(guī)流通成為必然,隱私計算作為當(dāng)下實現(xiàn)數(shù)據(jù)「可用不可見」的唯一技術(shù)解,對未來的科技產(chǎn)業(yè)以及實體經(jīng)濟(jì)的關(guān)鍵領(lǐng)域?qū)a(chǎn)生重要影響。除了典型的金融、醫(yī)療等場景,隱私計算也被探索用于越來越多的行業(yè)與領(lǐng)域。例如,電力公司通過隱私計算,可實現(xiàn)對電網(wǎng)數(shù)據(jù)的全生命周期進(jìn)行保護(hù),使得數(shù)據(jù)能夠安全上云,或外包給計算服務(wù)方進(jìn)行計算,實現(xiàn)電力企業(yè)的降本增效。廣告平臺使用隱私計算對用戶數(shù)據(jù)進(jìn)行加密,讓原始數(shù)據(jù)不可識別,從而在不揭示個人信息的前提下完成廣告定向和個性化推薦,運用聯(lián)邦學(xué)習(xí)等技術(shù),可以在不共享原始用戶數(shù)據(jù)的前提下多方共同訓(xùn)練一個機(jī)器學(xué)習(xí)模型,還能在用戶終端內(nèi)完成個性化推薦,確保推薦效果的同時最大限度保護(hù)用戶隱私。未來,創(chuàng)新的隱私保護(hù)方案,包括用于移動設(shè)備的可信執(zhí)行環(huán)境,能在移動個性化推薦服務(wù)中實現(xiàn)令人滿意的用戶體驗并保護(hù)用戶隱私,真正實現(xiàn)雙贏。出行領(lǐng)域,隱私計算使運營商與服務(wù)提供商可在加密狀態(tài)下使用線上數(shù)據(jù),對城市交通狀況與出行需求進(jìn)行分析與預(yù)測,為交通調(diào)度與新業(yè)務(wù)創(chuàng)新提供基礎(chǔ),同時保護(hù)用戶隱私和數(shù)據(jù)安全。我們已經(jīng)看到,充分釋放數(shù)據(jù)的價值能夠推動革命性的創(chuàng)新,試想一個個比 ChatGPT 更加智能的產(chǎn)品進(jìn)入生活,了解我們的興趣與習(xí)慣,提供定制化服務(wù),讓工作和生活變得前所未有的便利與個性化。在這一過程中,隱私計算將作為新技術(shù)應(yīng)用中不可或缺的一部分,讓數(shù)據(jù)在創(chuàng)造價值的同時保持安全可控,守護(hù)人們對隱私保護(hù)的合理預(yù)期。Gartner《2022 年新興技術(shù)成熟度曲線》
中國信息通信研究院《隱私計算白皮書(2022年)》
《網(wǎng)絡(luò)安全技術(shù)和產(chǎn)業(yè)動態(tài)》2022年第10期,總第28期
CB Insights China《2022年中國隱私計算技術(shù)與市場發(fā)展研究報告》
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。