數(shù)據(jù)作為驅(qū)動本輪人工智能浪潮全面興起的三大基礎(chǔ)要素之一數(shù)據(jù)安全風(fēng)險已成為影響人工智能安全發(fā)展的關(guān)鍵因素。與此同時,人工智能應(yīng)用也給數(shù)據(jù)安全帶來嚴(yán)峻挑戰(zhàn)如何應(yīng)對人工智能場景下的數(shù)據(jù)安全風(fēng)險日漸成為國際人工智能治理的重要議題。本文摘選《人工智能數(shù)據(jù)安全白皮書》中精華部分,供大家交流。
圖1 人工智能安全體系架構(gòu)圖
圖 2 人工智能數(shù)據(jù)安全體系架構(gòu)圖
圖 3 人工智能在數(shù)據(jù)安全治理中的應(yīng)用
數(shù)據(jù)安全策略制定
1
數(shù)據(jù)資產(chǎn)安全管理
在數(shù)據(jù)分級分類方面,可以通過應(yīng)用機(jī)器學(xué)習(xí)、模式聚類、自然語言處理、語義分析、圖像識別等技術(shù),提取數(shù)據(jù)文件核心信息,對數(shù)據(jù)按照內(nèi)容進(jìn)行梳理,生成標(biāo)注樣本,經(jīng)過反復(fù)的樣本訓(xùn)練與模型修正,可以實現(xiàn)對數(shù)據(jù)自動、精準(zhǔn)的分級分類。
數(shù)據(jù)質(zhì)量管理方面,在開展數(shù)據(jù)質(zhì)量核查過程中,人工智能技術(shù)與傳統(tǒng)根據(jù)預(yù)置規(guī)則進(jìn)行核查的方式相結(jié)合,可以僅針對少量核心核查規(guī)則,利用機(jī)器學(xué)習(xí)算法進(jìn)行深度分析,定位數(shù)據(jù)質(zhì)量原因、預(yù)測數(shù)據(jù)質(zhì)量問題,形成知識庫,進(jìn)一步增強(qiáng)數(shù)據(jù)質(zhì)量管理能力。
2
數(shù)據(jù)活動安全保護(hù)
數(shù)據(jù)本體安全保護(hù)方面,包括數(shù)據(jù)脫敏、數(shù)據(jù)防泄漏、數(shù)據(jù)加密等。
數(shù)據(jù)脫敏方面,在數(shù)據(jù)分級分類的基礎(chǔ)上,結(jié)合數(shù)據(jù)合規(guī)性規(guī)則智能生成脫敏特征庫,并與敏感數(shù)據(jù)識別智能關(guān)聯(lián),實現(xiàn)智能發(fā)現(xiàn)和自動脫敏,有效降低敏感數(shù)據(jù)泄露風(fēng)險。
數(shù)據(jù)活動網(wǎng)絡(luò)安全保護(hù)方面,基于人工智能的網(wǎng)絡(luò)安全防護(hù)手段相比傳統(tǒng)基于靜態(tài)規(guī)則的方法具有持續(xù)進(jìn)化能力。
新威脅的產(chǎn)生不斷為訓(xùn)練集加入新的數(shù)據(jù),通過人工智能算法和模型調(diào)優(yōu),可以快速查閱每個可疑文件數(shù)以百萬計的特征,智能識別最輕微的代碼沖突;
對內(nèi)外部網(wǎng)絡(luò)流量中的元數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,實時檢測異常流量;
利用龐大的關(guān)聯(lián)處理能力并行監(jiān)測海量數(shù)據(jù)點,實時生成風(fēng)險預(yù)測,發(fā)現(xiàn)并阻止設(shè)備或網(wǎng)絡(luò)攻擊。
數(shù)據(jù)流轉(zhuǎn)行為分析,通過自然語言處理、機(jī)器學(xué)習(xí)、聚類算法對采集的基礎(chǔ)數(shù)據(jù)進(jìn)行行為建模,多維度勾勒出用戶行為特征,形成用戶畫像知識圖譜,實現(xiàn)智能化用戶行為分析。
同樣,通過人工智能技術(shù)也可以對數(shù)據(jù)傳輸行為進(jìn)行智能統(tǒng)計和關(guān)聯(lián)分析,繪制數(shù)據(jù)流轉(zhuǎn)動態(tài)圖譜,有利于跟蹤敏感數(shù)據(jù)走向,分析數(shù)據(jù)安全態(tài)勢。
數(shù)據(jù)安全風(fēng)險評估,經(jīng)過訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)算法能夠解決具有相似特點的風(fēng)險評估問題,通過對風(fēng)險因素的學(xué)習(xí),可以自動實現(xiàn)從輸入到輸出的復(fù)雜映射關(guān)系,對優(yōu)劣性受多種因素綜合影響的事物作出合理的綜合評價,從而減少傳統(tǒng)專家評估過程中主觀分?jǐn)?shù)的片面性影響。
3
數(shù)據(jù)安全事件管理
4
聯(lián)系客服