數(shù)據(jù)工匠俱樂部 發(fā)展數(shù)據(jù)治理行業(yè),普及數(shù)據(jù)治理知識,構建數(shù)據(jù)治理體系,改變企業(yè)數(shù)據(jù)管理現(xiàn)狀,提高企業(yè)數(shù)據(jù)質量,推動企業(yè)走進大數(shù)據(jù)時代。
195篇原創(chuàng)內容
公眾號
作者:尼爾·菲什曼(Neal Fishman)、科爾·斯特萊克(Cole Stryker)來源:大數(shù)據(jù)DT(ID:hzdashuju)人工智能的準備過程大部分是組織變革。人工智能的運用可能需要創(chuàng)造一個新的勞動力類別:新領工人(New-collar Worker)。新領工作可以涵蓋網(wǎng)絡安全、云計算、數(shù)字設計和認知商業(yè)(Cognitive Business)等工作。在世界范圍內,大多數(shù)組織都認同人工智能可以幫助其保持競爭力,但是許多組織通常仍使用不算先進的分析形式。對于那些使用人工智能經(jīng)歷失敗或者未能達到最佳效果的組織而言,自然的方法似乎是消除而非增加嚴謹性。從人工智能階梯的角度來看,梯級會匆忙掠過,甚至完全跳過。當組織開始意識到并認可這種范式的時候,他們必須重新審視分析的基礎,以便為其達到理想的未來狀態(tài)和獲得從人工智能獲益的能力做好準備。他們不一定要從零開始,但他們需要評估自己的能力,以確定可以從哪個梯級開始。他們需要的許多技術部件可能已經(jīng)到位。如圖1-1所示,組織可訪問的分析復雜程度隨著梯級而增加。這種復雜性可以帶來蓬勃發(fā)展的數(shù)據(jù)管理實踐,這得益于機器學習和人工智能的發(fā)展。在某些時候,擁有海量數(shù)據(jù)的組織將需要探索多云部署(Multicloud Deployment)。在攀登人工智能階梯的時候,他們需要考慮以下三個基于技術的領域:- 以機器學習為核心的混合數(shù)據(jù)管理。
- 在安全的用戶配置文件中提供安全性和無縫用戶訪問的治理和集成。
- 同時為高級分析和傳統(tǒng)分析提供自助服務和全服務用戶環(huán)境的數(shù)據(jù)科學和人工智能。
這些基礎技術必須包含現(xiàn)代云計算和微服務基礎設施,以便為組織創(chuàng)造敏捷而快速地前進和向上發(fā)展的途徑。這些技術必須在各梯級上實現(xiàn),從而使數(shù)據(jù)移動成為可能,并從單一環(huán)境到多云環(huán)境的各類部署的機器學習模型中獲得預測能力。如圖1-1所示,人工智能階梯的梯級分別標記為“收集”“組織”“分析”和“注入”。每個梯級都提供了信息架構所需的要素。▲圖1-1 實現(xiàn)完整數(shù)據(jù)和分析的人工智能階梯第一梯級收集,代表了用于建立基礎數(shù)據(jù)技能的一系列規(guī)程。理想情況下,無論數(shù)據(jù)的形式和駐留位置如何,都應簡化數(shù)據(jù)的訪問,并使其具有可用性。由于用于高級分析和人工智能的數(shù)據(jù)是動態(tài)的且具有流動性,因此并非所有數(shù)據(jù)都可以在物理數(shù)據(jù)中心進行管理。隨著數(shù)據(jù)源數(shù)量的不斷增加,虛擬化數(shù)據(jù)的收集方式是信息架構中需要考慮的關鍵活動之一。- 使用通用SQL引擎收集數(shù)據(jù),使用API進行NoSQL訪問,以及支持廣泛的數(shù)據(jù)生態(tài)系統(tǒng)(數(shù)據(jù)產業(yè))中的數(shù)據(jù)虛擬化。
- 部署始終保持彈性和可擴展性的數(shù)據(jù)倉庫、數(shù)據(jù)湖和其他基于分析的存儲庫。
- 同時兼顧實時數(shù)據(jù)攝入和高級分析。
- 存儲或提取結構化、半結構化、非結構化等所有類型的業(yè)務數(shù)據(jù)。
- 使用可能包含圖形數(shù)據(jù)庫、Python、機器學習SQL和基于置信度查詢的人工智能優(yōu)化集合。
- 挖掘可能包含MongoDB、Cloudera、PostgreSQL、Cloudant或者Parquet等技術的開源數(shù)據(jù)存儲。
組織梯級意味著需要創(chuàng)建一個可信數(shù)據(jù)基礎。可信數(shù)據(jù)基礎必須至少對組織可知內容進行歸類。所有形式的分析都高度依賴數(shù)字化資產。數(shù)字化資產構成了組織可以合理了解的基礎:業(yè)務語料庫是組織論域的基礎,即通過數(shù)字化資產可獲知的信息總量。擁有可用于分析的業(yè)務就緒的數(shù)據(jù)是用于人工智能的業(yè)務就緒的數(shù)據(jù)的基礎,但是僅僅具有訪問數(shù)據(jù)的權限并不意味著該數(shù)據(jù)已為人工智能用例做好了準備。不良數(shù)據(jù)可能導致人工智能癱瘓,并誤導使用人工智能模型輸出結果的任何進程。為了進行組織,組織必須制定規(guī)程來集成、清洗、策管、保護、編目和管理其數(shù)據(jù)的整個生命周期。- 清洗、集成、編目不同來源的所有類型數(shù)據(jù)。
- 支持并提供自助服務分析的自動化虛擬數(shù)據(jù)管道。
- 即使在跨越多云的情況下,也能確保數(shù)據(jù)治理和數(shù)據(jù)沿襲。
- 部署可提供個性化服務的基于角色體驗的自助服務數(shù)據(jù)湖。
- 通過從多個云數(shù)據(jù)存儲庫中梳理業(yè)務就緒視角,獲得360度全方位視角。
- 簡化數(shù)據(jù)隱私、數(shù)據(jù)策略和合規(guī)性控制。
分析梯級包含了基本的業(yè)務和計劃分析能力,這些能力是人工智能持續(xù)取得成功的關鍵。分析梯級進一步將構建、部署和管理人工智能模型所需能力封裝在一個集成組織技術的產品組合之中。- 準備用于人工智能模型的數(shù)據(jù),在統(tǒng)一體驗中構建、運行和管理人工智能模型。
- 通過自動生成人工智能來構建人工智能模型,從而降低所需技能水平。
- 應用預測性、規(guī)范性和統(tǒng)計性分析。
- 允許用戶選擇自己的開源框架來開發(fā)人工智能模型。
- 檢查偏差,確保線性決策解釋并堅持合規(guī)性。
注入是一門涉及將人工智能集成到有意義的業(yè)務功能之中的規(guī)程。盡管許多組織能夠創(chuàng)建有用的人工智能模型,但它們很快會被迫應對實現(xiàn)持續(xù)的、可行的業(yè)務價值的運營挑戰(zhàn)。人工智能階梯中的“注入”梯級突出了在模型推薦的決策中獲得信任和透明度、解釋決策、避免偏見或確保公平的檢測,以及提供審計所需的足量數(shù)據(jù)線索所須掌握的規(guī)程。注入梯級旨在通過解決時間–價值連續(xù)統(tǒng)來實現(xiàn)人工智能用例的可操作性。- 通過預構建適用于諸如客戶服務和財務規(guī)劃等常見用例的人工智能應用程序,或定制適用于物流運輸?shù)葘iT用例的人工智能應用程序,縮短實現(xiàn)價值的時間。
- 利用人工智能輔助的商業(yè)智能和數(shù)據(jù)可視化。
- 使用符合行業(yè)需求的人工智能驅動框架進行定制。
- 通過使用人工智能支持新業(yè)務模型的創(chuàng)新。
一旦對每個梯級的掌握達到一定程度,即新的嘗試是重復以往的模式,而且這些新嘗試不被視為是定制或需要巨大努力的,組織就可以認真地朝著未來狀態(tài)采取行動。人工智能階梯的頂端是不斷實現(xiàn)現(xiàn)代化:從本質上根據(jù)其意愿重塑自己。現(xiàn)代化梯級只不過是已達到的未來狀態(tài)。但是一旦達到,此狀態(tài)便成為組織的當前狀態(tài)。達到階梯的頂端后,充滿活力的組織將開始新的階梯攀登。這個循環(huán)如圖1-2和圖1-3所示。▲圖1-2 人工智能階梯是不斷改進和適應的重復攀登的一部分▲圖1-3 當前狀態(tài)←未來狀態(tài)←當前狀態(tài)- 在任何私有或公有云中利用統(tǒng)一的選擇平臺。
- 將數(shù)據(jù)虛擬化作為收集任意來源數(shù)據(jù)的手段。
- 使用DataOps和MLOps為自助服務建立可信任的虛擬數(shù)據(jù)管道。
- 使用開放且易于擴展的統(tǒng)一數(shù)據(jù)和人工智能云服務。
現(xiàn)代化是指升級或更新的能力,或者更具體地說,包括利用重新構想的業(yè)務模式的變革性想法或創(chuàng)新所產生的新業(yè)務能力或產品。正在實現(xiàn)現(xiàn)代化的組織的基礎設施可能包括采用多云拓撲的彈性環(huán)境。鑒于人工智能的動態(tài)本質,組織的現(xiàn)代化意味著構建靈活的信息架構,以不斷展示相關性。在敏捷開發(fā)中,史詩(Epic)用于描述一個被認為因過于龐大而無法在單個迭代或單個沖刺(Sprint)中解決的用戶故事。因此,史詩被用來提供大藍圖。這個藍圖為需要完成的工作提供了一個端到端的視角。然后,史詩可以被分解為被處理的可行故事。史詩的作用是確保故事被適當?shù)鼐幣拧?/span>在人工智能階梯中,階梯就代表“大藍圖”,分解由梯級表示。這個階梯用于確保每個梯級的概念(收集、組織、分析、注入)都被正確地線程化,以確保獲取成功和實現(xiàn)價值的最佳機會。關于作者:尼爾·菲什曼(Neal Fishman)是IBM的杰出工程師-并且是IBM全球業(yè)務服務組織內基于數(shù)據(jù)的病理學的首席技術官。尼爾也是Open Group認證的杰出IT架構師。 科爾·斯特萊克(Cole Stryker)是一名常駐洛杉磯的作家和記者。他是Epic Win for Anonymous和Hacking the Future的作者。本文摘編自《企業(yè)級數(shù)據(jù)與AI項目成功之道》,本文摘編自《企業(yè)級數(shù)據(jù)與AI項目成功之道》,經(jīng)出版方授權發(fā)布。(ISBN:9787111684763)
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請
點擊舉報。