大多數(shù)數(shù)據(jù)將會(huì)存儲(chǔ)于大型遺留或打包的系統(tǒng)中,數(shù)據(jù)結(jié)構(gòu)的細(xì)節(jié)對(duì)于這些系統(tǒng)來說可能是不可見的。其他數(shù)據(jù)將存儲(chǔ)于電子表格和個(gè)人數(shù)據(jù)庫(kù)(例如 Microsoft Access)中,且可能對(duì)于 IT 部門或高級(jí)業(yè)務(wù)數(shù)據(jù)管理員來說是不可見的。一些關(guān)鍵數(shù)據(jù)可能存儲(chǔ)于由服務(wù)供應(yīng)商或業(yè)務(wù)合作伙伴維系的外部系統(tǒng)中。隨著您對(duì)復(fù)雜數(shù)據(jù)架構(gòu)的探究,就會(huì)逐漸接受兩個(gè)現(xiàn)實(shí):
您很少能夠控制高級(jí)業(yè)務(wù)數(shù)據(jù)概念實(shí)現(xiàn)的方式。數(shù)據(jù)很可能是高度分散的,并且常常在質(zhì)量方面缺乏足夠的控制。
大部分?jǐn)?shù)據(jù)在大量系統(tǒng)中進(jìn)行復(fù)制,并且在質(zhì)量、格式及含義上出現(xiàn)重大變更。
一些由企業(yè)應(yīng)用程序集成(Enterprise Application Integration,EAI)技術(shù)或精心的業(yè)務(wù)流程進(jìn)行維護(hù)的副本,也許是好的(但很可能不完善)。而大部分?jǐn)?shù)據(jù)的處理是很不好的,僅僅由臨時(shí)的批量傳輸或迫于壓力和不流暢的人工流程來維護(hù)。組織及業(yè)務(wù)流程的沖突或信任上的失敗可能會(huì)阻礙對(duì)數(shù)據(jù)處理見解的進(jìn)步。這些條件有幾個(gè)重要的結(jié)果。例如,當(dāng)計(jì)劃,如客戶關(guān)系管理(Customer Relationship Management,CRM)和商業(yè)智能(Business Intelligence)需要通過各種各樣的來源來合并數(shù)據(jù)時(shí),不夠良好的副本也許會(huì)使得業(yè)務(wù)或技術(shù)問題惡化。一些組織在端到端流程中利用各種遺留系統(tǒng)。業(yè)務(wù)或 IT 都可能會(huì)進(jìn)行改變以簡(jiǎn)化業(yè)務(wù)流程,流水化數(shù)據(jù)流并減少?gòu)?fù)制。盡管建模為解決這些難題帶來了好處,但是傳統(tǒng)的建模方法不能解決這些難題。它們會(huì)建立要么過于詳細(xì)以至于無法使用的模型,要么建立不夠詳細(xì)的模型,并且他們沒有著重于企業(yè)數(shù)據(jù)架構(gòu)和各種組件整合的難題。我們相信用企業(yè)級(jí)的觀點(diǎn)來創(chuàng)建強(qiáng)有力的、簡(jiǎn)單并有效的數(shù)據(jù)結(jié)構(gòu)模型是很重要的 —— 一組被稱為“企業(yè)數(shù)據(jù)架構(gòu)”的模型。
企業(yè)數(shù)據(jù)架構(gòu)模型 —— 支持各種公共的 IT 和業(yè)務(wù)改進(jìn)計(jì)劃
數(shù)據(jù)架構(gòu)不是一組單個(gè)系統(tǒng)的詳細(xì)模型,因 為它們不能傳送用來滿足以上需求的所需要的“大圖片”信息。而且它不僅僅是業(yè)務(wù)流程和系統(tǒng)范圍的頂級(jí)模型,因?yàn)樗鼈儧]有包含足夠的細(xì)節(jié)以回答實(shí)際的問題。
數(shù)據(jù)架構(gòu)圖
數(shù)據(jù)架構(gòu)圖描述了“什么”組成了數(shù)據(jù)架構(gòu)。支持它的數(shù)據(jù)策略和計(jì)劃闡述了“為什么”。單個(gè)的模型說明數(shù)據(jù)是什么、在哪里,以及什么時(shí)候由誰如何改變。
哪些模型構(gòu)成了數(shù)據(jù)架構(gòu)
數(shù)據(jù)架構(gòu)主要由下面部分介紹的四級(jí)模型定義。通常,只有在業(yè)務(wù)流程發(fā)生重大變更時(shí),高級(jí)數(shù)據(jù)模型才會(huì)變更,但其他的模型將存在于各種各樣的版本中,代表“目前”的結(jié)構(gòu)和一個(gè)或多個(gè)“將來”的進(jìn)展。
高級(jí)數(shù)據(jù)模型
頂層是一組高級(jí)數(shù)據(jù)模型,用概念性觀點(diǎn)描述業(yè)務(wù)數(shù)據(jù),獨(dú)立于任何當(dāng)前實(shí)際系統(tǒng)的實(shí)現(xiàn)。每個(gè)高級(jí)數(shù)據(jù)模型(high-level data model,HLDM)包含:
主要數(shù)據(jù)項(xiàng)(業(yè)務(wù)實(shí)體)及其關(guān)系的通用(規(guī)范的)UML 類模型。
業(yè)務(wù)屬性的超集,包含對(duì)這些屬性含義(語(yǔ)義)、標(biāo)準(zhǔn)化格式(語(yǔ)法)和普遍制約的描述。
因?yàn)檫@些是數(shù)據(jù)模型,所以它們不會(huì)包含類方法,如果業(yè)務(wù)對(duì)象有責(zé)任管理其他結(jié)構(gòu)的話,對(duì)這些方法進(jìn)行概括是適合的。
模型應(yīng)包含所有具有業(yè)務(wù)意義的屬性和定義數(shù)據(jù)結(jié)構(gòu)的內(nèi)容(例如,控制多樣性業(yè)務(wù)規(guī)則的輸入)。
改進(jìn)數(shù)據(jù)架構(gòu):數(shù)據(jù)策略
將“目前”的數(shù)據(jù)架構(gòu)進(jìn)行建模非常有用,它能夠很確定地顯示出哪里不是最佳的。然而,如果您想要進(jìn)行提高,就需要有比好的模型多得多的東西。圍繞改進(jìn)數(shù)據(jù)集合、使用和管理的大部分問題是非技術(shù)性的。IT 部門,及業(yè)務(wù)經(jīng)理們,需要開發(fā)以下內(nèi)容:
設(shè)定企業(yè)如何收集、管理并使用數(shù)據(jù)的原則。
包含“目前”的和“將來”的模型的數(shù)據(jù)架構(gòu)。
數(shù)據(jù)架構(gòu)的管理規(guī)則和變更控制流程,由 IT 和適當(dāng)?shù)臉I(yè)務(wù)代表共同管理。
在每個(gè)業(yè)務(wù)領(lǐng)域內(nèi)的數(shù)據(jù)管理規(guī)則:
存儲(chǔ)什么數(shù)據(jù)。
誰負(fù)責(zé)數(shù)據(jù)的收集和質(zhì)量。
誰控制,誰管理
存儲(chǔ)多久,將來如何安排或歸檔。
誰可以使用,及如何向常規(guī)用戶組之外的用戶公開。
關(guān)于信息和相關(guān)風(fēng)險(xiǎn)分類的方案,以確保定義恰當(dāng)?shù)陌踩椒ā?/span>
您還需要幫助改進(jìn)并編制業(yè)務(wù)流程以改進(jìn)數(shù)據(jù)管理。
數(shù)據(jù)策略需要建立在清晰的意見一致的原則之上,例如以下部分:
不論在哪里,數(shù)據(jù)的輸入必須簡(jiǎn)單且數(shù)據(jù)能準(zhǔn)確地反應(yīng)情況,還要以一種對(duì)輸入輸出有效的且可用的格式。
如果數(shù)據(jù)具有已知且編制了的用途和值,就應(yīng)收集。
那些對(duì)數(shù)據(jù)有合法業(yè)務(wù)需要的數(shù)據(jù)應(yīng)該是易用的。
數(shù)據(jù)獲取、驗(yàn)證和處理的流程不論在哪都應(yīng)是自動(dòng)的。數(shù)據(jù)只應(yīng)輸入一次。
在整個(gè)企業(yè)范圍內(nèi),更新所給數(shù)據(jù)項(xiàng)的流程應(yīng)是標(biāo)準(zhǔn)的。
應(yīng)盡可能準(zhǔn)確完整地記錄數(shù)據(jù),利用最廣博的來源,使其與原始內(nèi)容盡可能接近,在最初的時(shí)候?qū)⑵渥兂呻娮痈袷?,并采取可檢查可跟蹤的方式。
數(shù)據(jù)收集和共享的費(fèi)用應(yīng)最小。
企業(yè),而不是任何個(gè)人或業(yè)務(wù)單元,擁有所有數(shù)據(jù)。
每個(gè)數(shù)據(jù)源必須有確定的管理人(業(yè)務(wù)角色)負(fù)責(zé)數(shù)據(jù)的精確性、完全性和安全性。
防止對(duì)數(shù)據(jù)進(jìn)行未授權(quán)的訪問和更改。
除非有實(shí)際的原因需要進(jìn)行復(fù)制,否則不能夠?qū)?shù)據(jù)進(jìn)行復(fù)制。在此情況下,一個(gè)源必須明確地作為原版,要有健壯的流程確保每一步的副本,并且不能修改副本。
數(shù)據(jù)結(jié)構(gòu)必須在嚴(yán)格的變更控制下,以便于可以適當(dāng)?shù)毓芾砀鞣N業(yè)務(wù)和系統(tǒng)牽連的變更。無論什么時(shí)候,對(duì)公共數(shù)據(jù)模型采用國(guó)際、國(guó)家或行業(yè)標(biāo)準(zhǔn)。在不可能采用時(shí),開發(fā)組織的標(biāo)準(zhǔn)來替代。對(duì)企業(yè)數(shù)據(jù)架構(gòu)的文檔化的理解是許多公共 IS 和業(yè)務(wù)改進(jìn)計(jì)劃的必要先決條件。適當(dāng)?shù)哪P团c詳細(xì)的系統(tǒng)模型和高級(jí)業(yè)務(wù)模型截然不同。本文概述了一組有助于滿足這些需求的 UML 模型和技術(shù)。
歡迎分享與同行轉(zhuǎn)載,但請(qǐng)務(wù)必注明作者及出處,尊重作者及小編勞動(dòng)成果,這是作為信息化從業(yè)者最基本的職業(yè)素養(yǎng)之一,謝謝!
聯(lián)系客服