前段時間,一個搞信息化的朋友找到我,說今年老板安排要上數(shù)倉和BI的項目,但他自己對兩者之間的配合細節(jié)還沒想的很清楚,想讓我給他展開講講。所以今天想借朋友的這個問題,來跟大家聊聊BI與數(shù)據(jù)倉庫之間的關(guān)系。01
企業(yè)是如何處理數(shù)據(jù)的?BI和數(shù)倉在這中間各自起什么作用
開始前,咱們先通過一個做菜的例子,來簡單了解企業(yè)是如何處理數(shù)據(jù)的,并從中正確理解BI與數(shù)倉的作用與關(guān)系。大家都去過餐館吃飯,你知道吃到的菜肯定不是廚師從菜市場買回來,就直接上給你吃。菜很臟,需要加工處理。那,廚師是怎么做出可口的菜品?就像企業(yè)數(shù)據(jù)是如何從業(yè)務(wù)系統(tǒng)的雜亂數(shù)據(jù)到最終整潔易懂的可視化報表數(shù)據(jù)?第一步:根據(jù)要做的菜品去不同的菜市場采購食材 VS 根據(jù)數(shù)據(jù)需求去不同的業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫取數(shù)
例如我要做西紅柿炒蛋,我要先去A菜市場買雞蛋,再去B市場買西紅柿,有點“東市買駿馬,西市買鞍韉”的意思在,因為我要的東西只有這兩個地方能給到我。這就像數(shù)據(jù),有的數(shù)據(jù)只能在A業(yè)務(wù)數(shù)據(jù)庫里取,有的只能在B業(yè)務(wù)數(shù)據(jù)庫里取,數(shù)據(jù)來源是不一樣的。在這里,我們可以認為菜市場=業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫,食材=數(shù)據(jù)。第二步:把買回來的食材集中起來,放在廚房里完成備菜 VS 通過ETL取數(shù)到數(shù)據(jù)倉庫中做清洗轉(zhuǎn)換工作在這個廚房中,廚師要完成備菜,為后續(xù)的炒菜做好食材準備,而這個廚房,就是數(shù)據(jù)倉庫:把數(shù)據(jù)(食材)從不同的業(yè)務(wù)數(shù)據(jù)庫中取過來集中處理,其中備菜過程就是數(shù)據(jù)的ETL過程,對數(shù)據(jù)做清洗轉(zhuǎn)換,將其轉(zhuǎn)變成可以被展現(xiàn)分析的數(shù)據(jù)。此處,廚房=數(shù)據(jù)倉庫,備菜=ETL過程。第三步:將備好的菜放入鍋中,制作出可口的菜品 VS 利用BI前端工具,制作出易于理解的可視化報表我們備完菜后,就需要開始炒菜,要用到炒菜工具,這時BI前端工具就是炒菜用到的工具,把備好的菜拿出來,相當于選擇合適的數(shù)據(jù)來做可視化分析,最終的可視化報表就是餐廳里可口的菜品。每個人都要吃不同的菜,那就要到不同的數(shù)據(jù)庫里去找不同的數(shù)據(jù),這就是臨時報表需求。到此,我們用一張圖來回顧上面三步,左右對應(yīng)來理解做菜&企業(yè)數(shù)據(jù)處理間的巧妙對照關(guān)系:再看上圖右邊,不難看出BI與數(shù)據(jù)倉庫之間的關(guān)系為:BI將來自不同業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)進行提取,取出有分析價值的數(shù)據(jù)做清洗、轉(zhuǎn)換和加載(ETL過程),再合并到數(shù)據(jù)倉庫中進行建模,最終在這個基礎(chǔ)上形成可視化分析報表,從而為企業(yè)的管理決策層提供數(shù)據(jù)決策支撐。也就是說,雖然最終領(lǐng)導只看到了他們想要的分析報表,但這一套系統(tǒng)是需要數(shù)據(jù)倉庫和ETL在背后做數(shù)據(jù)支撐。到此,我們能得出初步結(jié)論:數(shù)據(jù)倉庫理論上是BI運行的基礎(chǔ),BI需依賴數(shù)據(jù)倉庫去做數(shù)據(jù)分析。02
再思考:國內(nèi)數(shù)倉建設(shè)高成本現(xiàn)狀下,先數(shù)倉后BI還是唯一出路嗎?
讀到這你肯定會想問,既然都得出這個結(jié)論了,你標題還取“BI的建設(shè)是否一定離不開數(shù)據(jù)倉庫”干嗎?這不是明擺著一定離不開嗎。誒,話先別說早,在上方我們確實得出初步結(jié)論:數(shù)據(jù)倉庫理論上是BI運行的基礎(chǔ),BI需依賴數(shù)據(jù)倉庫做數(shù)據(jù)分析。但回歸現(xiàn)實,從帆軟對國內(nèi)近萬家企業(yè)的數(shù)據(jù)基礎(chǔ)調(diào)研結(jié)果來看,會發(fā)現(xiàn)理論再美好,現(xiàn)實還是給了企業(yè)當頭一棒。站在企業(yè)角度出發(fā),數(shù)據(jù)倉庫從規(guī)劃到落地通常需要花費高昂的經(jīng)濟成本和時間成本,但其創(chuàng)造的價值較難提前量化。所以許多有BI需求的企業(yè)會找到帆軟表示,他們在數(shù)倉巨大的投入成本以及未知的投入產(chǎn)出比的風險面前,沒法下定決心去建數(shù)倉,也導致其不敢上BI來滿足自身的數(shù)據(jù)需求。因此,當客戶帶著這個“先后難題”來找到我們時,也倒逼著我們不斷去思考:在國內(nèi)數(shù)倉建設(shè)高成本現(xiàn)狀下,先數(shù)倉后BI還是唯一出路嗎?帆軟是否能給這些企業(yè)其他的解決方法?數(shù)倉是BI的數(shù)據(jù)來源,因此先數(shù)倉后BI仍是唯一出路。但企業(yè)可根據(jù)自身數(shù)據(jù)情況建設(shè)適合自己的數(shù)倉,并非要建設(shè)完“完整數(shù)倉”,才能上BI。1、企業(yè)BI建設(shè)建立在完整的數(shù)據(jù)倉庫基礎(chǔ)上為最佳。BI可直接連接數(shù)據(jù)倉庫梳理好的DWS層,將其作為公共數(shù)據(jù)集,即可以讓業(yè)務(wù)同事基于相對規(guī)范的公共數(shù)據(jù),無需代碼,自己可通過拖拉拽的方式進行自助數(shù)據(jù)分析/簡單報表的制作,從而通過數(shù)據(jù)去發(fā)現(xiàn)問題,解決問題。2、若企業(yè)并未建有完整數(shù)倉,帆軟建議這些想上BI、但無數(shù)倉基礎(chǔ)的公司,可借助帆軟幫其快速建設(shè)輕量級的數(shù)倉,分階段完成BI與數(shù)倉的建設(shè)。具體來說,即在企業(yè)數(shù)倉尚未搭建或分析思路尚未成型時,可先在帆軟BI平臺內(nèi)抽取業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫表,做輕量級的數(shù)據(jù)處理當中間數(shù)據(jù)庫,快速構(gòu)建當下企業(yè)里最緊急且重要的分析需求應(yīng)用。在分析結(jié)果得到業(yè)務(wù)部門的初步認可驗證后,再拉通各部門認知,統(tǒng)一數(shù)據(jù)維度事實。最后將數(shù)據(jù)和復雜分析邏輯逐步沉淀固化到數(shù)據(jù)倉庫/BI平臺內(nèi),分層建模開發(fā)項目。03
終總結(jié):BI與數(shù)據(jù)倉庫的關(guān)系,BI的建設(shè)一定離不開數(shù)據(jù)倉庫嗎?
BI與數(shù)據(jù)倉庫的關(guān)系:
BI將來自不同業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)進行提取,取出有分析價值的數(shù)據(jù)進行清洗、轉(zhuǎn)換和加載(ETL過程),再合并到數(shù)據(jù)倉庫中建模,最終在這個基礎(chǔ)上形成可視化分析報表,從而為企業(yè)的管理決策層提供數(shù)據(jù)決策支撐。BI的建設(shè)一定離不開數(shù)據(jù)倉庫嗎:
一個長遠優(yōu)秀的BI項目建設(shè)一定離不開數(shù)據(jù)倉庫,但企業(yè)可根據(jù)自己的實際數(shù)據(jù)及預算情況來綜合考慮。在完善的數(shù)倉基礎(chǔ)上建設(shè)BI是錦上添花,但如果沒有數(shù)倉,也可通過“倒推”的方式,從前端最緊急的數(shù)據(jù)報表需求/自助分析數(shù)據(jù)需求來倒推中間數(shù)據(jù)庫的建設(shè),等到后續(xù)企業(yè)數(shù)據(jù)及業(yè)務(wù)體系化上來,再將數(shù)據(jù)量擴容,搭建標準化數(shù)倉。這種“MVP”方法,能最大程度上確保企業(yè)分析決策的建設(shè)方向正確,實現(xiàn)真正有利于公司的商業(yè)價值,將試錯成本最小化。
在本文,主要講明了BI與數(shù)據(jù)倉庫之間的關(guān)系。而目前,帆軟已在BI商業(yè)智能領(lǐng)域深耕了17年,在國內(nèi)BI市場占有率連續(xù)五年第一。在為用戶提供真正有價值的數(shù)據(jù)服務(wù)路上,我們一直保持初心,踏踏實實打磨數(shù)據(jù)產(chǎn)品,虛心也希望多接收大家的疑問和建議,因此如果想了解更多BI項目建設(shè),可點擊下方鏈接,獲取更多BI與數(shù)倉建設(shè)相關(guān)資料。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。