【IT168 評論】大數(shù)據(jù)中蘊(yùn)含的信息能夠幫助企業(yè)以更廣的視角來洞察數(shù)據(jù),提升企業(yè)的決策力。數(shù)據(jù)驅(qū)動(dòng)型的企業(yè)也如雨后春筍般冒出,但是數(shù)據(jù)驅(qū)動(dòng)型企業(yè)看似前景光明,其實(shí)面臨著很多挑戰(zhàn)。隨著數(shù)據(jù)類型的多樣化,數(shù)據(jù)驅(qū)動(dòng)型企業(yè)必須考慮很多新的數(shù)據(jù)源,比如移動(dòng)應(yīng)用程序、全球網(wǎng)站、物聯(lián)網(wǎng)的傳感器信息等等。這些新的數(shù)據(jù)源就要求技術(shù)人員要熟悉了解流數(shù)據(jù)平臺(tái)。
流數(shù)據(jù)平臺(tái)的集成、流數(shù)據(jù)的采集以及流媒體應(yīng)用的分析,有五個(gè)核心屬性是必不可少的。
低延遲:流數(shù)據(jù)平臺(tái)需要從流中獲得數(shù)據(jù),并匹配合適的數(shù)據(jù)源。流媒體數(shù)據(jù)平臺(tái)的關(guān)鍵之一就是要有和特定的商業(yè)模式或場景匹配的數(shù)據(jù)采集和近實(shí)時(shí)分析的能力。當(dāng)你需要等待數(shù)據(jù)落到數(shù)據(jù)倉庫或基于Hadoop的數(shù)據(jù)湖時(shí),那么流分析的實(shí)時(shí)性價(jià)值就會(huì)被降低。尤其是在一些基于位置的應(yīng)用或者是預(yù)測性維護(hù)的應(yīng)用程序中,一旦在數(shù)據(jù)創(chuàng)建或落地的過程中花費(fèi)太多的時(shí)間,那么就可能會(huì)對企業(yè)業(yè)務(wù)有很大的影響,比如錯(cuò)失重要客戶,甚至?xí)斐蓸O大的經(jīng)濟(jì)損失。
可擴(kuò)展性:流數(shù)據(jù)平臺(tái)不僅僅是連接兩個(gè)在企業(yè)防火墻后面的數(shù)據(jù)源,同時(shí)它還需要能夠匹配連接設(shè)備的增長速度以及物聯(lián)網(wǎng)的發(fā)展速度。這也就意味著流數(shù)據(jù)平臺(tái)需要獲得不同來源的大量數(shù)據(jù),這些數(shù)據(jù)包括來自內(nèi)部和外部以及第三方的數(shù)據(jù)。
多樣化:流數(shù)據(jù)平臺(tái)不僅僅要支持移動(dòng)設(shè)備、云端,物聯(lián)網(wǎng)等等這些“新時(shí)代”的數(shù)據(jù)源,也要支持關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫和ERP、CRM、SCM等業(yè)務(wù)應(yīng)用的“歷史遺留”的數(shù)據(jù)源。流數(shù)據(jù)平臺(tái)必須與流設(shè)備的信息相結(jié)合才能夠提高數(shù)據(jù)洞察的準(zhǔn)確性。
集中性:一個(gè)核心租戶的流數(shù)據(jù)平臺(tái)的架構(gòu)是很容易實(shí)現(xiàn)的。采用集中式架構(gòu)的流數(shù)據(jù)平臺(tái),不僅可以簡化流數(shù)據(jù)的來源和輸出之間的連接,而且可以提供統(tǒng)一的技術(shù)和業(yè)務(wù)元數(shù)據(jù)存儲(chǔ)庫,將數(shù)據(jù)轉(zhuǎn)換為通用的數(shù)據(jù)格式。
持久性:數(shù)據(jù)是否能夠成功落到數(shù)據(jù)倉庫或基于Hadoop的數(shù)據(jù)湖中,是考察流數(shù)據(jù)平臺(tái)的關(guān)鍵因素。這里指的不僅僅是流數(shù)據(jù)的采集和分析,還包括歷史數(shù)據(jù)的處理分析,包括基于模式的策略規(guī)則、基于流數(shù)據(jù)分析處理的聚類分析。
以上五個(gè)核心屬性是建立流數(shù)據(jù)平臺(tái)的基礎(chǔ),數(shù)據(jù)驅(qū)動(dòng)型企業(yè)要想有長足的發(fā)展,那么一個(gè)功能完整、架構(gòu)強(qiáng)大的流數(shù)據(jù)平臺(tái)是必不可少的。
原文出處:http://www.infoworld.com/article/3095450/big-data/five-core-attributes-of-a-streaming-data-platform.html
分享到:
0 個(gè)人覺得贊好文章 點(diǎn)個(gè)贊您已經(jīng)贊過了+1