Google的首席經(jīng)濟學家Hal Varian在2010年指出“在接下來的歲月里,最時髦的工作將是統(tǒng)計學家……領悟數(shù)據(jù)的能力——理解數(shù)據(jù)、處理數(shù)據(jù)、提煉價值、可視化數(shù)據(jù)、溝通數(shù)據(jù)——必將成為一種極其重要的技能”。大數(shù)據(jù)、數(shù)據(jù)可視化都已成了當下商業(yè)分析中的重要基礎概念。
近年來IT行業(yè)飛速發(fā)展,數(shù)據(jù)作為一種基本的概念已經(jīng)深入到社會生活的每一個角落!個體的經(jīng)濟活動和社會活動都已經(jīng)數(shù)據(jù)化了,消耗在各種數(shù)據(jù)接入設備的關注時間,成了互聯(lián)網(wǎng)企業(yè)爭相競逐的最重要的資源。
數(shù)據(jù)的存在本身就是數(shù)據(jù)的唯一價值!人類通常會將自身遇到的一切與基礎符號或符號系統(tǒng)進行關聯(lián),從而賦予這些數(shù)據(jù)以含義,從而成功地將數(shù)據(jù)變成了有意義的信息(INFORMATION),信息是人類適應/控制外部世界過程中交換的內(nèi)容,反映事物的形成、關系和差異。
信息集合之間明確的相互作用一旦被人類所感受和體驗,逐漸就成了確定性的知識(KNOWLEDGE),基于既往所發(fā)生的各種事實,利用內(nèi)插法和概率進行認知性和分析性的總結歸納,就形成了人的理解(UNDERSTANDING)過程。
數(shù)據(jù)、信息和知識舉例如下:
數(shù)據(jù):珠峰的高度8844.43米,坐標:27°59′17″ N 和86°55′31″ E 都是數(shù)據(jù)。
信息:描述珠峰地理特征的書籍,包括氣候等各種各樣數(shù)據(jù)的描述。
知識: 探討具體如何最好地登上珠峰的報告。比如攀登珠穆朗瑪峰必須遵守著名的“兩點鐘規(guī)則”:即攻頂一定要在下午2點前完成,不然就必須回頭。美國登山好手費雪(Scott Fischer),曾經(jīng)四次成功登上珠峰,但在第五次時過晚登頂,結果在下山時遇大風雪喪命。
智慧:使用知識,經(jīng)驗,理解、常識、洞察(對特定上下文中的明確因果關系的理解)進行思考和行動的能力。將智慧加諸于特定實體就是實體的智能——邏輯、理解、自知、學習、情緒表達、知識、計劃、創(chuàng)新和問題解決的能力。
本質(zhì)上智能就是對非確定性,非概率性的外延,它是基于知識之上的已經(jīng)評估過的理解,能夠用于處理尚未發(fā)生的不確定的情景,知道對于尚未發(fā)生的未來什么是最好的選擇!
泰倫提烏斯說過:真正的智慧不僅在于能明察眼前,而且還能預見未來!
商業(yè)智能(Business Intelligence)概念本身在1958年就已經(jīng)被IBM的Hans Peter 提出,但商業(yè)智能作為一種復合的技術和應用,直到1989年才被來自Garner 的Howard Dresner通俗化才廣為人知:即一類由數(shù)據(jù)倉庫,查詢報表,數(shù)據(jù)分析,數(shù)據(jù)挖掘,備份/恢復等部分組成、幫助企業(yè)決策為目的的技術和應用。總體上就是三大殺器:數(shù)據(jù)倉庫(Data Warehouse),聯(lián)機分析處理(OLAP)和數(shù)據(jù)挖掘(DATA MINING)!
90年代,數(shù)據(jù)倉庫已經(jīng)從探索階段走向了實用階段。W.H Inmon 在《Building the Data Warehouse》一書中對數(shù)據(jù)倉庫作出了明確定義:“數(shù)據(jù)倉庫是支持管理決策過程,面向主題,不斷變化的持久化數(shù)據(jù)集合”。
2004年開始到2007年,也許是商業(yè)智能行業(yè)史上最為激動人心的歲月。根據(jù)07年美國高盛公司的調(diào)查,70%的企業(yè)在IT采購中對商業(yè)智能工具或者應用具有采購計劃;人們認識到企業(yè)對商業(yè)智能的呼喚不僅僅是少數(shù)公司的行為,而是已經(jīng)從企業(yè)的“想要”逐漸變成了企業(yè)的“需要”。
商業(yè)智能行業(yè)一開始只是一個規(guī)模有限而且專業(yè)性很強的細分市場,以至于一開始SAP,ORACLE,IBM和Microsoft 這些巨頭都忙于自己的專業(yè)領域,未曾暇顧。目前的行業(yè)格局基本上奠定于2007年左右的大規(guī)模商業(yè)并購。
對比Gartner 2007年和2008年的商業(yè)智能平臺魔力象限,你會發(fā)現(xiàn)在商業(yè)智能領導廠商第一梯隊中,唯有SAS 始終如一,在這個領域猶如標桿般的存在,而其他4家都已經(jīng)城頭變幻大王旗:Oracle(Hyperion Solutions), SAP(Business Objects),IBM(Cognos)和 Microsoft(ProClarity),而第二梯隊則只剩下Information Builders,MicroStrategy 和QlikTech 三家公司。
截至到2013年,商業(yè)智能的那些傳統(tǒng)功能,比如參數(shù)化報表,聯(lián)機分析處理(OLAP)和即席查詢(Ad-Hoc Query)并沒有被廣大管理者和分析師所完全擁抱,主要是大部分人認為他們對許多分析用例而言太過難用。因此,商業(yè)智能和分析平臺市場從主要用于測量和報表BI系統(tǒng),加速轉(zhuǎn)型到那些支持分析,預報,預測和優(yōu)化的BI系統(tǒng)。
作為世界最為著名的IT調(diào)研機構,Gartner 每年都會根據(jù)IT領域的市場變化提供魔力象限和技術成熟度報告,從而影響企業(yè)的戰(zhàn)略投資。在2013年Gartner 的報告中,商業(yè)智能BI系統(tǒng)被定義為提供17個能力的軟件平臺,覆蓋分析,信息交付和集成三個方面。
2014年,確保對不同數(shù)據(jù)提供治理,規(guī)模和性能仍然主導BI市場的需求。越來越多的數(shù)據(jù)源(比如數(shù)據(jù)來自云端,實時事件和傳感器,多結構數(shù)據(jù)等)和新的分析類型(比如網(wǎng)絡分析,情感分析,機器學習新算法)引入使得分析變得額外復雜,然而這使得創(chuàng)造新的商業(yè)價值成為可能,行業(yè)競爭更加活躍。也有越來越多的企業(yè)自行開發(fā)貼合自身業(yè)務的分析功能,因此,2014年度Gartner的魔力象限顯得特別活躍,上榜者也居然達到27家之多,SAS依舊赫然在列,在數(shù)據(jù)分析方面始終如一。
2016年Gartner的BI和分析平臺報告發(fā)生了顯著的變化,因為它認為易于試用、購買和使用在BI和分析工具的評估中變得越來越重要,現(xiàn)代的BI和分析平臺應該能夠讓非技術用戶,也能自主地執(zhí)行全自動的分析工作流程,包括數(shù)據(jù)準備、交互式分析、并能夠?qū)Ψ治鲂纬傻亩床爝M行協(xié)作共享。它主要根據(jù)對五個主要用例方面的支持來對市場進行評估:受控的數(shù)據(jù)發(fā)現(xiàn),去中心化分析,嵌入式BI,敏捷而集中的BI調(diào)配以及支持IT的工作流、BI和分析內(nèi)容的外網(wǎng)部署。
然而Gartner 2016年的BI和分析平臺報告并沒有反映商業(yè)智能和分析平臺市場的整體情況,而是側(cè)重于幾個純BI的新玩家和描述性/診斷性分析用例(即發(fā)生什么/為什么發(fā)生?),也許,報告名稱叫“自助服務商業(yè)智能工具魔力象限” 可能更加準確。那些具有更高商業(yè)價值的預測性分析(將會發(fā)生什么?)和規(guī)范性分析(我該怎辦?)在該報告中并沒有得到足夠的體現(xiàn),Gartner 將這些分析歸入了另外一份高級分析特定的報告(如下圖所示)。
IBM、KNIME和RapidMiner是這個高級分析領域的領導者。其中SAS表現(xiàn)尤為出色,在2016這一年中SAS被Gartner譽為2016年營銷資源管理領導者;被Gartner評為數(shù)字營銷分析領域領導者;并且連續(xù)六年獲得Gartner魔力象限數(shù)據(jù)整合工具領導者殊榮。
據(jù)Gartner的預測,到2018年全球一半以上的大型機構將使用高級分析和專有算法進行企業(yè)強力競爭;2020年高級分析將吸納企業(yè)40% 在商業(yè)智能和分析領域的新投資。
高級分析采用復雜的定量方法,包括統(tǒng)計、描述性和預測性數(shù)據(jù)挖掘、機器學習、模擬和優(yōu)化等對數(shù)據(jù)進行分析,形成傳統(tǒng)BI查詢和報告所無法發(fā)現(xiàn)的洞察。當然,執(zhí)行分析將不只是針對專業(yè)的數(shù)據(jù)科學家和高級分析師,可視化的工作環(huán)境讓平民數(shù)據(jù)科學家也能參與到數(shù)據(jù)分析中來。借助工作流復用,分析自動化、引導式分析能幫助分析人員極大地提高效率。
此外,高級分析平臺還要求為開發(fā)分析模型,提供部署到端到端環(huán)境之能力。包括開發(fā)和構建分析模型的能力、模型部署(集成到業(yè)務流程應用程序中的能力),對基于平臺的項目和模型的操縱、驗證和跟蹤能力,以及對海量數(shù)據(jù)/流式數(shù)據(jù)在速度和準確性上,具有高性能和高伸縮性提出要求。
分析領域的翹楚SAS于2016年推出的高性能和可視化架構SAS Viya,是一個全新的云就緒開放式綜合高級分析平臺,它代表了SAS新一代的分析架構。SAS Viya能幫助縮減從早期分析探索到后期業(yè)務價值實現(xiàn)所需要的時間,是商業(yè)智能的基礎。
商業(yè)智能和分析行業(yè)冷靜的觀察者可能會得出一個結論:大數(shù)據(jù)時代的到來并沒有引爆商業(yè)分析行業(yè),反倒是一些BI領域的小公司借助相關概念和產(chǎn)品易用性,結合前端技術的進步吸引了部分客戶。不過這些小公司雖然增長很快,但市場基數(shù)實在太小(2-4%),部署也以面向桌面應用為主,因此對整個市場不足于構成挑戰(zhàn)和威脅!
商業(yè)智能行業(yè)的淘金山谷依然牧歌祥和,正在穩(wěn)步走向云時代——不僅僅是數(shù)據(jù)本身,而且包括應用——都在走向云端!當然,大數(shù)據(jù)時代有個關鍵的特征是:數(shù)據(jù)分析人員只有通過數(shù)據(jù)可視化和交互式分析,才能真正理解數(shù)據(jù),溝通數(shù)據(jù),從而提煉數(shù)據(jù)的商業(yè)價值。哪家公司能夠率提供將可視化數(shù)據(jù)探索、分析和價值發(fā)現(xiàn)流程融為一體的現(xiàn)代化產(chǎn)品線,幫助企業(yè)建立一個具有可持續(xù)發(fā)展的數(shù)據(jù)分析平臺,才算真正把握了大數(shù)據(jù)時代分析的先機!
本文作者:巫銀良,分析行業(yè)資深專家,大數(shù)據(jù)可視化分析負責人, SAS 北京研發(fā)中心商業(yè)智能和可視化分析產(chǎn)品部技術總監(jiān),資深商業(yè)智能技術專家。
聯(lián)系客服