廣義上來(lái)說(shuō),Hadoop大數(shù)據(jù)平臺(tái)也可以看做是新一代的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng), 它也具有很多現(xiàn)代數(shù)據(jù)倉(cāng)庫(kù)的特征,也被企業(yè)所廣泛使用。因?yàn)镸PP架構(gòu)的可擴(kuò)展性,基于MPP的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)有時(shí)候也被劃分到大數(shù)據(jù)平臺(tái)類產(chǎn)品。
但是數(shù)據(jù)倉(cāng)庫(kù)和Hadoop平臺(tái)還是有很多顯著的不同。針對(duì)不同的使用場(chǎng)景其發(fā)揮的作用和給用戶帶來(lái)的體驗(yàn)也不經(jīng)相同。用戶可以根據(jù)下表簡(jiǎn)單判斷什么場(chǎng)景更適合用什么樣的產(chǎn)品。
特性 | Hadoop | Data Warehouse |
計(jì)算節(jié)點(diǎn)數(shù) | 可到數(shù)千個(gè) | 一般在128個(gè)以內(nèi) |
數(shù)據(jù)量 | 支持大于10PB | 一般不大于5PB |
數(shù)據(jù)類型 | 關(guān)系型,半關(guān)系型,無(wú)結(jié)構(gòu)化,語(yǔ)音,圖像,視頻 | 關(guān)系型 |
時(shí)延 | 中/高 | 低 |
應(yīng)用生態(tài) | 創(chuàng)新型/人工智能 | 傳統(tǒng)數(shù)據(jù)庫(kù)型/BI類 |
應(yīng)用開(kāi)發(fā)接口 | SQL,MR,豐富的編程語(yǔ)言接口 | 標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)SQL |
可擴(kuò)展性 | 無(wú)窮的可能,完整的編程接口 | 有限擴(kuò)展能力,主要通過(guò)UDF支持 |
事務(wù)支持 | 有限 | 完整 |
數(shù)據(jù)倉(cāng)庫(kù)和Hadoop平臺(tái)互為補(bǔ)充,立足于滿足客戶在不同使用場(chǎng)景下的業(yè)務(wù)需求。公有云數(shù)據(jù)倉(cāng)庫(kù)服務(wù)DWS能夠無(wú)縫地接入到公有云Hadoop平臺(tái)MRS服務(wù)上,支持SQL-over-Hadoop的這個(gè)特性,提供跨平臺(tái), 跨服務(wù)的數(shù)據(jù)共享。讓用戶在充分享受Hadoop帶來(lái)的開(kāi)放,便捷,創(chuàng)新的同時(shí),繼續(xù)使用熟悉的數(shù)據(jù)(倉(cāng))庫(kù)方式管理和使用自己的海量數(shù)據(jù)。繼續(xù)使用傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)的上層應(yīng)用,特別是商業(yè)智能BI類的應(yīng)用。
聯(lián)系客服