【天極網(wǎng)消息】據(jù)了解,近日AWS(亞馬遜網(wǎng)絡(luò)服務(wù))發(fā)布了一項云端的數(shù)據(jù)倉庫服務(wù)——Redshift,并宣稱此服務(wù)將會帶來比傳統(tǒng)本地數(shù)據(jù)存儲更好的性能和擴(kuò)展性,價格卻比后者低很多。
“根據(jù)市價計算后我們發(fā)現(xiàn),如果想要自己組建一個大型數(shù)據(jù)倉庫,每TB的存儲空間通常每年會讓你花掉19000到25000美元,”AWS的戰(zhàn)略師Jeff Barr在博客中表示,“亞馬遜的Redshift包括一切你所需要的功能,價格卻低于每TB每年1000美元。”
除了成本優(yōu)勢,亞馬遜還宣稱該業(yè)務(wù)的管理服務(wù)功能還會讓數(shù)據(jù)倉庫管理員免受監(jiān)控、調(diào)試、備份、升級軟件及錯誤恢復(fù)的困擾。用戶只需登錄和管理AWS管理控制臺(Management Console)的Redshift節(jié)點和集群,即可輕松處理海量數(shù)據(jù)。該業(yè)務(wù)的存儲空間小至幾百GB,大至超過1PB,完全覆蓋各類企業(yè)的需求。
Redshift采用關(guān)系數(shù)據(jù)庫技術(shù),使用SQL作為其查詢語言,并與現(xiàn)存的BI工具相兼容。毫無疑問上述數(shù)據(jù)庫就是ParAccel,因為亞馬遜是該公司的一個投資方,且關(guān)于Redshift的聲明中承認(rèn)其關(guān)鍵技術(shù)來自于ParAccel。
ParAccel的數(shù)據(jù)庫有許多先進(jìn)的特性,比如柱狀數(shù)據(jù)存儲及先進(jìn)的壓縮技術(shù)。但這些技術(shù)同時也提供給像EMC Greenplum, HP Vertica和Teradata這樣的競爭者,甚至?xí)谙乱话姹镜腛racle數(shù)據(jù)庫中出現(xiàn)。盡管亞馬遜聲稱“比傳統(tǒng)快十倍”,但存儲性能最終還是取決于負(fù)載的大小及“傳統(tǒng)數(shù)據(jù)庫”間的比較。
Redshift與先前的RDS(Amazon Relational Database Service,亞馬遜關(guān)系數(shù)據(jù)庫服務(wù))的區(qū)別在于,前者專門用于倉庫存儲及分析(與事務(wù)型數(shù)據(jù)庫相對)且能夠適應(yīng)大數(shù)據(jù)的規(guī)模。“RDS采用的是微軟的SQL Server、Oracle或是
MySQL數(shù)據(jù)庫,但這些數(shù)據(jù)庫并不能勝任
PB級別的數(shù)據(jù)倉庫處理,”Jaspersoft的產(chǎn)品及聯(lián)盟副總裁Karl Van den Bergh說。Jaspersoft同MicroStrategy公司是Redshift在智能
商務(wù)方面的合作伙伴,但亞馬遜表示其他BI合作伙伴將會接踵而至。
盡管大數(shù)據(jù)分析是一個非常有潛力的方向,但亞馬遜似乎更想向中小型公司強(qiáng)調(diào)其數(shù)據(jù)倉庫業(yè)務(wù)的廉價性??蛻裟軌蛲瑫r運(yùn)行2個節(jié)點類型,其中每個節(jié)點能夠容納2TB或16TB(兩節(jié)點無需相同)的壓縮數(shù)據(jù)。據(jù)亞馬遜官方公布,一個2TB的數(shù)據(jù)倉庫每小時僅花費0.85美元,預(yù)留實例(Reserved-instance)更是低至每小時0.228美元,或每TB每年1000美元。
“亞馬遜的行事方式就是打亂市場原有格局,并提供史無前例的高性價比服務(wù),”Van den Bergh說,“數(shù)據(jù)倉庫有很大的市場,就看能將它開拓多少了?!?br> 亞馬遜并沒有在Redshift網(wǎng)站上詳細(xì)說明各大小公司上傳及同步其在Redshift中數(shù)據(jù)的方式。從單一數(shù)據(jù)源上傳數(shù)據(jù)不復(fù)雜,但隨著數(shù)據(jù)源的增加,數(shù)據(jù)傳輸?shù)难舆t和復(fù)雜度將會成倍增長。也許BI系統(tǒng)也須運(yùn)行在云端以避免企業(yè)在本地和云端間來回轉(zhuǎn)移數(shù)據(jù)而浪費大量時間。