【作者】haozhangsir,從事金融行業(yè)IT工作多年,熟悉主流平臺(tái)存儲(chǔ)設(shè)備和架構(gòu),參與過(guò)兩地三中心建設(shè)。目前主要負(fù)責(zé)存儲(chǔ)、備份等相關(guān)工作。
金融行業(yè)是國(guó)家穩(wěn)定發(fā)展的重要保障,因此,國(guó)家對(duì)金融行業(yè)的業(yè)務(wù)監(jiān)管要求越來(lái)越高。傳統(tǒng)的系統(tǒng)架構(gòu)已不能滿足國(guó)家的業(yè)務(wù)連續(xù)性要求,需要依靠科學(xué)技術(shù)提升系統(tǒng)架構(gòu),將RTO、RPO的指標(biāo)無(wú)限接近于0。傳統(tǒng)的同城災(zāi)備建設(shè)普遍采用熱備的方式,通過(guò)存儲(chǔ)同步復(fù)制技術(shù)保證生產(chǎn)數(shù)據(jù)中心與災(zāi)備數(shù)據(jù)中心數(shù)據(jù)的一致性,這種方式將數(shù)據(jù)的RPO指標(biāo)提升為0,但不能進(jìn)行快速切換,保證業(yè)務(wù)系統(tǒng)的快速恢復(fù)。
同時(shí),這種熱備方式只有在發(fā)生災(zāi)難時(shí)進(jìn)行切換,平時(shí)基本處于待機(jī)狀態(tài),對(duì)于花費(fèi)大量人力物力財(cái)力搭建的環(huán)境,是一種資源浪費(fèi)。在這種情況下,雙活數(shù)據(jù)中心的架構(gòu)應(yīng)運(yùn)而生。雙活數(shù)據(jù)中心保證業(yè)務(wù)數(shù)據(jù)0丟失的同時(shí),能夠無(wú)間斷的接管業(yè)務(wù),還可以訪問(wèn)用戶采取就近快速訪問(wèn)業(yè)務(wù)。雙活數(shù)據(jù)中心架構(gòu)主要包括存儲(chǔ)雙活、數(shù)據(jù)庫(kù)雙活、應(yīng)用雙活以及網(wǎng)絡(luò)雙活四個(gè)層面,其中存儲(chǔ)雙活是雙活數(shù)據(jù)中心的基礎(chǔ),因此,存儲(chǔ)雙活架構(gòu)的搭建是各大企業(yè)建立雙活數(shù)據(jù)中心的重中之重。
基金公司作為金融行業(yè)重要組成部分之一,對(duì)我國(guó)的經(jīng)濟(jì)發(fā)展起到推動(dòng)作用,也為公民投資理財(cái)提供多條路徑。投資系統(tǒng)是基金公司最核心的業(yè)務(wù)系統(tǒng),需要低時(shí)延、高可用的技術(shù)手段保障其無(wú)中斷運(yùn)行。目前,我公司采用熱備數(shù)據(jù)中心,應(yīng)用、數(shù)據(jù)庫(kù)以及存儲(chǔ)部署在生產(chǎn)中心,通過(guò)存儲(chǔ)級(jí)復(fù)制將數(shù)據(jù)同步至災(zāi)備中心。系統(tǒng)正常運(yùn)行時(shí),客戶訪問(wèn)到生產(chǎn)中心的應(yīng)用系統(tǒng),災(zāi)難發(fā)生后,運(yùn)維人員手工啟動(dòng)災(zāi)備中心的應(yīng)用和數(shù)據(jù)庫(kù),這樣的應(yīng)急操作將達(dá)到10分鐘甚至10分鐘以上。
目前,監(jiān)管部門對(duì)于投資交易系統(tǒng)業(yè)務(wù)連續(xù)性要求故障應(yīng)在5分鐘內(nèi)業(yè)務(wù)全部恢復(fù),只有這樣才能保證基金行業(yè)的穩(wěn)定運(yùn)行,但當(dāng)前的架構(gòu)不足以支撐投資系統(tǒng)的連續(xù)性要求;存儲(chǔ)設(shè)備多樣化,目前生產(chǎn)環(huán)境中擁有EMC、IBM、HDS以及國(guó)產(chǎn)品牌等多家產(chǎn)品,同時(shí),同廠商也存在不同型號(hào)的存儲(chǔ)陣列。現(xiàn)存EMC VNX和VMAX系列,HDS的HUS和AMS系列,IBM的DS以及FAS系列產(chǎn)品。不同廠商的設(shè)備管理方式不盡相同,沒(méi)有統(tǒng)一的對(duì)外接口和管理資源池,這樣不利于運(yùn)維人員的管理,增加了維護(hù)成本。在與同業(yè)交流和調(diào)研后,我公司決定搭建雙活數(shù)據(jù)中心。
不同企業(yè)搭建雙活數(shù)據(jù)中心目標(biāo)不盡相同,但大致可歸納為以下幾點(diǎn):
業(yè)務(wù)連續(xù):搭建跨區(qū)域的同城雙活數(shù)據(jù)中心,有效地避免單一數(shù)據(jù)中心級(jí)別故障導(dǎo)致的業(yè)務(wù)中斷。
流量轉(zhuǎn)發(fā):提升數(shù)據(jù)中心資源的利用率,同城數(shù)據(jù)中心獨(dú)立運(yùn)營(yíng),形成靈活、可拓展面向服務(wù)的業(yè)務(wù)架構(gòu),根據(jù)用戶范圍,為用戶提供就近快速的訪問(wèn)響應(yīng)。
業(yè)務(wù)安全:各數(shù)據(jù)中心基礎(chǔ)設(shè)施完善,機(jī)房環(huán)境穩(wěn)定,數(shù)據(jù)中心內(nèi)部具有保護(hù)核心網(wǎng)絡(luò)不受攻擊的技術(shù)保障手段。
環(huán)境一致:各數(shù)據(jù)中心部署的應(yīng)用對(duì)用戶來(lái)說(shuō)是透明的,對(duì)外提供統(tǒng)一的服務(wù)接口,數(shù)據(jù)中心間的數(shù)據(jù)和部署參數(shù)須完全一致,具備隨時(shí)可切換的能力。
范圍:搭建雙活數(shù)據(jù)中心總體架構(gòu),包括雙活存儲(chǔ)系統(tǒng)、雙活數(shù)據(jù)庫(kù)系統(tǒng)、雙活應(yīng)用系統(tǒng)和雙活網(wǎng)絡(luò)系統(tǒng)。雙活網(wǎng)絡(luò)系統(tǒng)主要依靠智能DNS、GSLB全局負(fù)載均衡、大二層等技術(shù)來(lái)實(shí)現(xiàn);雙活數(shù)據(jù)庫(kù)系統(tǒng)主要采用數(shù)據(jù)庫(kù)集群技術(shù),包括Oracle RAC、DB2 pureScale等;雙活應(yīng)用系統(tǒng)依靠負(fù)載均衡實(shí)現(xiàn)。本方案將主要探討雙活存儲(chǔ)系統(tǒng)的搭建,通過(guò)雙活存儲(chǔ)系統(tǒng)的搭建,可實(shí)現(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)的雙活。鑒于各企業(yè)存儲(chǔ)廠商不盡相同,本方案采用存儲(chǔ)整合設(shè)備將異構(gòu)存儲(chǔ)統(tǒng)一管理,并基于此平臺(tái),實(shí)現(xiàn)存儲(chǔ)系統(tǒng)的雙活。
本方案采用以EMC VPLEX技術(shù)為核心的雙活虛擬化數(shù)據(jù)中心解決方案。EMC VPLEX能夠打破數(shù)據(jù)中心間的物理壁壘,提供不同站點(diǎn)間對(duì)同一數(shù)據(jù)副本的共享、訪問(wèn)及在線移動(dòng)的能力,提供雙A(Active-Active)高可用服務(wù),結(jié)合虛擬化技術(shù)及DWDM(密集型光波復(fù)用)網(wǎng)絡(luò)擴(kuò)展技術(shù),能夠?qū)崿F(xiàn)業(yè)務(wù)及數(shù)據(jù)在站點(diǎn)間的透明在線移動(dòng),使用戶能夠在兩個(gè)站點(diǎn)間動(dòng)態(tài)平衡業(yè)務(wù)負(fù)載,最大限度利用資源,并提供零RTO的高可用能力。
存儲(chǔ)虛擬化網(wǎng)關(guān)平臺(tái)是實(shí)現(xiàn)雙活存儲(chǔ)系統(tǒng)核心技術(shù)之一,在進(jìn)行存儲(chǔ)網(wǎng)關(guān)平臺(tái)選型時(shí),主要考慮高可用、高可靠以及高拓展性。在高可用方面,VPLEX是多活結(jié)構(gòu),內(nèi)部通過(guò)多條路徑負(fù)載到虛擬磁盤,不存在單點(diǎn)故障;VPLEX引擎基于VMAX存儲(chǔ)機(jī)頭,每個(gè)控制器36GB緩存,多個(gè)控制器可并發(fā)訪問(wèn)指定虛擬卷,支持全局一致性緩存機(jī)制。
EMC VPLEX介于在服務(wù)器和異構(gòu)存儲(chǔ)之間,使用群集體系結(jié)構(gòu),該體系結(jié)構(gòu)允許多個(gè)數(shù)據(jù)中心的服務(wù)器具有對(duì)共享塊存儲(chǔ)設(shè)備的讀/寫訪問(wèn)權(quán)限。
EMC VPLEX作為主機(jī)和存儲(chǔ)的統(tǒng)一接口,數(shù)據(jù)底層采用現(xiàn)存的EMC VNX存儲(chǔ)陣列和利舊的IBM DS存儲(chǔ)陣列。利用VPLEX的存儲(chǔ)虛擬化網(wǎng)關(guān)可以整合現(xiàn)存的存儲(chǔ)陣列資源,可以充分利用存儲(chǔ)陣列提升設(shè)備的利用率。通常,未采用存儲(chǔ)網(wǎng)關(guān)的存儲(chǔ)陣列真實(shí)利用率只有30-70%,采用存儲(chǔ)網(wǎng)關(guān)可以使存儲(chǔ)陣列利用率達(dá)到70-90%;同時(shí),利于運(yùn)維人員的統(tǒng)一管理。
EMC VPLEX 可以同時(shí)提供本地聯(lián)合和分布式聯(lián)合。本地聯(lián)合提供了站點(diǎn)內(nèi)物理存儲(chǔ)元素的透明協(xié)作,而分布式聯(lián)合將這一概念擴(kuò)展到了跨遠(yuǎn)距離的兩個(gè)位置之間。分布式聯(lián)合是通過(guò) AccessAnywhere 這一技術(shù)實(shí)現(xiàn)的,此技術(shù)支持跨遠(yuǎn)距離共享、訪問(wèn)和移置單個(gè)數(shù)據(jù)拷貝,是跨距離雙活數(shù)據(jù)中心的基礎(chǔ)。
基于存儲(chǔ)的雙活數(shù)據(jù)中心必須嚴(yán)格保障存儲(chǔ)數(shù)據(jù)的一致性,VPLEX 在進(jìn)行寫操作時(shí),會(huì)通過(guò)透寫方式保障數(shù)據(jù)的一致性,待數(shù)據(jù)完全相同的寫入兩端存儲(chǔ)陣列后,才返回主機(jī)寫完成信號(hào)。VPLEX 寫操作的工作原理如下圖:
主機(jī)向VPLEX Metro集群1發(fā)送請(qǐng)求,集群1接到主機(jī)請(qǐng)求后集群2發(fā)送相同的主機(jī)請(qǐng)求,待數(shù)據(jù)同時(shí)向存儲(chǔ)陣列落盤后,返回完成請(qǐng)求信號(hào),主機(jī)端操作完成,中途有異常時(shí),返回請(qǐng)求失敗信號(hào),避免雙數(shù)據(jù)中心存儲(chǔ)數(shù)據(jù)不一致。
基于 VPLEX Metro搭建雙活數(shù)據(jù)中心解決方案的結(jié)構(gòu)如下圖所示:
1) 基于EMC VPLEX Metro提供雙活數(shù)據(jù)中心解決方案核心功能。
2) 基于傳輸廠商提供的DWDM 二層網(wǎng)絡(luò)延伸技術(shù),從網(wǎng)絡(luò)層面為數(shù)據(jù)庫(kù)和服務(wù)器在線透明遷移提供條件,及最小化的RTO指標(biāo)。
3) 基于EMC Witness為雙活存儲(chǔ)系統(tǒng)提供心跳機(jī)制,避免由于存儲(chǔ)間鏈路出現(xiàn)問(wèn)題或單臺(tái)存儲(chǔ)出現(xiàn)問(wèn)題時(shí)發(fā)生腦裂故障。
4) 基于EMC Avamar為雙活數(shù)據(jù)中心提供完善的數(shù)據(jù)備份保護(hù)。
5) 基于EMC Ionix ITOI(IT Operations Intelligence)產(chǎn)品實(shí)現(xiàn)虛擬數(shù)據(jù)中心的全面集中監(jiān)控管理。
在 VPLEX 中,Witness 功能僅適用于放在一致性組中的分布式卷。未放在一致性組中的分布式卷具有自己的獨(dú)立偏好設(shè)置。在首選群集發(fā)生故障時(shí),這些卷將暫停 I/O。將 VPLEX Witness 部署到以下故障域非常重要,該故障域應(yīng)獨(dú)立于每個(gè)包含兩個(gè)VPLEX 群集的故障域,以確保單個(gè)故障影響的實(shí)體不會(huì)超過(guò)一個(gè),節(jié)點(diǎn)故障影響如下圖所示。雙活數(shù)據(jù)中心為我們提供了技術(shù)保護(hù),同樣,我們也應(yīng)該定期對(duì)高可用架構(gòu)進(jìn)行有效的演練,只有這樣,才能做到養(yǎng)兵千日用兵一時(shí),為企業(yè)提供最可靠的保護(hù)。
隨著科學(xué)技術(shù)的發(fā)展,存儲(chǔ)雙活系統(tǒng)的建立使雙活數(shù)據(jù)中心得以實(shí)現(xiàn),也為企業(yè)提供了新的數(shù)據(jù)中心建設(shè)方向,也為客戶提供了更加穩(wěn)定便捷的服務(wù)。雙活數(shù)據(jù)中心已經(jīng)經(jīng)過(guò)了不少企業(yè)的驗(yàn)證,我們會(huì)汲取經(jīng)驗(yàn)和建議,建設(shè)成果也會(huì)進(jìn)行分享。在未來(lái),還會(huì)有先進(jìn)的技術(shù)和架構(gòu),提升IT系統(tǒng)的穩(wěn)定和性能,同時(shí)完整的運(yùn)維管理體系和運(yùn)維人員技能培養(yǎng)必不可少,這樣才能發(fā)揮企業(yè)最大潛力,為國(guó)家金融穩(wěn)定發(fā)展提供保障。
聯(lián)系客服