我們都是架構(gòu)師!
每年“雙11”都是一場電商盛會,消費者狂歡日。今年雙11的意義尤為重大,它已經(jīng)發(fā)展成為全世界電商和消費者都參與進(jìn)來的盛宴。而對技術(shù)人員來說,雙十一無疑已經(jīng)成為一場大考,考量的角度是整體架構(gòu)、基礎(chǔ)中間件、運維工具、人員等。
一次成功的大促準(zhǔn)備不光是針對活動本身對系統(tǒng)和架構(gòu)做的優(yōu)化措施,比如:流量控制,緩存策略,依賴管控,性能優(yōu)化……更是與長時間的技術(shù)積累和打磨分不開。下面我將簡單介紹支付寶的整體架構(gòu),讓大家有個初步認(rèn)識,然后會以本次在大促中大放異彩的“螞蟻花唄”為例,大致介紹一個新業(yè)務(wù)是如何從頭開始準(zhǔn)備大促的。
因為涉及的內(nèi)容要深入下去是足夠?qū)懸粋€系列介紹,本文只能提綱挈領(lǐng)的讓大家有個初步認(rèn)識,后續(xù)可能會對大家感興趣的專項內(nèi)容進(jìn)行深入分享。
支付寶的架構(gòu)設(shè)計上應(yīng)該考慮到互聯(lián)網(wǎng)金融業(yè)務(wù)的特殊性,比如要求更高的業(yè)務(wù)連續(xù)性,更好的高擴展性,更快速的支持新業(yè)務(wù)發(fā)展等特點。目前其架構(gòu)如下:
整個平臺被分成了三個層:
運維平臺(IAAS):主要提供基礎(chǔ)資源的可伸縮性,比如網(wǎng)絡(luò)、存儲、數(shù)據(jù)庫、虛擬化、IDC等,保證底層系統(tǒng)平臺的穩(wěn)定性;
技術(shù)平臺(PAAS):主要提供可伸縮、高可用的分布式事務(wù)處理和服務(wù)計算能力,能夠做到彈性資源的分配和訪問控制,提供一套基礎(chǔ)的中間件運行環(huán)境,屏蔽底層資源的復(fù)雜性;
業(yè)務(wù)平臺(SAAS):提供隨時隨地高可用的支付服務(wù),并且提供一個安全易用的開放支付應(yīng)用開發(fā)平臺。
在雙十一大促當(dāng)天業(yè)務(wù)量年年翻番的情況下,支付寶面臨的考驗也越來越大:系統(tǒng)的容量越來越大,服務(wù)器、網(wǎng)絡(luò)、數(shù)據(jù)庫、機房都隨之?dāng)U展,這帶來了一些比較大的問題,比如系統(tǒng)規(guī)模越來越大,系統(tǒng)的復(fù)雜度越來越高,以前按照點的伸縮性架構(gòu)無法滿足要求,需要我們有一套整體性的可伸縮方案,可以按照一個單元的維度進(jìn)行擴展。能夠提供支持異地伸縮的能力,提供N+1的災(zāi)備方案,提供整體性的故障恢復(fù)體系?;谝陨蠋讉€需求,我們提出了邏輯數(shù)據(jù)中心架構(gòu),核心思想是把數(shù)據(jù)水平拆分的思路向上層提到接入層、終端, 從接入層開始把系統(tǒng)分成多個單元,單元有幾個特性:
每個單元對外是封閉的,包括系統(tǒng)間交換各類存儲的訪問;
每個單元的實時數(shù)據(jù)是獨立的,不共享。而會員或配置類對延時性要求不高的數(shù)據(jù)可共享;
單元之間的通信統(tǒng)一管控,盡量走異步化消息。同步消息走單元代理方案;
下面是支付寶邏輯機房架構(gòu)的概念圖:
這套架構(gòu)解決了幾個關(guān)鍵問題:
由于盡量減少了跨單元交互和使用異步化,使得異地部署成為可能。整個系統(tǒng)的水平可伸縮性大大提高,不再依賴同城IDC;
可以實現(xiàn)N+1的異地災(zāi)備策略,大大縮減災(zāi)備成本,同時確保災(zāi)備設(shè)施真實可用;
整個系統(tǒng)已無單點存在,大大提升了整體的高可用性;同城和異地部署的多個單元可用作互備的容災(zāi)設(shè)施,通過運維管控平臺進(jìn)行快速切換,有機會實現(xiàn)100%的持續(xù)可用率;
該架構(gòu)下業(yè)務(wù)級別的流量入口和出口形成了統(tǒng)一的可管控、可路由的控制點,整體系統(tǒng)的可管控能力得到很大提升?;谠摷軜?gòu),線上壓測、流量管控、灰度發(fā)布等以前難以實現(xiàn)的運維管控模式,現(xiàn)在能夠十分輕松地實現(xiàn)。
目前新架構(gòu)的同城主體框架在2013年已經(jīng)完成,并且順利的面對了雙十一的考驗,讓整套架構(gòu)的落地工作得到了很好的證明。
在2015年完成了基于邏輯機房,異地部署的“異地多活”的架構(gòu)落地?!爱惖囟嗷睢奔軜?gòu)是指,基于邏輯機房擴展能力,在不同的地域IDC部署邏輯機房,并且每個邏輯機房都是“活”的,真正承接線上業(yè)務(wù),在發(fā)生故障的時候可以快速進(jìn)行邏輯機房之間的快速切換。
這比傳統(tǒng)的“兩地三中心”架構(gòu)有更好的業(yè)務(wù)連續(xù)性保障。在“異地多活”的架構(gòu)下,一個IDC對應(yīng)的故障容災(zāi)IDC是一個“活”的IDC,平時就承接著正常線上業(yè)務(wù),保證其穩(wěn)定性和業(yè)務(wù)的正確性是一直被確保的。
以下是支付寶“異地多活”架構(gòu)示意圖:
除了更好的故障應(yīng)急能力之外,基于邏輯機房我們又具備的“藍(lán)綠發(fā)布”或者說“灰度發(fā)布”的驗證能力。我們把單個邏輯機房(后續(xù)簡稱LDC)內(nèi)部又分成A、B兩個邏輯機房,A 、B機房在功能上完全對等。日常情況下,調(diào)用請求按照對等概率隨機路由到A或B 。當(dāng)開啟藍(lán)綠模式時,上層路由組件會調(diào)整路由計算策略,隔離A與B之間的調(diào)用, A組內(nèi)應(yīng)用只能相互訪問,而不會訪問B組。
然后進(jìn)行藍(lán)綠發(fā)布流程大致如下:
Step1. 發(fā)布前,將“藍(lán)”流量調(diào)至0%,對“藍(lán)”的所有應(yīng)用整體無序分2組發(fā)布。
Step2. “藍(lán)”引流1%觀察,如無異常,逐步上調(diào)分流比例至100%。
Step3. “綠”流量為0%,對“綠”所有應(yīng)用整體無序分2組發(fā)布。
Step4. 恢復(fù)日常運行狀態(tài),藍(lán)、綠單元各承擔(dān)線上50%的業(yè)務(wù)流量。
支付寶在2015年雙十一當(dāng)天的高峰期間處理支付峰值8.59萬筆/秒,已經(jīng)是國際第一大系統(tǒng)支付。支付寶已經(jīng)是全球最大的OLTP處理者之一,對事務(wù)的敏感使支付寶的數(shù)據(jù)架構(gòu)有別于其他的互聯(lián)網(wǎng)公司,卻繼承了互聯(lián)網(wǎng)公司特有的巨大用戶量,最主要的是支付寶對交易的成本比傳統(tǒng)金融公司更敏感,所以支付寶數(shù)據(jù)架構(gòu)發(fā)展,就是一部低成本、線性可伸縮、分布式的數(shù)據(jù)架構(gòu)演變史。
現(xiàn)在支付寶的數(shù)據(jù)架構(gòu)已經(jīng)從集中式的小型機和高端存儲升級到了分布式PC服務(wù)解決方案,整體數(shù)據(jù)架構(gòu)的解決方案盡量做到無廠商依賴,并且標(biāo)準(zhǔn)化。
支付寶分布式數(shù)據(jù)架構(gòu)可伸縮策略主要分為三個維度:
按照業(yè)務(wù)類型進(jìn)行垂直拆分
按照客戶請求進(jìn)行水平拆分(也就是常說的數(shù)據(jù)的sharding策略)
對于讀遠(yuǎn)遠(yuǎn)大于寫的數(shù)據(jù)進(jìn)行讀寫分離和數(shù)據(jù)復(fù)制處理
下圖是支付寶內(nèi)部交易數(shù)據(jù)的可伸縮性設(shè)計:
交易系統(tǒng)的數(shù)據(jù)主要分為三個大數(shù)據(jù)庫集群:
主交易數(shù)據(jù)庫集群,每一筆交易創(chuàng)建和狀態(tài)的修改首先在這?完成,產(chǎn)生的變更再通過可靠數(shù)據(jù)復(fù)制中心復(fù)制到其他兩個數(shù)據(jù)庫集群:消費記錄數(shù)據(jù)庫集群、商戶查詢數(shù)據(jù)庫集群。該數(shù)據(jù)庫集群的數(shù)據(jù)被水平拆分成多份,為了同時保證可伸縮性和高可靠性,每一個節(jié)點都會有與之對應(yīng)的備用節(jié)點和failover節(jié)點,在出現(xiàn)故障的時候可以在秒級內(nèi)切換到failover節(jié)點。
消費記錄數(shù)據(jù)庫集群,提供消費者更好的用戶體驗和需求;
商戶查詢數(shù)據(jù)庫集群,提供商戶更好的用戶體驗和需求;
對于分拆出來的各個數(shù)據(jù)節(jié)點,為了保證對上層應(yīng)用系統(tǒng)的透明,我們研發(fā)一套數(shù)據(jù)中間產(chǎn)品來保證交易數(shù)據(jù)做到彈性擴容。
分布式數(shù)據(jù)架構(gòu)下,在保證事務(wù)原有的ACID(原子性、一致性、隔離性、持久性)特性的基礎(chǔ)上,還要保證高可用和可伸縮性,挑戰(zhàn)非常大。試想你同時支付了兩筆資金,這兩筆資金的事務(wù)如果在分布式環(huán)境下相互影響,在其中一筆交易資金回滾的情況下,還會影響另外一筆是多么不能接受的情況。
根據(jù)CAP和BASE原則,再結(jié)合支付寶系統(tǒng)的特點,我們設(shè)計了一套基于服務(wù)層面的分布式事務(wù)框架,他支持兩階段提交協(xié)議,但是做了很多的優(yōu)化,在保證事務(wù)的ACID原則的前提下,確保事務(wù)的最終一致性 。我們叫做“柔性事物”策略。原理如下:
以下是分布式事務(wù)框架的流程圖:
實現(xiàn):
一個完整的業(yè)務(wù)活動由一個主業(yè)務(wù)服務(wù)與若干從業(yè)務(wù)服務(wù)組成。
主業(yè)務(wù)服務(wù)負(fù)責(zé)發(fā)起并完成整個業(yè)務(wù)活動。
從業(yè)務(wù)服務(wù)提供TCC型業(yè)務(wù)操作。
業(yè)務(wù)活動管理器控制業(yè)務(wù)活動的一致性,它登記業(yè)務(wù)活動中的操作,并在活動提交時確認(rèn)所有的兩階段事務(wù)的confirm操作,在業(yè)務(wù)活動取消時調(diào)用所有兩階段事務(wù)的cancel操作。”
與2PC協(xié)議比較:
沒有單獨的Prepare階段,降低協(xié)議成本
系統(tǒng)故障容忍度高,恢復(fù)簡單
其中關(guān)鍵組件異步可靠消息策略如下:
其中一些關(guān)鍵設(shè)計點:
若在第2、3、4步出現(xiàn)故障,業(yè)務(wù)系統(tǒng)自行決定回滾還是另起補償機制;若在第6、7步出現(xiàn)異常,消息中心需要回查生產(chǎn)者;若在第8步出現(xiàn)異常,消息中心需要重試。第6步的確認(rèn)消息由消息中心組件封裝,應(yīng)用系統(tǒng)無需感知。
此套機制保障了消息數(shù)據(jù)的完整性,進(jìn)而保障了與通過異步可靠消息通訊的系統(tǒng)數(shù)據(jù)最終一致性。
某些業(yè)務(wù)的前置檢查,需要消息中心提供指定條件回查機制。
螞蟻花唄是今年增加的一個新支付工具,“確認(rèn)收貨后、下月還”的支付體驗受到了越來越多的消費者信賴。跟余額和余額寶一樣,螞蟻花唄避開了銀行間的交易鏈路,最大限度避免支付時的擁堵。據(jù)官方數(shù)據(jù)披露,在今天的雙十一大促中,螞蟻花唄支付成功率達(dá)到99.99%、平均每筆支付耗時0.035秒,和各大銀行渠道一起確保了支付的順暢。
螞蟻花唄距今發(fā)展不到一年,但發(fā)展速度非???。從上線初期的10筆/秒的支付量發(fā)展到雙十一當(dāng)天峰值2.1w筆/秒。支撐螞蟻花唄業(yè)務(wù)發(fā)展的技術(shù)體系經(jīng)過不斷演進(jìn)、已經(jīng)完全依托于螞蟻金服的金融云架構(gòu)。
在2014年12月,螞蟻花唄團隊完成業(yè)務(wù)系統(tǒng)優(yōu)化,按照標(biāo)準(zhǔn)將系統(tǒng)架設(shè)到了金融云上,依次對接了渠道層、業(yè)務(wù)層、核心平臺層、數(shù)據(jù)層,使得用戶對螞蟻花唄在營銷、下單和支付整個過程中體驗統(tǒng)一。
2015年4月,螞蟻花唄系統(tǒng)同步金融云的單元化的建設(shè),即LDC,使得數(shù)據(jù)和應(yīng)用走向異地成為了現(xiàn)實,具備了較好的擴展性和流量管控能力。在可用性方面,與金融云賬務(wù)體系深度結(jié)合,借用賬務(wù)系統(tǒng)的failover能力,使得螞蟻花唄通過低成本改造就具備了同城災(zāi)備、異地災(zāi)備等高可用能力。任何一個單元的數(shù)據(jù)庫出了問題、能夠快速進(jìn)行容災(zāi)切換、不會影響這個單元的用戶進(jìn)行螞蟻花唄支付。在穩(wěn)定性方面,借助于云客戶平臺的高穩(wěn)定性的能力,將螞蟻花唄客戶簽約形成的合約數(shù)據(jù)遷移進(jìn)去,并預(yù)先寫入云客戶平臺的緩存中,在大促高峰期緩存的命中率達(dá)到100%。同時,結(jié)合全鏈路壓測平臺,對螞蟻花唄進(jìn)行了能力摸高和持續(xù)的穩(wěn)定性測試,發(fā)現(xiàn)系統(tǒng)的性能點反復(fù)進(jìn)行優(yōu)化,使得大促當(dāng)天系統(tǒng)平穩(wěn)運行。在之前的架構(gòu)中,系統(tǒng)的秒級處理能力無法有效衡量,通過簡單的引流壓測無法得到更加準(zhǔn)確、可信的數(shù)據(jù)。立足于金融云,系統(tǒng)很快通過全鏈路壓測得到了每秒處理4w筆支付的穩(wěn)定能力。
螞蟻花唄業(yè)務(wù)中最為關(guān)鍵的一環(huán)在于買家授信和支付風(fēng)險的控制。從買家下單的那一刻開始,后臺便開始對虛假交易、限額限次、套現(xiàn)、支用風(fēng)險等風(fēng)險模型進(jìn)行并行計算,這些模型最終將在20ms以內(nèi)完成對僅百億數(shù)據(jù)的計算和判定,能夠在用戶到達(dá)收銀臺前確定這筆交易是否存在潛在風(fēng)險。
為了保證螞蟻花唄雙11期間的授信資金充足,在金融云體系下搭建了機構(gòu)資產(chǎn)中心,對接支付清算平臺,將表內(nèi)的信貸資產(chǎn)打包形成一個一定期限的資產(chǎn)池,并以這個資產(chǎn)池為基礎(chǔ),發(fā)行可交易證券進(jìn)行融資,即通過資產(chǎn)轉(zhuǎn)讓的方式獲得充足資金,通過這一創(chuàng)新確保了用戶能夠通過花唄服務(wù)順利完成交易,并分流對銀行渠道的壓力。通過資產(chǎn)證券化運作,不僅幫助100多萬小微企業(yè)實現(xiàn)融資,也支撐了螞蟻花唄用戶的消費信貸需求。螞蟻小貸的資產(chǎn)證券化業(yè)務(wù)平臺可達(dá)到每小時過億筆、總規(guī)模數(shù)十億元級別的資產(chǎn)轉(zhuǎn)讓。
經(jīng)過這么多年的高可用架構(gòu)和大促的準(zhǔn)備工作,螞蟻金融技術(shù)團隊可以做到“先勝而后求戰(zhàn)”,主要分為三方面技術(shù)積累:“謀”,“器”,“將”。
“謀”就是整體的架構(gòu)設(shè)計方案和策略;
“器”就是支持技術(shù)工作的各種基礎(chǔ)中間件和基礎(chǔ)組件;
“將”就是通過實踐鍛煉成長起來的技術(shù)人員。
縱觀現(xiàn)在各種架構(gòu)分享,大家喜歡談“謀”的方面較多,各種架構(gòu)設(shè)計方案優(yōu)化策略分享,但實際最后多是兩種情況:“吹的牛X根本沒被證實過”(各種框架能力根本沒經(jīng)過實際考驗,只是一紙空談),“吹過的牛X一經(jīng)實際考驗就破了”(說的設(shè)計理念很好,但是一遇到實際的大業(yè)務(wù)的沖擊系統(tǒng)就掛了),最后能成功的少之又少。這些說明雖然架構(gòu)上的“心靈雞湯”和“成功學(xué)”技術(shù)人員都已經(jīng)熟的不行,但是發(fā)現(xiàn)一到實踐其實根本不是那么回事。從此可以看出,其實最后起決定作用的不是 “謀”方面的理論層面的分析設(shè)計,最重要的是落地“器”和“將”的層面。有過硬高穩(wěn)定性的各種基礎(chǔ)設(shè)施工具的和身經(jīng)百戰(zhàn)被“虐了千百次”的技術(shù)人員的支撐才是最后取勝的關(guān)鍵。而這個兩個層面的問題是不能通過分享學(xué)到的,是要通過日積月累的,無數(shù)流血流淚趟雷中招鍛煉出來的,沒有近路可抄。
而目前從業(yè)務(wù)和市場的發(fā)展形勢來看,往往就是需要技術(shù)在某個特定時間有個質(zhì)的能力的提升和飛躍,不會給你太多的準(zhǔn)備技術(shù)架構(gòu)提升的時間,在技術(shù)積累和人員儲備都不足的時候,如何構(gòu)建平臺能力,把更多的精力放在業(yè)務(wù)相關(guān)的開發(fā)任務(wù)中,是每個技術(shù)團隊的希望得到的能力 。
過去我們是通過某個開源或者商業(yè)組件來實現(xiàn)技術(shù)共享得到快速解決謀發(fā)展技術(shù)的能力的,但是隨著業(yè)務(wù)復(fù)雜性,專業(yè)性,規(guī)模的逐步變大,這種方式的缺點也是顯而易見的:1、很多組件根本無法滿足大并發(fā)場景下的各種技術(shù)指標(biāo);2、隨著業(yè)務(wù)的復(fù)雜和專業(yè)性的提高,沒有可以直接使用的開源組件;3、“人”本身的經(jīng)驗和能力是無法傳遞的。
所以現(xiàn)在我們通過“云”分享的技術(shù)和業(yè)務(wù)的能力的方式也發(fā)展的越來越快,這就我們剛才介紹的“螞蟻花唄”技術(shù)用幾個月的時間快速的成功的達(dá)到“從上線初期的10筆/秒的支付量發(fā)展到雙十一當(dāng)天峰值2.1w筆/秒,快速走完了別人走了幾年都可能達(dá)不到的能力。類似的例子還有大家熟知的“余額寶”系統(tǒng)。
這些都是建立在原來螞蟻金服用了10年打磨的基礎(chǔ)組件和技術(shù)人員經(jīng)驗的云服務(wù)上的,通過目前基于這種能力,我們目前可以快速給內(nèi)部和外部的客戶組建,高可用、安全、高效、合規(guī)的金融云服務(wù)架構(gòu)下的系統(tǒng)。
來源:InfoQ
原文:http://www.infoq.com/cn/articles/technical-architecture-of-alipay-and-ant-check-later
轉(zhuǎn)載文章,向原作者致敬!如有侵權(quán)或不周之處,敬請勞煩聯(lián)系若飛(微信:1321113940)馬上刪除,謝謝!
·END·
我們都是架構(gòu)師!
聯(lián)系客服