有些事兒一旦放一放就難再拾起來,突然發(fā)現(xiàn)《性能測(cè)試知多少》這個(gè)系列兩月沒更新,關(guān)鍵時(shí)我都不知道啥時(shí)候放下的,總?cè)菀妆桓鞣N技術(shù)所吸引走,如饑似渴的想學(xué)更多的東西,這幾天一直有朋友問我為啥不寫了,我才意識(shí),事情要一樣一樣做,我現(xiàn)在要把這個(gè)系列完成。
之前有對(duì)性能需求進(jìn)行過分析,那篇主要從項(xiàng)目業(yè)務(wù)、背景等角度如何抽絲剝繭的將項(xiàng)目的需求抽離出來。在我們進(jìn)行需求的時(shí)候也需要對(duì)被測(cè)項(xiàng)目的架構(gòu)有一定的認(rèn)識(shí),如果不了解被測(cè)系統(tǒng)的架構(gòu),那么在后期的性能分析與調(diào)優(yōu)階段將無從下手。
簡單系統(tǒng)架構(gòu)介紹
因?yàn)槊總€(gè)公司的業(yè)務(wù)不同,采用的技術(shù),架構(gòu)也都有很大不同。但不管怎么變動(dòng),但基本都在三層架構(gòu)的基礎(chǔ)上擴(kuò)展與改進(jìn)。
下面看一個(gè)基本的系統(tǒng)架構(gòu):
表示層:
表示層運(yùn)行在客戶終端上,運(yùn)行java applet 程序,提供協(xié)議控制和用戶界面,與系統(tǒng)用戶實(shí)現(xiàn)直接交互,通過TCP/HTTP協(xié)議與業(yè)務(wù)層系統(tǒng)通信,向應(yīng)用層系統(tǒng)發(fā)送請(qǐng)求報(bào)文,并接收應(yīng)用層系統(tǒng)返回的回應(yīng)報(bào)文。
業(yè)務(wù)邏輯層:
業(yè)務(wù)邏輯層作為中間層實(shí)現(xiàn)核心業(yè)務(wù)邏輯服務(wù)。
應(yīng)用服務(wù)器主要運(yùn)行中間件系統(tǒng),中間件系統(tǒng)系統(tǒng)作為一個(gè)容器來運(yùn)行各種應(yīng)用軟件系統(tǒng)。前臺(tái)發(fā)來的請(qǐng)求報(bào)文通過中間件傳遞給應(yīng)用程序,應(yīng)用程序在處理的過程中調(diào)用數(shù)據(jù)層的數(shù)據(jù)服務(wù)器,數(shù)據(jù)服務(wù)器將查詢的數(shù)據(jù)返回給應(yīng)用程序,應(yīng)用軟件處理完成后通過中間件系統(tǒng)返回給客戶端。
在大型的系統(tǒng)中,可以對(duì)應(yīng)用系統(tǒng)進(jìn)行拆分,比如拆分成交易服務(wù),查詢服務(wù);或者通過負(fù)載均衡技術(shù),來分散客戶端發(fā)來的請(qǐng)求,使其能承受更大的用戶訪問量。
數(shù)據(jù)層:
數(shù)據(jù)層運(yùn)行在數(shù)據(jù)庫主機(jī)上,負(fù)責(zé)整個(gè)系統(tǒng)中數(shù)據(jù)信息的存儲(chǔ)。運(yùn)行數(shù)據(jù)庫服務(wù)程序,查詢通過JDBC與應(yīng)用程序進(jìn)行通信,主要用于存儲(chǔ)數(shù)據(jù)與提供數(shù)據(jù)查詢等服務(wù)。
數(shù)據(jù)庫集群技術(shù)就是對(duì)大型系統(tǒng)應(yīng)用非常廣泛的一種解決方案。
大型系統(tǒng)架構(gòu)介紹
前面介紹了一般系統(tǒng)的架構(gòu),那么一個(gè)大型的系統(tǒng)在設(shè)計(jì)中使用了哪些手段或技術(shù)來提高系統(tǒng)的性能呢
操作系統(tǒng)
操作系統(tǒng)是硬件與軟件之間的橋梁,那么一個(gè)穩(wěn)定的操作系統(tǒng)是系統(tǒng)堅(jiān)實(shí)的基礎(chǔ)。在個(gè)人操作系統(tǒng)領(lǐng)域,windows 無疑是絕對(duì)的霸主,但隨著近幾年的發(fā)展,linux/unix以其不俗的性能表現(xiàn),超強(qiáng)的穩(wěn)定性與安全性使其在服務(wù)器領(lǐng)域變成重多企業(yè)的首選。因?yàn)橄到y(tǒng)服務(wù)器由少數(shù)技術(shù)人員使用,他們更看重系統(tǒng)的性能、穩(wěn)定性和安全性等方面的表現(xiàn)。
Web服務(wù)器
Web服務(wù)器即中間件服務(wù)器,是應(yīng)用程序的載體(容器),應(yīng)用程序只有在中間件服務(wù)器上才能正常的運(yùn)行被外界所訪問使用。對(duì)于window系統(tǒng)來說,IIS是微軟配套的web服務(wù)器,他們的搭配應(yīng)該是夫妻是之間的默契;apache 作為開源力量代表,不管在windows還是linux下面都非常得寵。因?yàn)?/span>linux與apache 都為開源產(chǎn)品且性能優(yōu)異,應(yīng)用非常廣泛。
· 淘寶網(wǎng)(阿里巴巴): Linux操作系統(tǒng) + Web 服務(wù)器: Apache
· 新浪:FreeBSD + Web 服務(wù)器:Apache
· Yahoo:FreeBSD + Web 服務(wù)器:自己的
· Google: 部分Linux + Web 服務(wù)器:自己的
· 百度:Linux + Web 服務(wù)器: Apache
· 網(wǎng)易:Linux + Web 服務(wù)器: Apache
· eBay: Windows Server 2003/8 (大量) + Web 服務(wù)器:Microsoft IIS
· MySpace: Windows Server 2003/8 + Web 服務(wù)器:Microsoft IIS
常用的系統(tǒng)架構(gòu)是:
· Linux + Apache + PHP + MySQL
· Linux + Apache + Java (WebSphere) + Oracle
· Windows Server 2003/2008 + IIS + C#/ASP.NET + 數(shù)據(jù)庫
· Window Server 2003/2008 + tomcat + MySql
提高系統(tǒng)性能的相關(guān)技術(shù)
網(wǎng)頁HTML 靜態(tài)化
其實(shí)大家都知道網(wǎng)頁靜態(tài)化,效率最高,消耗最小的就是純靜態(tài)化的 html 頁面,所以我們盡可能使我們的網(wǎng)站上的頁面采用靜態(tài)頁面來實(shí)現(xiàn),這個(gè)最簡單的方法其實(shí)也是最有效的方法。
但是對(duì)于大量內(nèi)容并且頻繁更新的網(wǎng)站,我們無法全部手動(dòng)去挨個(gè)實(shí)現(xiàn),于是出現(xiàn)了我們常見的信息發(fā)布系統(tǒng) CMS,像我們常訪問的各個(gè)門戶站點(diǎn)的新聞?lì)l道,甚至他們的其他頻道,都是通過信息發(fā)布系統(tǒng)來管理和實(shí)現(xiàn)的,信息發(fā)布系統(tǒng)可以實(shí)現(xiàn)最簡單的信息錄入自動(dòng)生成靜態(tài)頁面,還能具備頻道管理,權(quán)限管理,自動(dòng)抓取等功能,
對(duì)于一個(gè)大型網(wǎng)站來說,擁有一套高效,可管理的CMS 是必不可少的,除了門戶和信息發(fā)布類型的網(wǎng)站,對(duì)于交互性要求很高的社區(qū)類型網(wǎng)站來說,盡可能的靜態(tài)化也是提高性能的必要手段,將社區(qū)內(nèi)的帖子,文章進(jìn)行實(shí)時(shí)的靜態(tài)化,有更新的時(shí)候再重新靜態(tài)化也是大量使用的策略,像Mop 的大雜燴就是使用了這樣的策略,網(wǎng)易社區(qū)等也是如此同時(shí),html 靜態(tài)化也是某些緩存策略使用的手段,
對(duì)于系統(tǒng)中頻繁使用數(shù)據(jù)庫查詢但是內(nèi)容更新很小的應(yīng)用,可以考慮使用 html 靜態(tài)化來實(shí)現(xiàn),比如論壇中論壇的公用設(shè)置信息,這些信息目前的主流論壇都 可以進(jìn)行后臺(tái)管理并且存儲(chǔ)再數(shù)據(jù)庫中,這些信息其實(shí)大量被前臺(tái)程序調(diào)用,但是更新頻率很小,可以 考慮將這部分內(nèi)容進(jìn)行后臺(tái)更新的時(shí)候進(jìn)行靜態(tài)化,這樣避免了大量的數(shù)據(jù)庫訪問請(qǐng)求;
圖片服務(wù)器分離
對(duì)Web 服務(wù)器來說,不管是 Apache,IIS 還是其他容器,圖片是最消耗資源的,于是我們 有必要將圖片與頁面進(jìn)行分離,這是基本上大型網(wǎng)站都會(huì)采用的策略,他們都有獨(dú)立的圖片服務(wù)器,甚至很多臺(tái)圖片服務(wù)器,這樣的架構(gòu)可以降低提供頁面訪問請(qǐng)求的服務(wù)器系統(tǒng)壓力,并且可以保證系統(tǒng)不 會(huì)因?yàn)閳D片問題而崩潰,在應(yīng)用服務(wù)器和圖片服務(wù)器上,可以進(jìn)行不同的配置優(yōu)化,比如 apache 在配置 ContentType 的時(shí)候可以盡量少支持,盡可能少的 LoadModule,保證更高的系統(tǒng)消耗和執(zhí)行效率;
數(shù)據(jù)庫集群和庫表散列
大型網(wǎng)站都有復(fù)雜的應(yīng)用,這些應(yīng)用必須使用數(shù)據(jù)庫,那么在面對(duì)大量訪問的時(shí)候,數(shù)據(jù)庫的瓶頸很快就能顯現(xiàn)出來,這時(shí)一臺(tái)數(shù)據(jù)庫將很快無法滿足應(yīng)用,于是我們需要使用數(shù)據(jù)庫集群或者庫表散列。
在數(shù)據(jù)庫集群方面, 很多數(shù)據(jù)庫都有自己的解決方案, Oracle, Sybase 等都有很好的方案,常用的 MySQL 提供的 Master/Slave 也是類似的方案,您使用了什么樣的 DB,就參考相應(yīng)的解決方案來實(shí)施即可。
上面提到的數(shù)據(jù)庫集群由于在架構(gòu),成本,擴(kuò)張性方面都會(huì)受到所采用 DB 類型的限制,于是我們需要從應(yīng)用程序的角度來考慮改善系統(tǒng)架構(gòu),庫表散列是常用并且最有效的解決方案,我們?cè)趹?yīng)用程序中安裝 業(yè)務(wù)和應(yīng)用或者功能模塊將數(shù)據(jù)庫進(jìn)行分離,不同的模塊對(duì)應(yīng)不同的數(shù)據(jù)庫或者表,再按照一定的策略 對(duì)某個(gè)頁面或者功能進(jìn)行更小的數(shù)據(jù)庫散列,比如用戶表,按照用戶 ID 進(jìn)行表散列,這樣就能夠低成本 的提升系統(tǒng)的性能并且有很好的擴(kuò)展性,sohu 的論壇就是采用了這樣的架構(gòu),將論壇的用戶,設(shè)置,帖 子等信息進(jìn)行數(shù)據(jù)庫分離,然后對(duì)帖子,用戶按照板塊和 ID 進(jìn)行散列數(shù)據(jù)庫和表,最終可以在配置文件 中進(jìn)行簡單的配置便能讓系統(tǒng)隨時(shí)增加一臺(tái)低成本的數(shù)據(jù)庫進(jìn)來補(bǔ)充系統(tǒng)性能;
緩存
緩存一詞搞技術(shù)的都接觸過,很多地方用到緩存,網(wǎng)站架構(gòu)和網(wǎng)站開發(fā)中的緩存也是非常重要,這里先 講述最基本的兩種緩存,高級(jí)和分布式的緩存在后面講述, 架構(gòu)方面的緩存,對(duì) Apache 比較熟悉的人都能知道 Apache 提供了自己的緩存模塊,也可以使用外加的 Squid 模塊進(jìn)行緩存,這兩種方式均可以有效的提高 Apache 的訪問響應(yīng)能力, 網(wǎng)站程序開發(fā)方面的緩存,Linux 上提供的 Memory Cache 是常用的緩存接口,可以在 web 開發(fā)中使用, 比如用 Java 開發(fā)的時(shí)候就可以調(diào)用 MemoryCache 對(duì)一些數(shù)據(jù)進(jìn)行緩存和通訊共享, 一些大型社區(qū)使用了 這樣的架構(gòu), 另外, 在使用 web 語言開發(fā)的時(shí)候, 各種語言基本都有自己的緩存模塊和方法, PHP 有 Pear 的 Cache 模塊,Java 就更多了,net 不是很熟悉,相信也肯定有;
鏡像
鏡像是大型網(wǎng)站常采用的提高性能和數(shù)據(jù)安全性的方式,鏡像的技術(shù)可以解決不同網(wǎng)絡(luò)接入商和地域帶來的用戶訪問速度差異, 比如 ChinaNet 和 EduNet 之間的差異就促使了很多網(wǎng)站在教育網(wǎng)內(nèi)搭建鏡像站點(diǎn),數(shù)據(jù)進(jìn)行定時(shí)更新或者實(shí)時(shí)更新,在鏡像的細(xì)節(jié)技術(shù)方面,這里不闡述太深,有很多專業(yè)的現(xiàn)成的解決 架構(gòu)和產(chǎn)品可選,也有廉價(jià)的通過軟件實(shí)現(xiàn)的思路,比如 Linux 上的 rsync 等工具;
負(fù)載均衡
負(fù)載均衡將是大型網(wǎng)站解決高負(fù)荷訪問和大量并發(fā)請(qǐng)求采用的終極解決辦法,負(fù)載均衡技術(shù)發(fā)展了多年,有很多專業(yè)的服務(wù)提供商和產(chǎn)品可以選擇,下面介紹幾種常見的負(fù)載均衡。
DNS負(fù)載均衡技術(shù)是最早的負(fù)載均衡解決方案,它是通過DNS服務(wù)中的隨機(jī)名字解析來實(shí)現(xiàn)的,在DNS服務(wù)器中,可以為多個(gè)不同的地址配置同一個(gè)名字,而最終查詢這個(gè)名字的客戶機(jī)將在解析這個(gè)名字時(shí)得到其中的一個(gè)地址。因此,對(duì)于同一個(gè)名字,不同的客戶機(jī)會(huì)得到不同的地址,它們也就訪問不同地址上的Web 服務(wù)器,從而達(dá)到負(fù)載均衡的目的。
這種技術(shù)的優(yōu)點(diǎn)是,實(shí)現(xiàn)簡單、實(shí)施容易、成本低、適用于大多數(shù)TCP/IP應(yīng)用;但是,其缺點(diǎn)也非常明顯,首先這種方案不是真正意義上的負(fù)載均衡,DNS 服務(wù)器將Http請(qǐng)求平均地分配到后臺(tái)的Web服務(wù)器上,而不考慮每個(gè)Web服務(wù)器當(dāng)前的負(fù)載情況;如果后臺(tái)的Web服務(wù)器的配置和處理能力不同,最慢的 Web服務(wù)器將成為系統(tǒng)的瓶頸,處理能力強(qiáng)的服務(wù)器不能充分發(fā)揮作用;其次未考慮容錯(cuò),如果后臺(tái)的某臺(tái)Web服務(wù)器出現(xiàn)故障,DNS服務(wù)器仍然會(huì)把DNS 請(qǐng)求分配到這臺(tái)故障服務(wù)器上,導(dǎo)致不能響應(yīng)客戶端。最后一點(diǎn)是致命的,有可能造成相當(dāng)一部分客戶不能享受Web服務(wù),并且由于DNS緩存的原因,所造成的后果要持續(xù)相當(dāng)長一段時(shí)間(一般DNS的刷新周期約為24小時(shí))。所以在國外最新的建設(shè)中心Web站點(diǎn)方案中,已經(jīng)很少采用這種方案了。
在硬件四層交換產(chǎn)品領(lǐng)域,有一些知名的產(chǎn)品可以選擇,比如Alteon、F5等,這些產(chǎn)品很昂貴,但是物有所值,能夠提供非常優(yōu)秀的性能和很靈活的管理能力。Yahoo中國當(dāng)初接近2000臺(tái)服務(wù)器使用了三四臺(tái)Alteon就搞定了
軟件四層交換我們可以使用Linux上常用的LVS來解決,LVS就是Linux Virtual Server,他提供了基于心跳線heartbeat的實(shí)時(shí)災(zāi)難應(yīng)對(duì)解決方案,提高系統(tǒng)的魯棒性,同時(shí)可供了靈活的虛擬VIP配置和管理功能,可以同時(shí)滿足多種應(yīng)用需求,這對(duì)于分布式的系統(tǒng)來說必不可少。
一個(gè)典型的使用負(fù)載均衡的策略就是,在軟件或者硬件四層交換的基礎(chǔ)上搭建squid集群,這種思路在很多大型網(wǎng)站包括搜索引擎上被采用,這樣的架構(gòu)低成本、高性能還有很強(qiáng)的擴(kuò)張性。
反向代理服務(wù)器又稱為 WEB 加速服務(wù)器,它位于 WEB 服務(wù)器的前端,充當(dāng)WEB服務(wù)器的內(nèi)容緩存器,反向代理服務(wù)器是針對(duì) WEB 服務(wù)器設(shè)置的,后臺(tái) WEB 服務(wù)器對(duì)互聯(lián)網(wǎng)用戶是透明的,用戶只能看到反向代理服務(wù)器的地址,不清楚后臺(tái) WEB 服務(wù)器是如何組織架構(gòu)的。當(dāng)互聯(lián)網(wǎng)用戶請(qǐng)求 WEB 服務(wù)時(shí),DNS 將請(qǐng)求的域名解析為反向代理服務(wù)器的 IP 地址,這樣 URL 請(qǐng)求將被發(fā)送到反向代理服務(wù)器,由反向代理服務(wù)器負(fù)責(zé)處理用戶的請(qǐng)求與應(yīng)答、與后臺(tái) WEB 服務(wù)器交互。利用反向代理服務(wù)器減輕了后臺(tái) WEB 服務(wù)器的負(fù)載,提高了訪問速度,同時(shí)避免了因用戶直接與 WEB 服務(wù)器通信帶來的安全隱患。
-------------------------------------
這篇文章非常糾結(jié),以目前技術(shù)水平來講這塊的東西實(shí)屬班門弄斧。部分內(nèi)容從互聯(lián)網(wǎng)搜集。
聯(lián)系客服