詳情參考“企業(yè)監(jiān)控利器-zabbix”http://waringid.blog.51cto.com/65148/904201。
在瀏覽器中輸入http://192.168.0.189進(jìn)入監(jiān)控軟件登陸界面(圖二),登陸用戶名和密碼為network,登陸后的界面如圖三所示。
圖二:登錄界面
圖三:監(jiān)控軟件框架圖
整個(gè)監(jiān)控軟件界面共分為七部份,分別是:瀏覽器欄、一級菜單欄、二級菜單欄、用戶設(shè)定欄、時(shí)間條和圖形顯示區(qū)。
信息部所使用的的zabbix版本為2.0;數(shù)據(jù)據(jù)版本mysql5.1;zabbix客戶端代理安裝在c:\zabbix目錄下,該文件夾大小占用600k~1M;成功安裝后在系統(tǒng)中生成服務(wù)“Zabbix Agent”,服務(wù)啟動(dòng)方式為自動(dòng)(如圖一所示);監(jiān)控狀態(tài)下windows監(jiān)控代理每天(24小時(shí))的數(shù)據(jù)傳輸量是14.0625K,對系統(tǒng)性能的影響小到可以可以忽略不計(jì)。當(dāng)監(jiān)控參數(shù)約為100個(gè)時(shí)(其中基本參數(shù)66個(gè),IIS或SQL參數(shù)16到27個(gè)不等),每分鐘取一個(gè)性能值(100*60*24=14400Byte)。
圖一:zabbix agent服務(wù)圖
在Windows操作系統(tǒng)中,查看系統(tǒng)的性能可以通過系統(tǒng)自帶的性能監(jiān)視器查看操作系統(tǒng)的性能指標(biāo)(如圖二五、二六所示)。
圖二五:windows性能監(jiān)視器
圖二六:windows性能監(jiān)視器
Zabbix可以通過相關(guān)參數(shù)直接獲取windows系統(tǒng)的監(jiān)控值并以圖形的方式呈現(xiàn)。下面列出一些常見的windows監(jiān)控參數(shù)。
Combined CPU Utilization % CPU利用率
Physical Disk Percent Idle Time 物理磁盤空閑比
Paging File % Usage 虛擬內(nèi)存利用率
Average Read Transfer Time to Disk _Total 磁盤平均讀周期
Average Write Transfer Time to Disk _Total 磁盤平均寫周期
IIS Current Connections IIS當(dāng)前連接數(shù)
ASP.Net Requests/Sec .NET請求數(shù)
SQL: Number of Connections SQL連接數(shù)
SQL: % Processor Time SQL的CPU利用率
SQL: Number Failed Jobs SQL失敗的作業(yè)數(shù)
2.4.1一級菜單欄 “監(jiān)控”Monitoring項(xiàng)(圖三)提供監(jiān)控設(shè)備的詳細(xì)數(shù)據(jù),共十項(xiàng)二級菜單,包括:“儀表盤”項(xiàng)Dashboard、“總覽”項(xiàng)Overview、WEB項(xiàng)、“最新數(shù)據(jù)”項(xiàng)Latest data、“觸發(fā)器”項(xiàng)Triggers、“事件”項(xiàng)Events、“圖形”項(xiàng)Graphs、“多圖顯示”項(xiàng)Screen、“拓?fù)鋱D”項(xiàng)Maps、IT Services項(xiàng)。
圖三:Monitoring菜單
2.4.2一級菜單欄Inventory“資產(chǎn)”項(xiàng)(圖四)主要記錄被監(jiān)控設(shè)備的配置清單(較少使用)。二級菜單包括資產(chǎn)總覽及主機(jī)項(xiàng)。
圖四:Inventory菜單
2.4.3一級菜單欄Reports“報(bào)告”項(xiàng)(圖五)主要提供被監(jiān)控設(shè)備的性能報(bào)告(較少使用)。二級菜單包括“可用性報(bào)告”Avaliablity report、“前100個(gè)觸發(fā)數(shù)據(jù)”Triggers top 100、“柱形圖”Bar reports。
圖五:Reports菜單
2.5.1 設(shè)備故障事件詳情
登入zabbix后首先進(jìn)入“maps”項(xiàng)查看整體網(wǎng)絡(luò)的狀況,存在問題的服務(wù)器會(huì)顯示警告狀態(tài)(如圖六所示)。點(diǎn)擊該問題服務(wù)器后在彈出的菜單中選擇“status of triggers”可查看該問題的具體描述(如圖七所示),在圖七中詳細(xì)記錄了問題服務(wù)器的主機(jī)名稱、問題等級、問題的持續(xù)時(shí)間等狀態(tài),其中名稱項(xiàng)“name”中記錄了觸發(fā)問題的原因,點(diǎn)擊該欄會(huì)彈出觸發(fā)器的菜單項(xiàng),其中的圖形“graph”項(xiàng)中以圖形方式顯示數(shù)據(jù)(如圖八所示)。本例中服務(wù)器故障的觸發(fā)原因是“Low Percent free disk space on 192.168.0.58 volume c:”C盤空間不足,還可以通過圖形項(xiàng)“graph”中找到該服務(wù)器顯示C盤占用空間(如圖九所示),需要注意的是要選擇正確的組“group”和主機(jī)“host”及顯示的圖形“C:Used Disk Space Pie Graph”。
圖六:maps狀態(tài)圖
圖七:服務(wù)器事件圖
圖八:服務(wù)器故障事件數(shù)據(jù)圖
圖九:C盤空間占用圖
2.5.2 組“group”的說明
按信息部規(guī)劃分為多個(gè)組,對應(yīng)關(guān)系如下表所示:
2.5.3 各組主機(jī)“Host”的說明
主機(jī)“host”表示對應(yīng)的服務(wù)器(包括支持的網(wǎng)絡(luò)設(shè)備,操作系統(tǒng)、虛擬操作系統(tǒng)等),當(dāng)選中組“group”后會(huì)在主機(jī)“host”欄中顯示該組對應(yīng)的主機(jī)設(shè)備,各組對應(yīng)的主機(jī)如下表所示。
2.5.4 時(shí)間條說明
在圖形顯示項(xiàng)中最上層的是時(shí)間狀態(tài)欄。通過時(shí)間欄可選擇按每小時(shí)、每2小時(shí)、每3小時(shí)、每6小時(shí)、每12小時(shí)、每天、每周、每2周、每月、所有天數(shù)這些方式查看圖形。如圖十八、十九、二十、二十一所示。
圖十八:時(shí)間軸圖
圖十九:每小時(shí)圖
圖二十:每天圖
圖二十一:所有天數(shù)圖
時(shí)間條除了可以選擇按不同的時(shí)間點(diǎn)顯示外,還可以通過拉動(dòng)時(shí)間條方塊的方式顯示特定時(shí)間的狀態(tài)圖,如圖二十二所示。
圖二十二:時(shí)間條圖
在圖二十二中,上面箭頭是時(shí)間條,下面箭頭表示詳細(xì)的時(shí)間。本例中選擇按每小時(shí)方式顯示,下半部份的時(shí)間則以分鐘的方式顯示。當(dāng)移動(dòng)時(shí)間條時(shí),圖形和下半部份的時(shí)間一起變化。
圖二十三:時(shí)間說明圖
除了上面幾種方式查看圖表外,也可以直接選定相應(yīng)的曲線查看詳細(xì)的數(shù)據(jù)圖,如圖二十三。上圖中第2處即為手工選定方式查看數(shù)據(jù),其中圖中灰色部份(標(biāo)識(shí)1)表示下班時(shí)間,白色部份表示上班時(shí)間(周一至周五,8:30至17:30)。
2.5.5 常見圖形“Graph”的說明
當(dāng)選中主機(jī)所有的組“group”和相應(yīng)的主機(jī)“host”后,就需選擇和該主機(jī)相關(guān)的顯示圖形,常用的性能監(jiān)控圖有以下幾種。
C: Used Disk Space Pie Graph
C盤可用空間圖,記錄C盤整體空間大小和已使用空間的詳細(xì)值和占用百分比,當(dāng)C盤的可用空間低于整個(gè)C盤的5%時(shí)會(huì)觸發(fā)“C盤可用空間不足5%的報(bào)警,如圖十所示。
圖十:C盤空間占用圖
CPU, Disk % Utilization
CPU、磁盤及虛擬內(nèi)存利用率圖,記錄虛擬內(nèi)存使用率“Paging File(_Total)\% Usage”、物理磁盤空閑率“PhysicalDisk(_Total)\% Idle Time”及CPU使用率“Processor(_Total)\% Processor Time”。其中10分鐘內(nèi)磁盤空閑利用率低于30%或10分鐘內(nèi)CPU利用率達(dá)到90%將觸發(fā)報(bào)警。如圖十一所示。
圖十一:CPU、磁盤及虛擬內(nèi)存利用率圖
Interface Traffic
網(wǎng)卡流量圖,記錄設(shè)備的網(wǎng)卡流量圖。網(wǎng)卡流量統(tǒng)計(jì)分為出、入兩個(gè)方向“net.if.in[{IPADDRESS}]”“net.if.out[{IPADDRESS}]”,如圖十二所示。
圖十二:網(wǎng)卡流量圖
Local File Systems % Free
邏輯磁盤空閑狀態(tài)圖,記錄磁盤的空間使用率“vfs.fs.size[c:,pfree]”。對于系統(tǒng)不存在的磁盤,監(jiān)控值顯示“no data”,如圖十三所示。
圖十三:磁盤空間使用圖(空閑率)
Memory Usage
內(nèi)存使用圖,記錄整體內(nèi)存大小“vm.memory.size[total]”及內(nèi)存可用空間大小“vm.memory.size[free]”。如圖十四所示。
圖十四:內(nèi)存空間圖
Read/Write Disk Response Time
磁盤讀/寫響應(yīng)時(shí)間,記錄物理磁盤的讀響應(yīng)時(shí)間“PhysicalDisk(_Total)\Avg. Disk sec/Read”以及寫響應(yīng)時(shí)間“PhysicalDisk(_Total)\Avg. Disk sec/Write”。其中在10分鐘內(nèi)如果磁盤讀操作時(shí)間超過30ms或?qū)懖僮鲿r(shí)間超過50ms將觸發(fā)報(bào)警提示。如圖十五所示。
圖十五:磁盤讀寫響應(yīng)時(shí)間圖
MicrosoftSQLServerConnJob
數(shù)據(jù)庫性能圖,記錄數(shù)據(jù)庫軟件(包括sql2000、sql2005、sql2008)性能。每秒完全掃描次數(shù)“SQLServer:Access Methods\Full Scans/sec”、失敗退出的作業(yè)數(shù)“SQLAgent:Jobs(_Total)\Failed jobs”、當(dāng)前與SQL Server連接的用戶數(shù)“SQLServer:General Statistics\User Connections”、每秒大容量復(fù)制的數(shù)據(jù)量(KB)“SQLServer:Databases(_Total)\Transactions/sec”。如圖十六所示。
圖十六:SQL Server性能圖
IIS Counters Overview
WEB性能圖,記錄WEB服務(wù)器的連接數(shù)“Web Service(_Total)\Current Connections”及當(dāng)前asp.NET請求數(shù)“ASP.NET\Requests Current”。如圖十七所示。需注意WEB服務(wù)器默認(rèn)最大的連接數(shù)為4000(4K)。
圖十七:web服務(wù)性能圖
最新數(shù)據(jù)“l(fā)ast data”用來顯示該主機(jī)所有的監(jiān)控?cái)?shù)據(jù)(記錄主機(jī)最后獲取的數(shù)據(jù)值,也可以圖形顯示),登錄后點(diǎn)擊“Monitoring”-“l(fā)ast data”進(jìn)入該選項(xiàng)。
該選項(xiàng)顯示的內(nèi)容會(huì)隨主機(jī)監(jiān)控參數(shù)的不同而變化,對于windows主機(jī),主要包含以下內(nèi)容(如圖二十四所示):
圖二四:last data圖
名稱“Name”部份用于描述監(jiān)控的內(nèi)容;最后更新時(shí)間“l(fā)ast check”用于顯示最新數(shù)據(jù)的更新時(shí)間;最新數(shù)據(jù)“l(fā)ast value”用于顯示最新的監(jiān)控值;更改“change”表示本次數(shù)據(jù)與上次數(shù)據(jù)的差值;歷史“history”顯示該監(jiān)控項(xiàng)的歷史圖形。
3.1.1 可用性“Availability”
圖二七:availability圖
可用性“Availability”項(xiàng)主要記錄內(nèi)存和磁盤的可用性共包含9項(xiàng)內(nèi)容,分別是:
Free disk space on c: C盤可用空間
Free disk space on d: D盤可用空間
Free memory 可用內(nèi)存空間
Memory Commit Limit (RAM plus Page File) 內(nèi)存可用數(shù)(包括虛擬內(nèi)存)
Percent Free disk space on c: C盤可用空間百分比
Percent Free disk space on d: D盤可用空間百分比
Total disk space on c: C盤容量
Total disk space on d: D盤容量
Total memory 內(nèi)存大小
3.1.2 CPU
CPU項(xiàng)(如圖二八所示)主要記錄CPU的性能及CPU的使用情況共包含6項(xiàng)內(nèi)容:
圖二八:CPU圖
Combined CPU Utilization % CPU處理非閑置進(jìn)程的百分比
CPU Count CPU內(nèi)核數(shù)量(個(gè)數(shù)*核*線程數(shù))
CPU Utillization CPU利用率
Processor load CPU負(fù)載(一分鐘)
Processor load15 CPU負(fù)載(十五分鐘)
Processor load5 CPU負(fù)載(五分鐘)
3.1.3 磁盤“DISK”
DISK項(xiàng)(如圖二九所示)記錄磁盤的性能,包括磁盤的讀、寫、隊(duì)列的傳輸及空閑使用等指標(biāo),共包含5項(xiàng)內(nèi)容:
圖二九:DISK圖
Average Read Transfer Time to Disk _Total 磁盤平均讀響應(yīng)時(shí)間
Average Write Transfer Time to Disk _Total 磁盤平均寫響應(yīng)時(shí)間
Avg. Combined(Read/Write) Transfer Operation to Disk 磁盤讀寫響應(yīng)時(shí)間
Physical Disk Avg. Queue Length 磁盤平均數(shù)據(jù)隊(duì)列響應(yīng)
Physical Disk Percent Idle Time 磁盤空閑率
3.1.4 文件系統(tǒng)“Filesystem”
Filesystem項(xiàng)(如圖三十所示)記錄磁盤文件傳輸時(shí)隊(duì)列的磁盤傳輸時(shí)間,共2項(xiàng)內(nèi)容:
圖三十:Filesystem圖
Average disk read queue length 磁盤隊(duì)列讀周期(平均)
Average disk write queue length 磁盤隊(duì)列寫周期(平均)
3.1.5 通用“General”、內(nèi)存“Memory”、操作系統(tǒng)“OS”
General項(xiàng)記錄主機(jī)的開機(jī)時(shí)間,而Memory項(xiàng)主要記錄虛擬內(nèi)存的利用率,OS記錄主機(jī)的線程數(shù)量(如圖三一所示),共3項(xiàng)內(nèi)容:
圖三一:Memory、General、OS圖
Host uptime (in sec) 主機(jī)已運(yùn)行時(shí)間
Paging File % Usage 虛擬內(nèi)存利用率
Number of threads 主機(jī)上運(yùn)行的線程數(shù)量
3.1.6 網(wǎng)絡(luò)“Network”
Network項(xiàng)(如圖三二)記錄主機(jī)網(wǎng)卡的流量,包括兩個(gè)方向(IN、OUT),共2項(xiàng)內(nèi)容:
圖三二:network圖
nic0_in 進(jìn)入網(wǎng)卡的流量
nic0_out 經(jīng)網(wǎng)卡出去的流量
3.1.7 性能“Performance”
Performance項(xiàng)(圖三三)記錄磁盤的性能,包括邏輯磁盤和物理磁盤的性能,共3項(xiàng)目內(nèi)容:
圖三三:Performance圖
Average disk read queue length 讀取請求(磁盤在實(shí)例間隔中列隊(duì)的)的平均數(shù)
Physical Disk Avg. Queue Length 磁盤上平均的請求數(shù)量
Physical Disk Current Queue Length 磁盤上當(dāng)前的請求數(shù)量
3.1.8 IIS
IIS項(xiàng)(圖三四)記錄IIS及WEB相關(guān)的性能值,包括服務(wù)的狀態(tài)和相關(guān)的性能點(diǎn),共9項(xiàng)內(nèi)容:
圖三四:IIS圖
HTTP SSL: Service State SSL服務(wù)狀態(tài)
IIS Admin: Service State IIS Admin服務(wù)狀態(tài)
IIS Current Anonymous Users 當(dāng)前IIS匿名訪問用戶數(shù)
IIS Current Connections IIS當(dāng)前連接數(shù)
IIS Current NonAnonymous Users IIS當(dāng)前非匿名用戶數(shù)
IIS Get Requests/s IIS Get請求數(shù)/秒
IIS Head Requests/s IIS Head請求數(shù)/秒
IIS Post Requests/s IIS Post請求數(shù)/秒
Microsoft IIS: Service State IIS服務(wù)狀態(tài)
3.1.9 MSSQL
MSSQL項(xiàng)(圖三五)記錄microsoft SQL數(shù)據(jù)庫的性能,包括服務(wù)狀態(tài)及相關(guān)性能值,共15項(xiàng)內(nèi)容:
圖三五:MSSQL圖
SQL: Buffer cache hit ratio SQL緩沖管理器/緩沖命中率
SQL: Data File Size 數(shù)據(jù)庫文件大小
SQL: Database Pages SQL緩沖管理器/數(shù)據(jù)庫頁
SQL: Full Tables Scans/sec SQL訪問方法/完全訪問/秒
SQL: Lazy writes/sec SQL緩沖管理器/惰性寫入/秒
SQL: Lock Waits per second SQL鎖等待/秒
SQL: Log File Size 日志文件大小
SQL: Number Failed Jobs 失敗的作業(yè)數(shù)
SQL: Number of Connections 當(dāng)前的SQL連接數(shù)
SQL: Number of Deadlocks per second SQL每秒死鎖數(shù)
SQL: Service State - SQL Server SQL服務(wù)狀態(tài)
SQL: SQLServer Buffer Manager Total pages SQL緩沖管理器/全部頁
SQL: Target Server Memory SQL目標(biāo)服務(wù)器內(nèi)存
SQL: Total Server Memory SQL總的服務(wù)器內(nèi)存
SQL: Transactions per second SQL每秒大容量復(fù)制的數(shù)據(jù)量
3.2 報(bào)表功能Reports
在zabbix中關(guān)于報(bào)表的功能有三項(xiàng):
Avaliability report:(圖三六)整個(gè)系統(tǒng)可用的系統(tǒng)報(bào)表提供過濾功能。
圖三六:avaliability report圖
Most busy triggers top 100:(圖三七)提供最常用的triggers 預(yù)覽。
圖三七:triggers top 100圖
Bar report :(圖三八)可定制報(bào)表可以報(bào)多個(gè)報(bào)表整合到一起。
圖三八:bar report圖
圖三九:面板頁
Zabbix支持多種網(wǎng)絡(luò)方式下的監(jiān)控,可通過分布式的方式部署和安裝監(jiān)控代理,整個(gè)架構(gòu)如(圖四十)所示。
圖四十:架構(gòu)圖
2.2中詳細(xì)介紹了數(shù)據(jù)在zabbix中的存儲(chǔ)方式,對于單個(gè)監(jiān)控值zabbix在后臺(tái)數(shù)據(jù)庫中會(huì)存入三個(gè)數(shù)值(最大值、最小值、平均值),現(xiàn)階段數(shù)據(jù)庫空間占用(30臺(tái)設(shè)備44天數(shù)據(jù))情況(如圖四一)所示。
Zabbix存在的性能瓶頸主要在于磁盤的性能(數(shù)據(jù)庫的寫操作),而CPU及內(nèi)存占用相對較低,如圖四二、圖四三所示。
圖四三:數(shù)據(jù)庫性能
該文檔下載地址:http://down.51cto.com/data/462129
本文出自 “虛擬的現(xiàn)實(shí)” 博客,轉(zhuǎn)載請與作者聯(lián)系!
聯(lián)系客服