一、項(xiàng)目介紹
這是一個(gè)跨地域的數(shù)據(jù)采集、傳輸與處理的運(yùn)維項(xiàng)目,其特點(diǎn)為:
1、 1、跨地域廣。覆蓋全國16個(gè)省會城市的數(shù)據(jù)采集點(diǎn)(托管在當(dāng)?shù)豂DC機(jī)房),北京城東、
西兩個(gè)數(shù)據(jù)處理點(diǎn),一個(gè)位于城中的業(yè)務(wù)處理與技術(shù)支持中心。
2、 2、業(yè)務(wù)要求的穩(wěn)定性高,7*24服務(wù),RTO與RPO要求高。
3、 3、設(shè)備種類多。有視頻信號接入設(shè)備,機(jī)頂盒(由于屬于民用設(shè)備,后期統(tǒng)計(jì)看該設(shè)備的
故障最高),由工控機(jī)承擔(dān)的采集機(jī),PC機(jī)做的預(yù)處理機(jī),還有存儲服務(wù)器,陣列柜,數(shù)據(jù)庫服務(wù)器以及其他網(wǎng)絡(luò)設(shè)備和傳輸線路等。
4、 4、牽扯人員多。包括IDC服務(wù)工程師,傳輸服務(wù)商,數(shù)據(jù)中心與業(yè)務(wù)中心的業(yè)務(wù)人員,技
術(shù)人員和管理人員等。
5、 5、溝通渠道復(fù)雜。每個(gè)環(huán)節(jié)都需要保證暢通的溝通渠道以保證和相關(guān)人員溝通信息。
二、二、項(xiàng)目目標(biāo)
在這個(gè)項(xiàng)目中本人承擔(dān)的角色,對內(nèi)是IT服務(wù)角色,對內(nèi)部的業(yè)務(wù)部門提供IT運(yùn)維支持,對外承擔(dān)管理服務(wù)商的角色,按與服務(wù)商簽訂的SLA進(jìn)行跟蹤管理。
項(xiàng)目的目標(biāo)是:建立一個(gè)運(yùn)維體系和信息化平臺,把所有業(yè)務(wù)環(huán)節(jié)、服務(wù)流程與人員納入到這個(gè)平臺中,有效合理的調(diào)配資源,及時(shí)發(fā)現(xiàn)處理重要事件,提高運(yùn)維效率,提高運(yùn)維質(zhì)量從而提高IT服務(wù)支持能力,提高用戶滿意度。
結(jié)合公司實(shí)際運(yùn)維需求與能力,最終把項(xiàng)目的實(shí)施范圍鎖定在“服務(wù)支持”流程上,包括服務(wù)臺功能,事件管理、問題管理、配置管理、變更管理和發(fā)布管理上。不求做的多,但求實(shí)用與質(zhì)量。
三、技術(shù)設(shè)計(jì)
因?yàn)槭强绲赜虻氖褂孟到y(tǒng),因此采用B/S系統(tǒng)架構(gòu),盡管可能再速度上和表現(xiàn)界面上有些缺陷,但對我們這個(gè)應(yīng)用來說這兩點(diǎn)都不是核心需求。在開發(fā)語言上選擇的是.NTE,數(shù)據(jù)庫選擇是SQL Server,這也是和我們目前產(chǎn)品采用一致的技術(shù)路線,方便日后的維護(hù)和對接。
服務(wù)臺
上次在1中說了項(xiàng)目的背景介紹,在這里開始介紹這個(gè)項(xiàng)目是如何實(shí)施的。
ITIL從哪里下手?聽到不少人是從“服務(wù)臺”來做的。如果按我的理想規(guī)劃來說,從“配置管理”做起比較合理,因?yàn)榕渲霉芾硎撬衅渌K的支持核心,它不但對其他模塊的有效執(zhí)行起到信息支持的功能,同時(shí)其他模塊也要及時(shí)的變更配置庫以保證配置庫的最新有效狀態(tài)。但這個(gè)實(shí)施的順序是有潛在的適應(yīng)要求的,對一個(gè)從無到有全新的系統(tǒng),這個(gè)順序無疑是正確的方式也容易操作,但具體到我這個(gè)項(xiàng)目,因?yàn)橐呀?jīng)在運(yùn)行當(dāng)中,是邊運(yùn)營邊建設(shè)的特點(diǎn),假如這個(gè)時(shí)候再教條的從“配置管理”做起,那我將面對的是花費(fèi)很大精力建立的“配置庫”無流程可以配合使用,因此也會導(dǎo)致無流程維護(hù)其內(nèi)容有效性的境地,這樣的話,等到最后體系都建立完成,就會發(fā)現(xiàn)以前建立的配置庫信息都失真無效,還要重新來過的情況。同時(shí),在這個(gè)項(xiàng)目上,先做“服務(wù)臺”也能立刻對外顯示成果,這個(gè)成果確實(shí)也是領(lǐng)導(dǎo)需要的,當(dāng)然也是我需要的。因此最后還是確定從“服務(wù)臺”開始了這個(gè)運(yùn)營體系的建設(shè)。
在ITIL中,服務(wù)臺是有別于其他流程的,它被ITIL定義為“職能”而非“流程”,這也就說明了在我們實(shí)現(xiàn)該模塊的時(shí)候,是要和其他模塊的實(shí)現(xiàn)有區(qū)別有不同的。我知道不少人在實(shí)際落實(shí)上并沒有注意到這點(diǎn),而是把“服務(wù)臺”當(dāng)成一般流程一樣看待,設(shè)計(jì)有專門的崗位,人員和流程,這點(diǎn)上我個(gè)人有些不同看法。”服務(wù)臺”的核心職能是“單點(diǎn)受理用戶事件,提供一般問題的處理支持和跟進(jìn)事件處理的全過程,及時(shí)反饋給用戶”等,這些事情如果照搬普通call center的模式,安排幾個(gè)人在接通用戶后,把問題再反饋給后續(xù)人員處理,那這個(gè)設(shè)置是沒什么意義的,也許他是提高了快速響應(yīng),但并沒有達(dá)到快速處理的目的。有價(jià)值的服務(wù)臺是能在最短時(shí)間內(nèi)提供有效的方案解決用戶出現(xiàn)的問題,而這需要有專業(yè)的知識,這不是普通熱線人員能達(dá)到的水平。但假如為達(dá)到這個(gè)水平而設(shè)置一群技術(shù)人員專職從事這個(gè)事物,那必將導(dǎo)致成本的上升,對我們這個(gè)公司來說是沒法支持這個(gè)模式的。
因此,在我們這個(gè)系統(tǒng)體系下,服務(wù)臺就是直接由技術(shù)維護(hù)人員和具有一定技術(shù)能力的業(yè)務(wù)骨干來充當(dāng)?shù)?,他們各自分管設(shè)備和流程的一部分,這些分工信息對用戶是公開的,因此當(dāng)各自分管的工作出現(xiàn)問題時(shí),用戶直接可以聯(lián)系到這些人員以得到及時(shí)的幫助,這些人對該事件負(fù)責(zé),也負(fù)責(zé)其他服務(wù)臺的職責(zé)。在這里可以看出,我并沒有拉出一個(gè)團(tuán)隊(duì)組建一個(gè)“服務(wù)臺”這么一個(gè)組織,而是規(guī)劃出一個(gè)虛擬的“服務(wù)臺”團(tuán)隊(duì),既是一線支持人員也是事件的管理者,當(dāng)這些人員遇到不能解決的問題時(shí),由他們負(fù)責(zé)后續(xù)的協(xié)調(diào)組織工作,直到事件處理接觸。
所以,在我的這個(gè)運(yùn)營體系中,“服務(wù)臺”是被設(shè)計(jì)成嵌入在“事件管理”的流程中,成為了這個(gè)流程的一部分。對“服務(wù)臺”的考核不是一天能受理多少客戶電話,而是有多少客戶需求被滿足。只要流程、制度設(shè)計(jì)的完善,能完成“服務(wù)臺”應(yīng)該有的職責(zé)就可以了,而不必要一定建立一個(gè)專職的團(tuán)隊(duì),尤其是在那些人力資源緊張的情況下。
事件管理
這個(gè)管理流程是整個(gè)系統(tǒng)最重要也是使用最多的,因此對它的嚴(yán)謹(jǐn)性,簡潔性和標(biāo)準(zhǔn)性要求也就比較高。
結(jié)合實(shí)際項(xiàng)目的運(yùn)營,我們把事件的起源分為兩大類:主動(dòng)事件和被動(dòng)事件。主動(dòng)事件是我們運(yùn)維人員等通過內(nèi)部的檢查機(jī)制或者預(yù)警機(jī)制發(fā)現(xiàn)的問題或者發(fā)起的事件。被動(dòng)事件是由系統(tǒng)使用的用戶在使用過程中發(fā)現(xiàn)的問題事件和咨詢等。這個(gè)分類主要是為了分析評估我們的檢查機(jī)制和預(yù)警機(jī)制的功效。
事件類型被分為:“故障”、“咨詢”、“新需求”和“維護(hù)通告”,基本上涵蓋了所有重要的事件。而同時(shí)又從事件診斷角度對每個(gè)事件進(jìn)行了分類,包括:電力、信號、網(wǎng)絡(luò)傳輸、硬件設(shè)備、操作系統(tǒng)、應(yīng)用軟件、數(shù)據(jù)庫和業(yè)務(wù)應(yīng)用等,這樣細(xì)分也是為了日后統(tǒng)計(jì)分析,有針對性的制定相關(guān)問題解決方案,充實(shí)知識庫和CMDB。需要指出的是,這里的分類要考慮到與CMDB的同步,這樣便于兩種數(shù)據(jù)的互通。
不是所有的事件都要立馬處理解決的,我們按照業(yè)務(wù)重要性(BIA)的特點(diǎn)和SLA的內(nèi)容,根據(jù)事件的嚴(yán)重程度和緊急程度量化事件的嚴(yán)重等級。其中嚴(yán)重程度參考故障影響范圍(頻道數(shù)和流程數(shù)等),緊急程度參考RTO和RPO的需求。事件的嚴(yán)重等級最后確認(rèn)為5級,并分別對每個(gè)級別做了行動(dòng)預(yù)案,規(guī)定了流程、職責(zé)和批準(zhǔn)關(guān)系等。
為了了解事件的實(shí)施進(jìn)展,一個(gè)事件的全過程被區(qū)分為以下幾個(gè)階段:事件創(chuàng)建、事件等待、處理中、解決完畢,評審?fù)戤叄录P(guān)閉。每個(gè)階段都記錄責(zé)任人,起止時(shí)間,用以評估每個(gè)環(huán)節(jié)和每個(gè)人的工作效率。各個(gè)階段的切換必須由一定授權(quán)的人員完成,且受時(shí)間發(fā)起短的服務(wù)臺人員的監(jiān)控下。這里需要特點(diǎn)談一下“評審?fù)戤叀钡淖饔?,有兩個(gè):一是確認(rèn)項(xiàng)目當(dāng)時(shí)的分類信息等是否正確,這樣保證以后的統(tǒng)計(jì)正確性。二是確認(rèn)事件是否引發(fā)“變更”流程,不論是知識庫還是CMDB,都需要在這個(gè)階段確認(rèn)。一個(gè)事件真正意義的結(jié)束關(guān)閉不是簡單的問題得到解決,一個(gè)完整的事件流程是所有對外問題,對內(nèi)分類、變更的相關(guān)流程都完成結(jié)束以后。
問題、變更&發(fā)布管理 [問題管理]
問題管理是事件管理的后續(xù)與推進(jìn),這個(gè)階段核心目標(biāo)是把未知名問題轉(zhuǎn)變?yōu)橹麊栴}。 問題管理的管理內(nèi)容很大程度上是來自于事件的統(tǒng)計(jì)分析,問題管理的“關(guān)注度”其實(shí)就是繼承了事件管理的“影響范圍”和“嚴(yán)重程度”的結(jié)果。在規(guī)劃問題管理的時(shí)候,其“等級度”這個(gè)屬性是要和事件管理的相呼應(yīng),這樣也是便于由事件管理到問題管理的平滑過度。不是所有的事件都要轉(zhuǎn)化為問題來處理,到底該管理什么?一般關(guān)注的是“嚴(yán)重程度高的事件”和經(jīng)過統(tǒng)計(jì)后“重復(fù)出現(xiàn)的事件”,嚴(yán)重程度高意味著嚴(yán)重度*影響范圍的指標(biāo)值就打,重復(fù)出現(xiàn)的事情的解決可以大大降低維護(hù)成本,減少資源,在這兩類問題上花費(fèi)資源是事半功倍的,別糾結(jié)在那些影響不大,或者偶爾才發(fā)生的事情上。
問題的創(chuàng)建不象事件,它還需要有個(gè)“審批”的過程,這也是確保資源的有效使用,避免過度反應(yīng)。其次問題管理還和SLA、配置庫、知識庫等相關(guān)聯(lián),這在設(shè)計(jì)問題管理流程以及出入接口的時(shí)候應(yīng)該注意的地方??傮w來說問題管理不是ITIL的難點(diǎn),關(guān)鍵要在實(shí)際中按設(shè)計(jì)的流程來執(zhí)行。
[變更管理與發(fā)布管理]
盡管在ITIL中這兩個(gè)是分開的獨(dú)立流程,但在我們的業(yè)務(wù)流程中這兩個(gè)環(huán)節(jié)是由一個(gè)部門先后順序執(zhí)行的,沒有在部門這個(gè)角度上再區(qū)分。本來變更管理的核心并不是執(zhí)行變更,而是變更需要在一定的授權(quán)和控制直下執(zhí)行。發(fā)布的核心也是在一定授權(quán)的情況下實(shí)施的,以保證最新制定的變更能及時(shí)有效正確的部署到實(shí)際流程中,如果僵化的分開執(zhí)行,不但加長了流程部門間的溝通協(xié)調(diào)工作,還可能導(dǎo)流程事件的延長,導(dǎo)致標(biāo)準(zhǔn)沒有及時(shí)下達(dá)到實(shí)際生產(chǎn)流程中,形成不一致。因此只要在授權(quán)上和控制上設(shè)計(jì)的合適就沒必要一定要兩個(gè)流程來分別處理。但所有的變更都要保留歷史和痕跡,這樣有利于跟蹤和職責(zé)管理。
變更管理中最重要的是配置庫相關(guān)的變更,同時(shí)還有就是發(fā)布的版本控制問題,變更發(fā)布的時(shí)間點(diǎn)控制問題,目的是要避免影響正常業(yè)務(wù)環(huán)境。
20xx年中國ITIL運(yùn)維市場需求總結(jié)
隨著中國企業(yè)信息化建設(shè)的深入推進(jìn),信息系統(tǒng)的規(guī)模不斷擴(kuò)大,業(yè)務(wù)對IT系統(tǒng)的依賴性越來越大,同時(shí)IT系統(tǒng)日趨復(fù)雜、系統(tǒng)維護(hù)要求越來越高。尤其是金融、電信、電力等重點(diǎn)行業(yè)對IT運(yùn)維管理的要求越來越高。ITIL作為運(yùn)維IT管理的新理論、方法和工具,正在發(fā)揮著越來越重要的作用。
ITIL作為管理IT的一種方法和理念,從初期有人提出它的概念到成為行業(yè)標(biāo)準(zhǔn)在世界范圍內(nèi)得以廣泛應(yīng)用,以ITIL作為規(guī)范的IT服務(wù)管理也成為一個(gè)受到重視的領(lǐng)域。那在即將過去的20xx年,中國企業(yè)用戶是日常網(wǎng)絡(luò)運(yùn)維管理中又遇到了怎樣的難題,他們究竟需要哪方面的解決方案,以下進(jìn)行詳盡分析。
ITIL運(yùn)維需求分析
一.基礎(chǔ)設(shè)施監(jiān)控需求
20xx年,企業(yè)對IT基礎(chǔ)設(shè)施仍然保持著高投入,隨著也產(chǎn)生了對基礎(chǔ)設(shè)施運(yùn)營維護(hù)需求。而對這些基礎(chǔ)設(shè)備的監(jiān)控不僅要求實(shí)時(shí)的,而且要求具有一定的顆粒度,能保證網(wǎng)絡(luò)環(huán)境的正常運(yùn)行。一般來說,需要用網(wǎng)絡(luò)設(shè)備、服務(wù)器、用戶上網(wǎng)行為以及安全方面進(jìn)行充分地管理,才能確保一個(gè)企業(yè)內(nèi)網(wǎng)的安全、穩(wěn)定。
基礎(chǔ)設(shè)施作為網(wǎng)絡(luò)正常運(yùn)作的基石,是IT運(yùn)維人員關(guān)注和關(guān)心的重點(diǎn)。如何保障快速查看網(wǎng)絡(luò)中所有的網(wǎng)絡(luò)信息、網(wǎng)絡(luò)全局、運(yùn)作
情況,如何及時(shí)預(yù)防發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備故障和隱患,如何快速操作控制不同廠商、型號的網(wǎng)絡(luò)設(shè)備,都是IT運(yùn)維人員的管理需求。
企業(yè)許多核心業(yè)務(wù)都運(yùn)轉(zhuǎn)在服務(wù)器上,而一些公司的web服務(wù)、網(wǎng)站等都需要服務(wù)器的支持,因?yàn)橄到y(tǒng)管理員需求維護(hù)這些服務(wù)器。網(wǎng)絡(luò)管理人員需要配置管理服務(wù)、安裝管理DNS服務(wù)器、為終端用戶頒發(fā)許可證,管理本地和遠(yuǎn)程式終端等。通過以上操作,服務(wù)器才能真正為企業(yè)服務(wù),而服務(wù)器正常運(yùn)轉(zhuǎn)后,服務(wù)器的網(wǎng)絡(luò)環(huán)境、運(yùn)行狀態(tài)、參數(shù)設(shè)置等情況又是需要管理員時(shí)刻關(guān)注的。
二.業(yè)務(wù)服務(wù)管理需求
企業(yè)在在實(shí)施良好的基礎(chǔ)設(shè)施管理后,網(wǎng)絡(luò)運(yùn)維需求就提升到新的層面,需要進(jìn)行精細(xì)化的業(yè)務(wù)服務(wù)管理,這也是企業(yè)ITIL運(yùn)維管理的精華之所在,滿足IT服務(wù)于企業(yè)業(yè)務(wù)的管理層次。企業(yè)的IT運(yùn)維管理在某種程度上說是重復(fù)性的工作,既然有處理IT故障的經(jīng)驗(yàn),就希望這些經(jīng)驗(yàn)?zāi)芊e累成知識,成為企業(yè)IT管理的智能庫,進(jìn)而更好地為流程化的企業(yè)IT管理服務(wù)。
1、服務(wù)流程管理需求
在以服務(wù)制勝的今天,IT部門非常需要有一套好的管理理念和管理工具來支撐服務(wù)體系。信息中心需要為IT運(yùn)維人員與服務(wù)的用戶之間提供唯一的接口(SPOC,Single Point of Contact)。用戶對不同專業(yè)部分的咨詢、問題和投訴都通過該接口進(jìn)行,避免用戶與各級支持人員直接聯(lián)系帶來的種種弊病,如出現(xiàn)不同問題找不同支持人
員、找不到人、問題得不到及時(shí)反饋和解決等等現(xiàn)象。通過應(yīng)用IT服務(wù)流程管理體系和平臺,用戶可以很好地將一系列的服務(wù)以體系化的形式來進(jìn)行前臺、后臺的有效關(guān)聯(lián),更好地提供IT服務(wù)。如廣通推出的基于ITIL規(guī)范的Broadview COSS 解決方案,就很好地應(yīng)用和推廣了ITIL服務(wù)臺管理、事件管理流程、問題管理、配置管理等服務(wù)流程。
2、知識庫管理需求
調(diào)查顯示知識庫管理是企業(yè)ITIL運(yùn)維系統(tǒng)建設(shè)中的一個(gè)重點(diǎn)需求。在ITIL運(yùn)維知識庫管理中,所有可以為處理事件和問題、排查日常工作中遇到的潛在隱患提供有效幫助的信息,及與運(yùn)行維護(hù)及服務(wù)臺、二線和三線支持人員日常工作相關(guān)的有效信息,都應(yīng)該提交到知識庫中。
信息中心以往經(jīng)常會出現(xiàn)這種情況:網(wǎng)絡(luò)出現(xiàn)故障,一個(gè)人去解決花掉一個(gè)小時(shí);過段時(shí)間,同樣的問題再出現(xiàn),另一個(gè)人處理,又另外再花費(fèi)1個(gè)小時(shí)。這樣導(dǎo)致知識沒有得到及時(shí)的沉淀和積累,而基于ITIL的廣通Broadview解決方案可以通過知識庫管理來解決這些問題。
ITIL運(yùn)維市場分析
20xx年的國內(nèi)ITIL運(yùn)維市場格局可以大致分為以前幾種情況:國際知名廠商的ITIL運(yùn)維服務(wù)在高端行業(yè)如電信、金融等占據(jù)了較
多份額,相比國內(nèi)廠家更具有技術(shù)實(shí)力和服務(wù)優(yōu)勢;中端市場如省級運(yùn)維項(xiàng)目,國產(chǎn)ITIL運(yùn)維廠商開始彰顯實(shí)力,因?yàn)楸就粱膬?yōu)勢使得軟件更符合用戶的使用習(xí)慣,同時(shí)也能滿足絕大多數(shù)企業(yè)用戶的需求;對于一些信息化剛起步的初級用戶市場,ITIL運(yùn)維工具更多的起到指建設(shè)導(dǎo)向作用,需為實(shí)現(xiàn)ITIL的服務(wù)流程打下前期基礎(chǔ),國內(nèi)廠商在此領(lǐng)域競爭也較為激烈。
聯(lián)系客服