可用性管理目標(biāo)
可用性管理是對(duì)于 IT 是一項(xiàng)非常重要的活動(dòng),因?yàn)殄e(cuò)誤計(jì)算或誤解可用性可能會(huì)使企業(yè)遭受重大損失。例如,一個(gè)新的應(yīng)用程序可能要求服務(wù)臺(tái)支持從每天 16 小時(shí)每周 5 天擴(kuò)展到每天 24 小時(shí)每周 7 天,這項(xiàng)服務(wù)的代價(jià)很高。從早期的主機(jī)時(shí)期開始,管理可用性已經(jīng)成為一個(gè)對(duì) IT 的挑戰(zhàn),那時(shí)只有在白天主機(jī)上才提供聯(lián)機(jī)服務(wù),到了晚上,計(jì)算機(jī)需要進(jìn)行批處理。如果夜間批處理窗口未完成批處理工作,則聯(lián)機(jī)系統(tǒng)的可用性將會(huì)延遲到第二天。否則,如果客戶晚于預(yù)定的時(shí)間關(guān)閉它們的聯(lián)機(jī)系統(tǒng),批處理工作就會(huì)推遲啟動(dòng),而且會(huì)丟失其處理目標(biāo)。目前,我們擁有更多的專用資源,但是確??捎眯缘膯栴}仍然存在。接下來(lái)我們看看 ITIL 設(shè)定的管理可用性的目標(biāo):
“可用性管理”流程的目標(biāo)就是優(yōu)化 IT 基礎(chǔ)設(shè)施的容量、服務(wù)和支持的公司,以便提供有成本效益且可使企業(yè)滿足其業(yè)務(wù)目標(biāo)的恒定的可用性級(jí)別。
一些類似的詞和短語(yǔ)再次出現(xiàn)在該目標(biāo)中:“優(yōu)化”、“成本效益”和“業(yè)務(wù)目標(biāo)”。這些詞和短語(yǔ)已經(jīng)在前面討論過,因?yàn)樗鼈兊囊馑际冀K是相同的,所以不需要再次進(jìn)行說明。仍然有一些重要的要素需要考慮:“優(yōu)化 IT 基礎(chǔ)設(shè)施的容量、服務(wù)和支持的公司”:“容量”和“優(yōu)化”這兩個(gè)詞在一起表達(dá)得很好,因?yàn)椴⒉皇鞘冀K都要求最大化,而且通常也無(wú)法實(shí)現(xiàn)最大化。參加馬拉松的人們不可能全部都成為世界記錄保持者,但是那些以此為樂趣的人們?nèi)匀粐L試提高他們的賽跑能力。為什么不最大化呢?原因很簡(jiǎn)單,如果我們同時(shí)擁有一份全職工作,最大化要求很多我們無(wú)法提供的能力。該目標(biāo)要素告訴我們不要試圖去實(shí)現(xiàn)最大化,因?yàn)檫@樣就不會(huì)留有擴(kuò)展和發(fā)展的靈活性。它還告訴我們要利用我們所擁有的資源來(lái)做好工作。該目標(biāo)列出了三個(gè)組成部分:IT 基礎(chǔ)設(shè)施、服務(wù)和支持的公司。“IT 基礎(chǔ)設(shè)施”和“服務(wù)”從字面上就可以理解,但“支持的公司”需要一個(gè)簡(jiǎn)短的說明。這是指從 IT 公司外部供應(yīng)資源的公司,如工程服務(wù)公司、外包商和電信公司。對(duì)于這些實(shí)體,優(yōu)化它們的容量意味著確保它們滿足其合同條款的要求,如 SLM 和客戶之間達(dá)成的可用性條款。如果 IT 資源和支持的公司之間存在沖突,則說明您未滿足該目標(biāo)要素的要求。 “交付有成本效益且可使企業(yè)滿足其業(yè)務(wù)目標(biāo)的恒定的可用性級(jí)別”:這句話道出了該目標(biāo)的核心所在。成本效益依賴于 SLM 和客戶之間達(dá)成的可用性級(jí)別。因此,在不首先考慮“可用性管理”的情況下,不應(yīng)該存在客戶與 SLM 達(dá)成的可用性級(jí)別。當(dāng)在 IT 和客戶之間達(dá)成可用性級(jí)別時(shí),是否涉及了“可用性管理”?如果沒有,您可能面臨著危險(xiǎn)。恒定的可用性級(jí)別意味著由 IT 提供的服務(wù)和系統(tǒng)的可用性是基于一致、持續(xù)的原則交付的。換言之,對(duì)于為提供既定的可用性而出現(xiàn)的任何故障都應(yīng)予以調(diào)查并采取措施,以防止將來(lái)再次出現(xiàn)這樣的故障。請(qǐng)注意,即使當(dāng)您交付未實(shí)現(xiàn)的可用性時(shí)這也適用,但它不能很好地達(dá)到您的目標(biāo)。例如,您已經(jīng)與您的客戶達(dá)成 99.9% 的可用性目標(biāo),而您卻只達(dá)到了 99.8%。這項(xiàng)工作完成的很好,但仍有 0.1% 的差距,因?yàn)槿绻涣⒓唇鉀Q這些故障,它們可能會(huì)越積越多,使您進(jìn)一步遠(yuǎn)離目標(biāo)。ITIL 將其稱之為“可靠性管理”,它是“可用性管理”的一部分。您是否調(diào)查了所有可用性故障的原因?您是否采取措施來(lái)防止它們?cè)俅伟l(fā)生?如果對(duì)以上兩個(gè)問題的回答有一個(gè)為“否”,那么您就不會(huì)達(dá)到該目標(biāo)。使公司滿足其業(yè)務(wù)目標(biāo)意味著“服務(wù)級(jí)別管理”應(yīng)該到位。如果不到位,負(fù)責(zé)“可用性管理”的 IT 人員應(yīng)該定期與他們的客戶進(jìn)行協(xié)商,以確保他們提供的服務(wù)能夠滿足客戶的需求。該要素應(yīng)該是對(duì) IT 的一個(gè)永久暗示,IT 應(yīng)該服務(wù)于業(yè)務(wù)群體而不是由業(yè)務(wù)群體為其服務(wù)。 如果您不定期查看業(yè)務(wù)群體的可用性目標(biāo),您就不會(huì)滿足該目標(biāo)要求的要求。一個(gè)來(lái)自調(diào)查反饋的跡象表明,盡管您達(dá)到了您的目標(biāo),但客戶仍然不高興。另一個(gè)跡象表明您雖然每個(gè)月都超出可用性目標(biāo),但卻從未提高過它們。雖然這可能對(duì)于客戶來(lái)說可以接受,但卻表明您并沒有消除可用性性能問題。
“容量管理”和“可用性管理”一起提供了客戶評(píng)定“IT 服務(wù)管理”的大多數(shù)依據(jù)以及重要事件。通過查看最簡(jiǎn)單的服務(wù)水平協(xié)議您都可以獲得此信息。IT 客戶認(rèn)為,雖然同樣都達(dá)到了這些目標(biāo),但有的是成功了,有的卻失敗了。
IT 服務(wù)持續(xù)性管理目標(biāo)
隨著對(duì) IT 服務(wù)干擾的威脅日漸增長(zhǎng),這些威脅對(duì)業(yè)務(wù)的影響也由于更多重要業(yè)務(wù)流程的計(jì)算機(jī)化而不斷增長(zhǎng),IT 服務(wù)持續(xù)性管理在戰(zhàn)略上處于重要地位就不足為奇了。“服務(wù)持續(xù)性管理”不再僅僅涉及災(zāi)難恢復(fù)(盡管災(zāi)難恢復(fù)仍然非常重要)。它還涉及技術(shù)故障對(duì)業(yè)務(wù)造成的影響。例如,如果您有 90% 以上的業(yè)務(wù)來(lái)自 Internet,提供這些服務(wù)的 IT 基礎(chǔ)設(shè)施中的任何故障都將會(huì)立即顯露出來(lái),并且可能會(huì)引起收入和業(yè)務(wù)聲望的損失。因此,了解“IT 服務(wù)持續(xù)性管理”目標(biāo)是支持業(yè)務(wù)的根本:
ITSCM 的目標(biāo)就是支持整體“業(yè)務(wù)持續(xù)性管理”流程,方法是通過確保必需的 IT 技術(shù)和服務(wù)設(shè)備(包括計(jì)算機(jī)系統(tǒng)、網(wǎng)絡(luò)、應(yīng)用程序、電信、技術(shù)支持和服務(wù)臺(tái))可以在所要求的、既定的業(yè)務(wù)時(shí)限內(nèi)進(jìn)行恢復(fù)。
盡管該目標(biāo)并不是很冗長(zhǎng),但不滿足各種要素的要求可能會(huì)帶來(lái)災(zāi)難性的影響。因此,我們需要仔細(xì)了解各個(gè)要素:
“ITSCM 的目標(biāo)就是支持整體‘業(yè)務(wù)持續(xù)性管理’”: 這里的關(guān)鍵字是“業(yè)務(wù)持續(xù)性管理”。ITIL 建議公司執(zhí)行“業(yè)務(wù)持續(xù)性管理”,因?yàn)橛泻芏囡L(fēng)險(xiǎn)是 IT 無(wú)法控制的。例如,IT 無(wú)法確保對(duì)其不具備前提條件的遠(yuǎn)程位置的安全訪問。如果建筑物著火倒塌會(huì)發(fā)生什么情況?IT 僅僅是恢復(fù)團(tuán)隊(duì)的組成部分。您的公司是否具有“業(yè)務(wù)持續(xù)性管理”?如果沒有,就要朝著該目標(biāo)要素努力,IT 必須主動(dòng)確保公司意識(shí)到需要“業(yè)務(wù)持續(xù)性管理”,并且還要確保 IT 已經(jīng)準(zhǔn)備好周密的“業(yè)務(wù)恢復(fù)計(jì)劃”。
“確保必需的 IT 技術(shù)和服務(wù)設(shè)備(包括計(jì)算機(jī)系統(tǒng)、網(wǎng)絡(luò)、應(yīng)用程序、電信、技術(shù)支持和服務(wù)臺(tái))可以在所要求的、既定的業(yè)務(wù)時(shí)限內(nèi)進(jìn)行恢復(fù)”:該目標(biāo)要素的第一部分解釋了所有 IT 基礎(chǔ)設(shè)施要素及其相關(guān)的活動(dòng)都是“IT 服務(wù)持續(xù)性管理”的組成部分;但實(shí)際上是最后的幾個(gè)詞定義了該要素,“可以在所要求的、既定的業(yè)務(wù)時(shí)限內(nèi)進(jìn)行恢復(fù)”。再次強(qiáng)調(diào)一點(diǎn),SLM 在此處發(fā)揮一定的作用。SLM 與 ITSCM 一起負(fù)責(zé)與業(yè)務(wù)客戶合作,首先確定需要恢復(fù)的 IT 技術(shù)和服務(wù)設(shè)備以及要求的時(shí)限,然后與業(yè)務(wù)客戶對(duì)這些時(shí)限達(dá)成一致。您是否定期與客戶會(huì)面以調(diào)查業(yè)務(wù)持續(xù)性需求和目標(biāo)?您是否記錄和發(fā)布這些需求與目標(biāo)?如果您沒有執(zhí)行這些操作,您不僅未滿足該目標(biāo)要素的要求,還危及了公司的將來(lái)。
該要素中的關(guān)鍵詞是“可以進(jìn)行恢復(fù)”,因?yàn)槿绻麤]有使恢復(fù)流程和操作準(zhǔn)備就緒,就不可能理解和同意。該要素要求我們將恢復(fù)操作、計(jì)劃和流程準(zhǔn)備就緒以提供業(yè)務(wù)群體所要求的恢復(fù)級(jí)別。當(dāng)然,這受限于投資和所有其他正常的業(yè)務(wù)牽連。請(qǐng)記住,這不僅僅是“災(zāi)難恢復(fù)”,還是“業(yè)務(wù)持續(xù)性”。您是否已安排好“業(yè)務(wù)持續(xù)性”計(jì)劃?如果沒有,您將無(wú)法滿足該要素的要求。 考慮 ITSCM 時(shí),保護(hù)股東的投資非常重要。如果沒有保護(hù)好股東的投資,則說明沒有提供良好的 ITSCM。這不足以反映出高級(jí) IT 管理,尤其是當(dāng)某個(gè) IT 基礎(chǔ)設(shè)施組件出現(xiàn)嚴(yán)重的“業(yè)務(wù)持續(xù)性”故障時(shí)。