這個話題源自客戶的提問:如果監控報告發生了異常,
1. 運維團隊處理了,這算是Even還是Incident管理流程?
2. 如果沒有處理,異常越來越嚴重(當然處理的時候也有可能問題越來越嚴重),發生了危機,是屬于Incident的管理流程還是需要建立一個新的流程(Crisis Management)?
其實這一場景的管理,在ITIL 4中,劃分為三個實踐: 監控和事态管理(Monitoring and Event Management ), 事件管理(Incident Management)和服務連續性管理(Service Continuity Management)。在回答這個問題之前,我們先看看這三個實踐的範圍和流程。這裡先要說明,由于翻譯的問題,Incident Management從ITIL V3,一直翻譯成事件管理,其實我認為翻譯成故障管理更合适。為了避免歧義和不糾結翻譯的問題,下文都用英語單詞Event, Incident描述。
區分三個關鍵詞語
事态 Event: 對服務或其他配置項(CI)的管理具有重要意義的任何狀态更改
事件 Incidnet: 服務的意外中斷或服務品質的降低
災難 Disaster: 對組織造成重大損失或重大損失的突發性意外事件。要将事件歸類為災難,該事件必須符合組織預定義的某些業務影響标準
從ITIL 4給出的定義來看,他們之間的關系應該是: