天天看點

報警分析雲上內建解決方案

背景:

     本實踐是以化工業的安全生産為背景,随着工業企業的日益大型化和複雜化,非正常事件(下稱故障)不僅影響了企業效益,更帶來了很多的安全問題。據非正常狀況管理聯盟(abnormal situation management,簡稱asm)的統計,美國由于故障在石油化工領域造成的經濟損失一年就高達200 億美元,而煉油廠平均每三年就發生一次重大事故,平均損失8 千萬美元。

      化工業具有較高的自動化程度,dcs和現場總線廣泛應用,各種單點報警也被大量使用,它們對提高系統安全性起到很好的作用,然而随着裝置的大型化和複雜化,報警數量的衆多和無序以及設計的随意性使得真正有用的報警資訊淹沒在大量備援和虛假的報警信号中,特别是故障發生的時刻,大量相關的報警信号突然出現,讓操作人員無法有效的分辨真實的報警源頭,稱之為報警泛濫(alarm flood)。例如1994 英國texaco  公司煉油廠流化催化裂化裝置爆炸事故,2040個報警在爆炸之前有1775 個報警同時顯示優先級為高,緻使操作員無法及時判斷問題的根源進而采取措施,最終釀成大禍。 

報警分析雲上內建解決方案

   報警标準定義了三個關鍵的kpi來将企業報警管理分成五個等級。這三個關鍵名額分别是平均報警率、峰值報警率和擾動率。通過這三個名額,将企業報警進行收集和統計,可以歸類到五個評價等級。

現階段面臨的問題:

   大型化和複雜化逐漸帶來了軟硬體上的存儲、計算性能瓶頸問題: 

實時報警資料存儲無法滿足需求 (由于工業廠區内報警裝置和接入裝置繁多,且報警頻率高【秒級】導緻每秒需要處理和存儲的資料量巨大【每秒上萬】,普通存儲産品無法滿足)

無效報警嚴重   (簡單的報警限和判斷規則設定,導緻其産生了數量巨大的報警信号,由于涉及的随意性較大,産生的報警資料中存在大量備援和虛假資訊)

故障診斷、源頭分析難以實作   (由于系統内部互相作用和一些備援報警設定會導緻在故障發生時出現很多報警,使人難以分辨真實的源頭)

報警名額計算效率不高 (由于秒級上萬的資料接入量,且報警各類名額較多,這樣就導緻需要在短時間内需要完成千萬甚至是億級資料的統計計算,在現有計算資源不足情況下隻能以更多的計算時間來彌補計算性能,這樣就導緻一個周期的報警名額統計需要幾十分鐘甚至以小時計算)

目标:

建立一套穩定高效的操作報警系統,并結合報警管理的國際标準、最佳實踐建立一套切實可行的報警管理機制和工作流程,降低“幹擾性”報警數量,提高報警處理效率,規範報警處理流程,提升工廠安全性。建設内容如下:

1.建立一套适合企業的操作報警系統及報警管理體系對照isa 18.2或eemua 191國際标準,整體報警管理水準從報警過載達到或接近可靠;報警級别分布達接近國際标準:關鍵/重要/一般比例為 5/15/80;形成一套不斷提高的管理體系,確定報警管理系統持續優化與提高。

2.建立一套報警管理知識庫    建立報警知識庫,為操作人員提供實時的操作支援與指導,同時可以通過曆史知識庫進行事故回顧與教育訓練。

3.建立一套可執行的報警管理機制與工作流程   結合報警管理的國際标準、最佳實踐以及企業的實際要求,建立一套切實可行的報警管理機制和工作流程

報警分析技術架構圖:

報警分析雲上內建解決方案

 報警分析雲上內建解決方案-技術架構

1.dcs日志采集:通過tcp監聽方式擷取dcs中報警日志資料;

2.日志解析:解析擷取的dcs報警日志格式化後存入實時資料庫中形成曆史記錄;

3.資料清洗:清理曆史記錄中正常資料保留報警數;

4.資料同步至阿裡雲:使用datax工具将清理後的報警資料導入到在odps建立的表中;

5.kpi名額計算:基于eemua國際标準,編寫名額kpi計算的sql與mapreduce對odps表中的資料進行名額計算并将結果寫入到kpi名額結果表中;

6.kpi名額結果統計:對計算出的kpi名額根據需求進行分鐘、小時、天、月統計,将統計結果寫入到kpi名額統計結果表中;

7.統計結果同步到本地:使用data x工具将kpi名額統計結果資料同步到本地系統資料庫中(如本地mysql);

8.資料可視化展示:前端展示頁面根據需要, 從資料庫中讀取kpi統計結果資料進行可視化展示;

主要處理流程

報警分析雲上內建解決方案

基于阿裡雲maxcompute的報警分析平台-處理流程

報警分析結果展示:

報警分析雲上內建解決方案

【報警評估與分析】

報警分析雲上內建解決方案

【報警系統性能評估】

報警分析雲上內建解決方案

【操作台報警分析】

報警分析雲上內建解決方案

【合理化評估報告】

報警分析雲上內建解決方案

【top n報警報告】

      應用效果:根據報警管理系統,通過對裝置無效報警的過濾、對工藝位号進行限值調整、控制回路pid參數的調整,裝置報警總數從原來每周209,068個報警下降到、每周19276個報警,報警總數下降了92.5%;裝置6個崗位報警等級均下降。整個裝置平均報警率從192左右下降到15.4,峰值報警率從374下降到143,擾動率從95下降到71.3。

-end-

報警分析雲上內建解決方案

藍智雲海

雲計算丨資料分析丨機器學習丨雲服務

報警分析雲上內建解決方案