應用系統所在的機房今天淩晨突然掉電,系統重新開機後,表面看起來正常,其實隐藏危機,核心的程序沒有正常産生日志檔案,花了好長時間查問題,也沒發現故障原因。
順便看了看AIX的系統異常日志,呵呵
,有些收獲:
# errpt |more
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
B4C00618 0225160006 P H ssa0 RESOURCE UNAVAILABLE
B4C00618 0225150006 P H ssa0 RESOURCE UNAVAILABLE
B4C00618 0225140006 P H ssa0 RESOURCE UNAVAILABLE
625E6B9A 0225130006 P H ssa0 ADAPTER DETECTED OPEN SERIAL LINK
B4C00618 0225130006 P H ssa0 RESOURCE UNAVAILABLE
625E6B9A 0225120006 P H ssa0 ADAPTER DETECTED OPEN SERIAL LINK
B4C00618 0225120006 P H ssa0 RESOURCE UNAVAILABLE
3DB7729E 0225120006 P H ssa0 ADAPTER PERFORMANCE DEGRADED
T=P,有些不妙,再細看:
# errpt -a|pg
---------------------------------------------------------------------------
LABEL: SSA_ARRAY_ERROR
IDENTIFIER: B4C00618
Date/Time: Sat Feb 25 17:00:00 2006
Sequence Number: 18057
Machine Id: 0056FA7E4C00
Node Id: spms_app
Class: H
Type: PERM
Resource Name: ssa0
Resource Class: adapter
Resource Type: ssa160
Location: U0.1-P2-I5/Q1
Type=PERM,按照IBM技術手冊的手法,這是不可能得到恢複和解決的錯誤,是永久的錯誤。看起來像是磁盤陣列中的硬碟出現了故障。
我沒有smitty的相關權限,無法進一步确認了,上報錯誤資訊給相關人員處理。
踏入程式設計這個行業有些時日了,越來越感覺解決系統問題已經不單單程式設計語言的文法,如果技藝要精進,熟練掌握程式設計語言的文法外,更重要的是去了解你的軟體運作的環境(作業系統平台,資料庫系統平台等),擴充你的技能,同時也會擴充你的視野。