天天看点

AIX系统errpt详解

在AIX中,errpt用于报告系统软硬件相关的错误日志信息

先来看一个实际的输出,不带参数简单列出所有的错误

#errpt IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION A2205861 1214144307 P S SYSPROC Excessive interrupt disablement time F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE EC0BCCD4 1213234807 T H ent1 ETHERNET DOWN EC0BCCD4 1213233607 T H ent1 ETHERNET DOWN 0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN …

使用-a参数查看详细信息

#errpt -a | more ————————————————————————— LABEL: GOENT_RCVRY_EXIT IDENTIFIER: F3931284 Date/Time: Thu Dec 13 23:48:47 BEIST 2007 Sequence Number: 162 Machine Id: 00099476D600 Node Id: db158 Class: H Type: INFO Resource Name: ent1 Resource Class: adapter Resource Type: 14108902 Location: U787B.001.DNWA74C-P1-T9 VPD: Product Specific.( )…….2-Port 10/100/1000 Base-TX PCI-X Adapter Network Address………….000D6051A0F6 ROM Level.(alterable)…….DV0210 Description ETHERNET NETWORK RECOVERY MODE Recommended Actions PERFORM PROBLEM DETERMINATION PROCEDURES Detail Data FILE NAME line: 204 file: goent_intr.c PCI ETHERNET STATISTICS 0001 EF66 0063 0853 0000 0001 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0000 0000 0000 A69D 0000 0000 002C B028 0000 0000 0000 A64B 0000 0000 0000 A597 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 0000 0001 0000 0001 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 BB83 08F0 0068 0C00 0000 0000 01A0 0000 0000 0000 0000 0000 0000 0000 C9E1 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 DEVICE DRIVER INTERNAL STATE 5555 5555 0000 0000 0000 0000 SOURCE ADDRESS 0011 25C0 3BDE

其中:

LABLE:事件名称

IDENTIFIER:事件ID

Date/Time:发生的时间

Sequence Number:事件序列号

Machine ID:机器标识

Node ID:节点标识

Class:事件来源

S-软件

H-硬件

I-信息

U-未定的

Type:事件类型

PEND-设备或组件的可用性损失是急迫的。

PERF-设备或组件的性能已下降到可接受的级别以下。

PERM-出现了不可恢复的情况。如果错误类型为这个值,那么通常是最严重的错误,并且很可能意味着出现了硬件设备或者软件模块的故障。如果错误类型为 PERM 之外的其他值,通常并不表示故障,但是对这些错误进行了记录,以便可以使用诊断程序对它们进行分析。

TEMP—在出现多次不成功的尝试之后,所恢复到的状态。这种错误类型也可以用于记录信息性条目,如 DASD 设备的数据传输统计信息。

UNKN—无法确定错误的严重程度。

INFO—错误日志条目是信息性的,并且不是某个错误所产生的结果。

Resource Name:检测到错误的资源的名称。对于软件错误,这是某个软件组件或可执行程序的名称。对于硬件错误,这是某个设备或系统组件的名称。它并不表示该组件出现故障或者需要更换。相反,它用于确定合适的诊断模块以用于对错误进行分析。

Resource Class:检测到故障的资源的一般类别(例如,磁盘的设备类别)。

Resource Type:检测到故障的资源的类型。

Location Code:设备的路径。最多可能有四个字段,分别是抽屉、插槽、连接器和端口。

VPD:关键的产品数据。这个字段的内容(如果存在)可能各不相同。设备的错误日志条目通常返回有关设备制造商、序列号、工程变更级别、以及只读存储级别的信息。

Description:错误的汇总信息。

Probable Cause:一些可能的错误原因的列表。

User Causes:由用户错误所导致错误的可能原因的列表。用户所导致的错误可能包括不正确插入的磁盘、未能开启的外部设备(如调制解调器和打印机)。

Actions:对于纠正用户所导致的错误的推荐操作的描述。

Install Causes:因为不正确的安装或者配置过程所导致错误的可能原因列表。这种类型的错误包括硬件和软件不匹配、电缆的不正确安装或电缆连接变松,以及未能正确配置的系统。

Actions:对于纠正安装所导致的错误的推荐操作的描述。

Failure Causes:可能的硬件或者软件故障列表。

Actions:对于纠正故障的推荐操作的描述。对于硬件错误,这将导致运行诊断程序。

Detailed Data:针对每个错误日志条目的、唯一的故障数据,如设备检测数据。

继续阅读