天天看點

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

一. 更換熱插拔拔裝置

       安裝在您的系統中的某些裝置,能夠在不關閉系統的情況下進行安裝、删除或者更換。支援這些操作的裝置包括 PCI 擴充卡、SCSI 裝置,以及一些 RAID 裝置。并不是所有的 PCI 擴充卡都支援熱插拔任務。要确定某個特定的裝置是否支援熱插拔操作,可以參考硬體産品文檔。

       為了更換熱插拔拔裝置,您必須轉到“Hot Plug Task”菜單,可以從診斷工具實用工具中通路該菜單。

       根據環境和所安裝的軟體包的不同,在選擇這個任務之後,将顯示下列子任務中的某些内容:

       PCI 熱插拔拔管理器——PCI 熱插拔拔管理器 (HPM) 任務是 SMIT 中的一個菜單,它允許您辨別、添加、删除、或者更換 PCI 熱插拔拔擴充卡。

       RAID 熱插拔拔裝置——這個任務允許使用者辨別或删除使用 SCSI Enclosure Services (SES) 裝置的系統單元中的 RAID 裝置。

       SCSI 和 SCSI RAID 熱插拔管理器—— 在以前的發行版中,這個任務稱為“SCSI Device Identification and Removal or Identify and Remove Resources”。這個任務允許使用者辨別、添加、删除、或更換使用 SCSI Enclosure Services (SES) 裝置的系統單元中的 RAID 裝置。

您可以使用 lsslot 指令動态地顯示可重新配置的插槽和它們的特征。

       在示例 1中,我們使用 lsslot 指令來顯示熱插拔 PCI 插槽的編号、位置以及功能。

示例 1 使用 lsslot 指令

# lsslot -c pci

# Slot                   Description                         Device(s)

U787B.001.DNW0974-P1-C1  PCI-X capable, 64 bit, 133MHz slot  ent2

U787B.001.DNW0974-P1-C2  PCI-X capable, 64 bit, 133MHz slot  Empty

U787B.001.DNW0974-P1-C3  PCI-X capable, 64 bit, 133MHz slot  Empty

U787B.001.DNW0974-P1-C4  PCI-X capable, 64 bit, 133MHz slot  sisioa0

U787B.001.DNW0974-P1-C5  PCI-X capable, 64 bit, 133MHz slot pci7 lai0

       在更換一個熱插拔擴充卡或者磁盤之前,您應該取消所有依賴于您希望删除的實體裝置的其他裝置或者接口的配置。

       在示例2 中,我們介紹了在嘗試删除一個未取消配置的裝置時所顯示的錯誤消息。lsdev 指令将确定該裝置是否處于可用狀态。

       示例 2 在嘗試更換配置裝置 sisia0 時顯示的錯誤消息

COMMAND STATUS

Command:failed        stdout:yes           stderr:no

Before command completion, additional instructions may appear below. The visual indicator for the specified PCI slot has been set to the identify state.Press Enter to continue or enter x to exit. The specified slot contains device(s) that are currently configured.Unconfigure the following device(s) and try again.

sisioa0

# lsdev -C|grep sis

gxme0      Defined         Graphics Data Transfer Assist Subsystem

sisioa0    Available 05-08   PCI-X Dual Channel U320 SCSI RAID Adapter

sisioa1    Available 09-08   PCI-X Dual Channel U320 SCSI RAID Adapter

sisraid0   Available 05-08-ff      Ultra320 SCSI RAID Adapter Logical bus

sisraid1   Available 09-08-ff      Ultra320 SCSI RAID Adapter Logical bus

       如果您正運作于多個分區環境中,那麼應該驗證您所嘗試删除或者更換的裝置是否标記為某個分區必需的裝置。如果是這樣,那麼應該在更換該裝置之前停止相應的分區。

       在下列場景中,我們将更換 ent2 以太網 PCI 擴充卡。從示例 3 中顯示的 lsslot 指令的輸出中,我們可以找到該擴充卡的實體位置。我們将删除相應的接口 en2,如示例3 所示。

示例 3 删除 en2 接口

# ifconfig -a

en0:flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD,PSEG,CHAIN>

inet 9.3.5.195 netmask 0xffffff00 broadcast 9.3.5.255

tcp_sendspace 131072 tcp_recvspace 65536

en1:flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,

64BIT,CHECKSUM_OFFLOAD,PSEG,CHAIN>

inet 9.1.1.1 netmask 0xfffffff8 broadcast 9.1.1.7

tcp_sendspace 131072 tcp_recvspace 65536

en2:flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD,PSEG,CHAIN>

inet 0.0.0.0 netmask 0x0

tcp_sendspace 131072 tcp_recvspace 65536

lo0:flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT>

inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255

inet6 ::1/0

tcp_sendspace 131072 tcp_recvspace 131072 rfc1323 1

# ifconfig en2 detach

# ifconfig -a

en0:flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD,PSEG,CHAIN>

inet 9.3.5.195 netmask 0xffffff00 broadcast 9.3.5.255

tcp_sendspace 131072 tcp_recvspace 65536

en1:flags=5e080863,c0<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD,PSEG,CHAIN>

inet 9.1.1.1 netmask 0xfffffff8 broadcast 9.1.1.7

tcp_sendspace 131072 tcp_recvspace 65536

lo0:flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT>

inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255

inet6 ::1/0

tcp_sendspace 131072 tcp_recvspace 131072 rfc1323 1

可以使用 SMIT 或診斷程式 (DIAG) 工具菜單來啟動熱插拔任務。在這個場景中,我們使用了 DIAG 工具。

       1. 要啟動 DIAG 工具,可以在指令提示符處輸入 diag 指令。當顯示如圖 1 中所示的螢幕時,按 Enter。

圖 1 初始診斷螢幕

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       2. 從“Function Selection”菜單中,選擇“Task Selection (Diagnostics, Advanced Diagnostics, Service Aids, etc.)”選項。圖 2 顯示了“Diagnostics, Advanced Diagnostics, Service Aids, etc.”螢幕。

圖 2 診斷功能選擇螢幕

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       3. 在“Task Selection List”菜單中,向下滾動到“Hot Plug Task”菜單選項,并選擇它。圖 3 顯示了“Task Selection List”,其中突出顯示了“Hot Plug Task”菜單選項。

圖 3 “Task Selection List”菜單選項

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       在使用 diag 菜單時,将根據您的硬體環境列出可用的選項。在這個示例中,我們看到列出了三個選項:

       a. “PCI Hot Plug Manager”菜單

       b. “RAID Hot Plug Devices“菜單

       c. “SCSI and SCSI RAID Hot Plug Manager”菜單

選擇“PCI Hot Plug Manager”菜單選項。圖 4 顯示了“HPT”菜單,其中突出顯示了“PCI Hot Plug Manager”。

圖 4 “Hot Plug Task”菜單

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       4. 在“PCI Hot Plug Manager”菜單中,選擇“Unconfigure A device”。選擇要取消配置的合适的擴充卡。在這個場景中,将要取消擴充卡 ent2 的配置。圖 5 顯示了“Unconfigure A device”菜單,其中突出顯示了 ent2 裝置。對于這個場景,我們可以将裝置定義儲存在資料庫中。在将 ent2 裝置置于已定義的狀态之後,傳回到“PCI Hot Plug Manager”菜單。

圖 5 “Unconfigure A device”螢幕

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       5. 在“PCI Hot Plug Manager”菜單中,選擇“Replace/Remove a PCI Hot Plug Adapter”。選擇要更換/删除的合适的擴充卡。在這個場景中,将要更換擴充卡 ent2。圖 6 顯示了“PCI Hot Plug Manager”菜單,其中突出顯示了“Replace/Remove”選項。

圖 6 “PCI Hot Plug Manager Replace/Remove”菜單

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       6. 選擇了 ent2 擴充卡之後,将顯示“Replace/Remove a PCI Hot Plug Adapter”菜單。可以更換或者删除該擴充卡。在這個場景中,我們将更換該擴充卡。使用 Tab 或者 F4 鍵,選擇“replace”。

       在選擇了“replace”選項之後,會将該 PCI 插槽置于允許删除 PCI 擴充卡的狀态。閃爍的信号燈表示該插槽包含已選中進行更換的擴充卡。要開始更換過程,可以按 Enter鍵。圖 7 顯示了突出顯示的“replace”選項。

圖 7 “Replace/Remove a PCI Hot Plug Adapter”菜單

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       7. 圖 8 顯示了完整的擴充卡更換過程。在更換過程的這個階段中,将要求您完成下列工作:

       a. 通過按 Enter 鍵,确認應該對該擴充卡進行更換。将可視的訓示器設定為辨別狀态。您可以按 x 鍵、Enter 鍵退出。

       b. 交換 PCI 擴充卡。将可視的訓示器設定為操作狀态。要繼續進行,請按 Enter 鍵。要退出,請按 x 鍵,然後按 Enter 鍵。交換過程需要從 PCI 插槽中删除 PCI Blind Swap Cassette,使用具有相同 FRU 的 PCI 以太網擴充卡來替換 PCI 以太網擴充卡,然後組裝到 PCI Blind Swap Canister 中。

說明:如果您選擇退出這個階段,那麼 PCI 插槽将處于已删除的狀态。

       c. 将 PCI Blind Swap Cassette 插回到 PCI 插槽。要繼續進行,請按 Enter 鍵。現在已經更換了擴充卡,并且做好了重新配置的準備。

圖 8 顯示了這三個步驟以及成功地完成更換任務。

圖 8 更換 PCI 擴充卡

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       技巧:如果沒有取消以太網擴充卡接口的配置(請參見前面的步驟 4 ),那麼整個過程将在此處失敗。取消以太網擴充卡接口的配置,并從步驟 5 開始這個過程。

       8. 在更換了 PCI 以太網擴充卡之後,必須為 AIX 5L 對該裝置進行配置。在“PCI Hot Plug Manager”菜單中,選擇“Configure a Defined Device”,然後選擇 ent2 以太網裝置,并按 Enter 鍵。現在,将對 ent2 裝置擴充卡進行配置。

圖 9 顯示了“Configure a Defined Device”菜單。

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       9. ent2 裝置現在已經可以使用,可以為其重新配置一個 IP 位址。應該在作業系統錯誤日志中記錄針對 ent2 裝置的修複操作。其狀态如圖 10 中所示。

圖 10 “PCI Hot Plug Manager Replace/Remove”菜單

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       10. 選擇 ent2 擴充卡之後,将顯示“Replace/Remove a PCI Hot Plug Adapter”菜單。可以更換或者删除該擴充卡。在這個場景中,我們将更換該擴充卡。使用 Tab 或者 F4 鍵,選擇“replace”。

       在選擇了“replace”選項之後,會将該 PCI 插槽置于允許删除 PCI 擴充卡的狀态。閃爍的信号燈表示該插槽包含已選中進行更換的擴充卡。

要開始更換過程,可以按 Enter 鍵。

       圖 11 突出顯示了“replace”選項。

       圖 11 “Replace/Remove a PCI Hot Plug Adapter”菜單

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       11. 圖 12 顯示了完整的擴充卡更換過程。在更換過程的這個階段中,将要求您完成下列工作:

       a. 通過按 Enter 鍵,确認應該對該擴充卡進行更換。将可視的訓示器設定為辨別狀态。您可以按 x 鍵、Enter 鍵退出。

       b. 交換 PCI 擴充卡。将可視的訓示器設定為操作狀态。要繼續進行,請按 Enter 鍵。要退出,請按 x 鍵,然後按 Enter 鍵。交換過程需要從 PCI 插槽中删除 PCI Blind Swap Cassette,使用具有相同 FRU 的 PCI 以太網擴充卡來替換 PCI 以太網擴充卡,然後組裝到 PCI Blind Swap Canister 中。

說明:如果您選擇退出這個階段,那麼 PCI 插槽将處于已删除的狀态。

       c. 将 PCI Blind Swap Canister 插回到 PCI 插槽。要繼續進行,請按 Enter 鍵。現在已經更換了擴充卡,并且做好了重新配置的準備。

       圖 12 顯示了這三個步驟以及成功地完成更換任務。

圖 12 更換 PCI 擴充卡

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       技巧:如果沒有取消以太網擴充卡接口的配置(請參見前面的步驟 4 ),那麼整個過程将在此處失敗。取消以太網擴充卡接口的配置,并從步驟 5 開始這個過程。

       12. 在更換了 PCI 以太網擴充卡之後,必須為 AIX 5L 對該裝置進行配置。在“PCI Hot Plug Manager”菜單中,選擇“Configure a Defined Device”,然後選擇 ent2 以太網裝置,并按 Enter 鍵。現在,将對 ent2 裝置擴充卡進行配置。

圖 13 顯示了“Configure a Defined Device”菜單。

圖 13“Configure A Defined Device”菜單

IBM AIX V5.3 系統管理 -- 問題的确定與解決二

       13. ent2 裝置現在已經可以使用,可以通過 smit 的 chinet 快速路徑為其重新配置一個 IP 位址。應該在 AIX 5L 錯誤報告中記錄針對 ent2 裝置的修複操作。通過顯示錯誤報告中記錄的錯誤已經解決,這将為可能使用這台伺服器的其他系統管理者提供幫助。要輸入修複操作,則使用 diag Æ Task Selection Æ Log Repair Action 并選擇 ent2 裝置。

二. 故障磁盤的更換

       系統管理者所碰到的大多數問題都是與磁盤驅動器相關的問題。是以,您必須了解一些更換磁盤的過程。可能因為下列原因之一而需要更換磁盤:

       (1)磁盤出現故障。

       (2)磁盤開始報告 IO 錯誤,并且您希望對其進行更換,以防止出現全面的故障。

       (3)磁盤無法滿足/達到您的需求,例如在大小或者速度方面。

在下面的部分中,我們希望盡量介紹一些出現磁盤故障的最常見的場景。

場景 1

如果您所希望更換的磁盤進行了鏡像,那麼我們建議執行下列這些步驟:

       1. 使用 rmlvcopy 指令或者 unmirrorvg 指令,删除位于該磁盤中的所有邏輯卷的副本。

       2. 使用 reducevg 指令從卷組中删除該磁盤。

       3. 使用 rmdev 指令删除磁盤定義。

       4. 實體删除該磁盤。如果該磁盤無法進行熱插拔,那麼您可能需要重新啟動系統。

       5. 更換新的替換磁盤。如果該磁盤無法進行熱插拔,那麼您可以運作 cfgmgr;否則,您可能需要重新啟動系統。

       6. 使用 extendvg 指令将剛添加的磁盤包含到卷組中。

       7. 使用 mklvcopy 或者 mirrorvg,為所有的邏輯卷重新建立并同步副本。

場景 2

如果您所希望更換的磁盤沒有進行鏡像,并且能夠正常工作,我們建議執行下列這些步驟:

       1. 更換新的替換磁盤。如果該磁盤無法進行熱插拔,那麼您可以運作 cfgmgr;否則,您可能需要重新啟動系統。

       2. 使用 extendvg 指令,将剛添加的磁盤包含到卷組中。

       3. 使用 migratepv 指令或者 migratelp 指令,将故障磁盤中的所有分區遷移到新的磁盤。如果這些磁盤屬于 rootvg,那麼您應該考慮下面的情況:

              (1)如果要更換的磁盤包含 BLV 的一個副本,那麼您必須使用 chpv -c 指令清除它。

              (2)必須使用 bosboot 指令在新的磁盤上建立一個新的 BLV 映像。

              (3)必須使用 bootlist 指令更新 bootlist,以使這些更改生效。

              (4)如果要更換的磁盤中包含分頁空間或者主轉儲裝置,那麼您應該禁用它們。    

              (5)在 migratepv 指令完成之後,您應該重新激活它們。

       4. 使用 reducevg 指令從卷組中删除故障磁盤。

       5. 使用 rmdev 指令删除磁盤定義。

場景 3

如果該磁盤沒有進行鏡像,并且已經完全無法工作,而卷組中有其他磁盤可供使用,那麼我們建議執行下列這些步驟:

       1. 辨別所有至少有一個分區位于故障磁盤的邏輯卷。

       2. 關閉這些邏輯卷,并使用 umount 指令解除安裝所有相對應的檔案系統。

       3. 使用 rmfs 指令,删除這些檔案系統和邏輯卷。

       4. 使用 reducevg 指令從卷組中删除故障磁盤。

       5. 使用 rmdev 指令删除磁盤定義。

       6. 實體删除該磁盤。如果該磁盤無法進行熱插拔,那麼您可能需要重新啟動系統。

       7. 使得更換的磁盤可供使用。如果該磁盤無法進行熱插拔,那麼您可以運作 cfgmgr;否則,您可能需要重新啟動系統。

       8. 使用 extendvg 指令将剛添加的磁盤包含到卷組中。

       9. 使用 mklv 和 crfs 指令,重新建立所有的邏輯卷和相對應的檔案系統。

       10. 如果您有相關資料的備份,那麼請從備份恢複您的資料。

場景 4

如果該磁盤沒有進行鏡像,并且已經完全無法工作,而卷組中沒有其他的磁盤可供使用(該卷組僅包含一個實體卷、或者所有的實體卷都同時失效),并且該卷組不是 rootvg,那麼我們建議執行下列這些步驟:

       1. 使用 exportvg 指令從系統中導出卷組定義。

       2. 確定 /etc/filesystems 中不包含任何不正确的節。

       3. 使用 rmdev 指令删除磁盤定義。

       4. 實體删除該磁盤。如果該磁盤無法進行熱插拔,那麼您可能需要重新啟動系統。

       5. 更換新的替換磁盤。如果該磁盤無法進行熱插拔,那麼您可以運作 cfgmgr;否則,您可能需要重新啟動系統。

       6. 如果您有卷組的備份,那麼請使用 restvg 指令對其進行恢複。

       7. 如果您沒有對卷組進行備份,那麼請使用 mkvg 指令、mklv 指令和 crfs 指令,重新建立卷組、所有的邏輯卷、以及相對應的檔案系統。

       8. 如果您有相關資料的備份,那麼請從備份恢複您的資料。

場景 5

如果該磁盤沒有進行鏡像,并且已經完全無法工作,而卷組中沒有其他磁盤可供使用(該卷組僅包含一個實體卷,或者所有的實體卷都同時失效),并且該卷組不是 rootvg,那麼我們建議執行下列這些步驟:

       1. 更換故障磁盤。

       2. 使系統啟動進入維護模式。

       3. 從一個 mksysb 映像恢複系統。

三. 對圖形問題進行故障排除

這個部分内容将介紹與顯示輸出相關的問題的解決方法。

3.1 試圖啟動桌面時發生系統停止

下面的部分将幫助您了解影響圖形桌面正常啟動的一些原因。

3.1.1  /home 檔案系統已經裝滿

       當/home 檔案系統已經裝滿時,使用者将無法使用 AIX 5L CDE 進行登入。如果 /home 已經裝滿,那麼 AIX 5L CDE 歡迎視窗将接受使用者名和密碼,然後不顯示任何内容(看起來系統出現了停止),然後再次傳回到 AIX 5L CDE 歡迎視窗。要進行登入并對問題進行分析,可以按 AIX 5L CDE 歡迎視窗中的 Options 按鈕,然後選擇“Command Line Login”,或者以非圖形顯示的方式進行登入。

3.1.2  名稱解析問題

       如果名稱解析配置不正确,或者您的系統無法連接配接到 DNS 伺服器,那麼使用者将碰到登入和網絡問題。如果在名稱解析方面存在問題,那麼 AIX 5L CDE 歡迎視窗将接受使用者名和密碼,然後顯示“Starting the Common Desktop Environment”消息,它将持續幾分鐘的時間,然後啟動基本的圖形環境。

使用 nslookup 指令可以驗證您的系統是否能夠通過 DNS 伺服器進行名稱解析。例如,可以使用 nslookup 指令解析名稱 www.ibm.com:

# nslookup                                                       

Default Server:dhcp001.itsc.austin.ibm.com                     

Address:  9.3.4.2

> www.ibm.com                                                    

Server:dhcp001.itsc.austin.ibm.com                             

Address:  9.3.4.2                                                

Non-authoritative answer:                                        

Name:livesite.events.ibm.com                                 

Addresses:  129.42.21.99,129.42.16.99,129.42.17.99,129.42.18.99

          129.42.19.99,129.42.20.99                              

Aliases:www.ibm.com                                            

> exit                                                           

#

       如果在嘗試解析一個名稱時,nslookup 指令沒有顯示類似的輸出,或者在顯示大于符号提示符 (>) 時出現延遲,那麼這意味着無法連接配接到 DNS 伺服器:

       (1)請驗證您的系統是否能夠通路網絡。

       (2)請驗證您的 DNS 伺服器是否已經啟動并正在運作,您需要通路它們以進行名稱解析查詢。

       (3)停止使用 DNS 伺服器。使用 SMIT 快速路徑:# smitty spnamerslv

       您必須提供一個名稱,以便對 /etc/resolv.conf 進行重命名。您還可以使用下面的指令:# namerslv -e

       注意:當您停止使用 DNS 伺服器時,這将影響到所有使用該名稱解析服務的程式和服務。除非您很清楚它将對系統帶來的影響,否則請不要進行這項操作。

3.2 無法打開顯示的錯誤的故障排除

       當運作使用圖形服務的指令時,您可能會碰到與下面類似的消息:

              Error:Can't open display:

       該程式正嘗試在圖形環境中顯示輸出,但是卻無法完成這項任務。在程式可以使用一個顯示之前,它必須建立到驅動顯示的 X 伺服器的連接配接。

打開一個顯示

       要打開到控制指定顯示的 X 伺服器的連接配接,您必須設定顯示的名稱、或者 DISPLAY 環境變量,它是一個格式如下所示的字元串:

       HostName:Number.Screen

其中:

       HostName——指定該顯示在實體上依附的主機系統的名稱或者 IP 位址。這個主機名後面應該加上一個 :(冒号)。

       Number——指定主機中顯示伺服器的 ID 編号。顯示編号的後面可以加上一個 .(點号)。

       Screen——指定主機伺服器上螢幕的編号。單個 X 伺服器可以連接配接或控制多個螢幕。

       例如,您可以使用下面指令将 DISPLAY 環境變量設定為名為 server3 的系統上的螢幕 0、顯示 2:

       # export DISPLAY=server3:2.0

       如果在設定了 DISPLAY 環境變量之後,您依然得到“Can't open display”消息,并且這時 X 伺服器正在運作,那麼您必須檢查您的系統是否有權限通路運作于該計算機中的 X 伺服器。

       您使可以用 xhost 指令控制哪些使用者能夠通路目前主機中運作的 X 伺服器。這個指令可以在一個計算機的清單中添加或者删除主機名,X 伺服器将接受這個清單中的計算機的連接配接。

       例如,可以在運作 X 伺服器的、名為 server3 的系統中運作 xhost 指令,以便為您的系統(名為 server2)授予連接配接到這個 X 伺服器的權限:

       # xhost +server2

要拒絕名為 server2 的系統對這個 X 伺服器的通路,可以輸入下面的指令:

       # xhost -server2

       說明:請確定您在指定主機名時使用了 xhost + 指令,因為它将禁用 X 伺服器的通路控制。這将允許您為特定的主機授予通路權限,進而簡化對 X 伺服器的潛在攻擊的監視。如果您沒有指定主機名,那麼将為所有的主機授予通路權限,這是一種潛在的安全風險。

3.3 對 TTY 顯示問題進行故障排除

       您可能會碰到各種 TTY 裝置問題,例如,在嘗試使用 clear 指令清除螢幕内容時,螢幕卻保持不變,或者在運作 smit 指令時,卻得到了與如下所示類似的、雜亂的輸出:

# smitty                                                                       

[email protected],Alqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqk6,x6cx7,mqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqj5,B6.Initializing SMIT ...5, 6, 6c 7,5,Alqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqk6,x6cx7,mqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqj5,B6.Processing data ...5, ?System Management" Move cursor to desired item and press Enter.

$"!aSoftware Installation and Maintenance%"

@BSoftware License Management&"Devices'"System Storage Management (Physical & Logical Storage)("Security & Users)"Communications Applications and Services

*"Print Spooling+"Advanced Accounting,"Problem Determination-"Performance &

Resource Scheduling."System Environments/"Processes & Subsystems0

"Applications1"Installation Assistant2"Cluster Systems Management3"Using SMIT

(information only)5,  F9=Shell7, F10=ExitEnter=Do                    $!

       這說明沒有将 TERM 環境變量設定為正确的值。

不同顯示和終端的 TERM 值

       有關終端功能的資訊存儲在 terminfo 資料庫中。TERM 環境變量的值辨別了 terminfo 資料庫中特定的終端描述。這為程式與目前 TTY 裝置進行有效地通信提供了所需的全部資訊。表 1 顯示了用于各種終端的值。

表 1 用于各種終端的值

顯示/終端
3161 ASCII 終端 ibm3161
3163 ASCII 終端 ibm3161
DEC VT100(終端) vt100
DECVT220 vt220
3151 ASCII 終端 ibm3151
AIXwindows aixterm

例如,要将 TERM 環境變量的值設定為 vt100,可以輸入下面的指令:

# export TERM=vt100

四. perfpmr 指令

       perfpmr 指令由一組實用工具組成,這些實用工具用于建構包含所需資訊的測試用例,以幫助進行性能問題分析。它主要用于協助 IBM 軟體支援部門,但是作為系統的文檔說明工具,它也是很有價值的。

       因為總在對 perfpmr 指令進行頻繁地更新,是以在 AIX 5L 媒體中沒有提供這個指令。可以從下面的位置下載下傳該指令:

       ftp://ftp.software.ibm.com/aix/tools/perftools/perfpmr

請使用适合的 AIX 5L 級别的版本。對于我們來說,所需的檔案位于:

       ftp://ftp.software.ibm.com/aix/tools/perftools/perfpmr/perf53/perf53.tar.Z

perfpmr 指令的文法為:

perfpmr.sh [-PDgfnpsc][-F file][-x file][-d sec] monitor_seconds

表 2 給出了相關參數的描述。

标志 描述
-P 隻進行預覽——顯示運作所需的腳本和磁盤空間。
-D 不使用 perfpmr.cfg 檔案,以原始的方式運作 perfpmr。
-g 不收集 gennames 的輸出。
-f 如果 gennames 正在運作,則指定 gennames -f。
-n 如果不希望進行 netstat 或者 nfsstat 輸出,則使用這個選項。
-p 如果在 monitor.sh 運作時不希望進行 pprof 收集,則使用這個選項。
-s 如果不希望進行 svmon 輸出,則使用這個選項。
-c 如果不希望任何配置資訊,則使用這個選項。
-F File 使用該檔案作為 perfpmr cfg 檔案;預設值為 perfpmr.cfg。
-x File 僅執行 perfpmr 安裝目錄中的檔案。
-d sec 表示在啟動收集周期之前的等待時間;預設值為 delay_seconds 0。
-s 如果不需要 svmon 輸出,則使用這個選項。

請特别注意下面的參數。

monitor_seconds——收集周期(機關為秒)。最小的周期為 60 秒。

可以使用 perfpmr.sh 600 指令将标準的收集周期設定為 600 秒。

4.1  測量和示例

       除非您單獨運作 Shell 腳本,否則 perfpmr.sh 600 指令将執行下列 Shell 腳本以獲得一個測試用例。您也可以單獨地運作這些腳本。有關更詳細的内容,請參見“運作 perfpmr”部分。

       config.sh——将配置資訊收集到一個名為 config.sum 的報告中。

       emstat.sh time——根據模拟的指令,建構一個名為 emstat.int 的報告。time 參數必須大于或者等于 60。

       filemon.sh time——根據檔案 I/O,建構一個名為 filemon.sum 的報告。time 參數沒有任何限制。

       iostat.sh time——根據 I/O 統計資訊,建構兩個報告:一個彙總的報告名為 iostat.sum,一個間隔的報告名為 iostat.int。time 參數必須大于或者等于 60。

       iptrace.sh time——根據名為 iptrace.raw 的網絡 I/O,建構原始的 Internet Protocol (IP) 跟蹤報告。您可以使用 iptrace.sh -r 指令将 iptrace.raw 檔案轉換為一個可讀的、名為 iptrace.int 的 ipreport 檔案。time 參數沒有任何限制。

       monitor.sh time——調用系統性能監視,并收集間隔的和彙總的報告:

       lsps.after ——包含在運作 monitor.sh 之後的 lsps -a 和 lsps -s 輸出。用于報告分頁空間的使用。

       lsps.before——包含在運作 monitor.sh 之前的 lsps -a 和 lsps -s 輸出。用于報告分頁空間的使用。

       nfsstat.int——包含在運作 monitor.sh 之前和之後的 nfsstat -m 和 nfsstat -csnr 輸出。用于報告網絡檔案系統的使用和配置。

       monitor.int——使用 ps -efk,包含間隔的示例(在運作 monitor.sh 之前和之後,顯示活動的程序)。它還包含 sadc、sar -A、iostat、vmstat 和 emstat 輸出。

       monitor.sum——使用 ps -efk,包含彙總的示例(在運作 monitor.sh 之前和之後,對于活動的程序,顯示 ps 輸出中的更改)。它也包含 sadc、sar -A、iostat、vmstat 和 emstat 輸出。

       pprof.trace.raw  包含 pprof 的原始跟蹤。

       psb.elfk——在運作 monitor.sh 之前,包含經過修改的 ps -elk 輸出。

       svmon.after——包含在運作 monitor.sh 之後的 svmon -G 和 svmon -Pns 輸出,以及使用 svmon -S 指令得到的程序使用的若幹個最大的段。用于報告記憶體的使用。

       svmon.before——包含在運作 monitor.sh 之前的 svmon -G 和 svmon -Pns 輸出,以及使用 svmon -S 指令得到的程序使用的若幹個最大的段。用于報告記憶體的使用。

       vmstati.after——包含在運作 monitor.sh 之後的 vmstat -i 輸出。用于報告 I/O 裝置的中斷。

       vmstati.before——包含在運作 monitor.sh 之前的 vmstat -i 輸出。用于報告 I/O 裝置的中斷。

       netstat.sh [-r] time——建構一個有關網絡配置和使用的報告,該報告名為 netstat.int,其中在運作 monitor.sh 之前和之後,包含令牌環接口的 tokstat -d、以太網接口的 entstat -d、netstat -in、netstat -m、netstat -rn、netstat -rs、netstat -s、netstat -D 和 netstat -an。您可以清除以太網和令牌環統計資訊,并通過運作 netstat.sh -r 60,再次運作這個報告。time 參數必須大于或者等于 60。

       nfsstat.sh time——建構一個有關 NFS 配置和使用的報告,該報告名為 netstat.int,其中包含在運作 nfsstat.sh 之前和之後的 nfsstat -m 和 nfsstat -csnr。time 參數必須大于或者等于 60。

       pprof.sh time——建構一個名為 pprof.trace.raw 的檔案,可以使用 pprof.sh -r 指令對其進行格式化。time 參數沒有任何限制。

       ps.sh time——根據程序狀态 (ps) 建構相關的報告。ps.sh 将建立下列檔案:

              psa.elfk——在運作 ps.sh 之後,執行 ps -elfk 列出相關内容。

              psb.elfk——在運作 ps.sh 之前,執行 ps -elfk 列出相關内容。

              ps.int——在運作 ps.sh 之前和之後的活動的程序。

              ps.sum——在 ps.sh 開始和結束之間所發生的更改的彙總報告。這可以用于确定哪些程序耗費了大量的資源。

              time 參數必須大于或者等于 60。

       sar.sh time——根據 sar 建構相關的報告。sar.sh 将建立下列檔案:

       sar.int——指令 sadc 10 7 和 sar -AOutput 的輸出。

              sar.sum——在運作 sar.sh 一段時間之後的 sar 彙總資訊。

              time 參數必須大于或者等于 60。

       tcpdump.sh int.time——int. 參數是接口的名稱;例如,tr0 為令牌環。建立 TCP/IP 轉儲的、名為 tcpdump.raw 的原始跟蹤檔案。要産生一個可讀的 tcpdump.int 檔案,可以使用 tcpdump.sh -r 指令。time 參數沒有任何限制。

       tprof.sh time——建立一個名為 tprof.sum 的 tprof 彙總報告。用于分析程序和線程的記憶體使用。通過指定 tprof.sh -p program 60 指令(這将允許您将所調用的可執行程式配置為運作 60 秒),您還可以指定要配置的程式。time 參數沒有任何限制。

       trace.sh time——從使用 trcrpt 指令所生成的 ASCII 跟蹤報告,或者通過運作 trace.sh -r 建立原始跟蹤檔案 (trace*)。這個指令将建立一個名為 trace.int 的檔案,其中包含可讀的跟蹤資訊。用于分析性能問題。time 參數沒有任何限制。

vmstat.sh time——根據 vmstat 建構相關的報告:一個名為 vmstat.int 的、vmstat 間隔的報告,以及一個名為 vmstat.sum 的、vmstat 彙總的報告。time 參數必須大于或者等于 60。

       因為 trace 指令将收集大量的資料,是以 trace 指令将僅運作 5 秒(在預設的情況下),是以,當您的系統中出現性能問題的時候,它可能并不在運作,尤其是在性能問題僅出現很短時間的情況下。在這種情況下,當出現問題時,需要讓 trace 指令運作 15 秒。trace.sh 15 指令将執行跟蹤任務 15 秒。

       系統可以産生一個大小為 135 MB 的測試用例,其中用于跟蹤的内容占 100 MB。對于不同的系統負載,這個大小可能差别很大。如果您在具有相同工作負載的相同系統中運作跟蹤任務 15 秒,那麼可能會得到大約 300 MB 的跟蹤檔案。

       針對每個 CPU 産生一個原始跟蹤檔案。這些檔案名為 trace.raw-0、trace.raw-1,對于每個 CPU 依次類推。同時還将生成一個附加的原始跟蹤檔案,名為 trace.raw。這是一個主檔案,其中的資訊可以将其他 CPU 特定跟蹤資訊聯系在一起。要将這些跟蹤檔案合并到一起,構成一個原始跟蹤檔案,可運作下面的指令:

# trcrpt -C all -r trace.raw > trace.r

# rm trace.raw*

4.2 建構并送出測試用例

       IBM 可能要求您為性能問題提供測試用例,或者您可能希望根據自己的需求來運作 perfpmr.sh 指令(例如,為檢測将來的性能問題而生成一個基準)。無論在哪種情況下,都可以使用 perfpmr.sh 工具來收集性能資料。即使您的性能問題的原因來源于系統中的某個元件(如網絡),perfpmr.sh 仍然可用于發送測試用例,因為它包含了進行問題确定所需的其他資訊。IBM 軟體支援部門可能要求您提供進行問題确定的附加資訊。

       說明: IBM 為 AIX 釋出了不同的維護級别。這些級别是一組程式臨時修複程式( Program Temporary Fixes , PTF ),用于将作業系統更新到最新的級别,但保持目前的發行版不變。通常,這些維護級别以及磁盤和擴充卡微代碼的目前版本,提供了性能增強的修複程式。是以,您可能希望下載下傳這些内容。

       要建構和發送一個測試用例,共分為 5 個階段。要完成這些步驟,您必須以 root 使用者的身份進行登入。這些步驟如下所示:

       (1)準備下載下傳 perfpmr。

       (2)下載下傳 perfpmr。

       (3)安裝 perfpmr。

       (4)運作 perfpmr。

       (5)上傳測試用例。

4.2.1 為 perfpmr 做好準備

在運作 perfpmr.sh 之前,應該安裝下列這些檔案集:

       (1)bos.acct

       (2)bos.sysmgt.trace

       (3)perfagent.tools

       (4)bos.net.tcp.server

       (5)bos.adt.include

       (6)bos.adt.samples

       可以從下面的位置下載下傳 perfpmr:

              ftp://ftp.software.ibm.com/aix/tools/perftools/perfpmr

       使用浏覽器,下載下傳适合的 AIX 5L 版本。該檔案的大小應該小于 1 MB。

       重要:如果有新的更改,請始終下載下傳新的副本。不要使用現有的、以前下載下傳的副本。

       如果您已經将 perfpmr 下載下傳到了個人計算機,那麼可以使用 ftp,以二進制的模式将其傳輸到系統中,并将其放到一個空的目錄中。

4.2.2 安裝 perfpmr

使用 tar 指令解壓縮并提取該檔案中的内容。這個目錄中包含下列檔案:

(1)Install

(2)PROBLEM.INFO

(3)README

(4)config.sh

(5)emstat.sh

(6)filemon.sh

(7)getdate

(8)getevars

(9)iostat.sh

(10)iptrace.sh

(11)lsc

(12)memfill

(13)monitor.sh

(14)netstat.sh

(15)nfsstat.sh

(16)perfpmr.cfg

(17)perfpmr.sh

(18)pprof.sh

(19)ps.sh

(20)pstat.sh

(21)sar.sh

(22)setpri

(23)setsched

(24)svmon

(25)tcpdump.sh

(26)tprof.sh

(27)trace.sh

(28)vmstat.sh

       在這個目錄中,您将發現一些以 .sh 結尾的檔案。這些都是 Shell 腳本,可以單獨執行它們。正常情況下,在運作 perfpmr.sh 時将自動地運作這些 Shell 腳本。要了解适用于您的系統的任何附加步驟,請閱讀 README 檔案。

       通過運作 ./Install 安裝 perfpmr。該操作會将 /usr/bin 目錄中的下列檔案替換為指向您安裝 perfpmr 指令的目錄中的檔案的符号連結:

1)        config.sh

2)        curt

3)        emstat.sh

4)        filemon.sh

5)        getevars

6)        hd_pbuf_cnt.sh

7)        iostat.sh

8)        iptrace.sh

9)        lsc

10)    monitor.sh

11)    netstat.sh

12)    nfsstat.sh

13)    perfpmr.sh

14)    pprof.sh

15)    ps.sh

16)    sar.sh

17)    setpri

18)    tcpdump.sh

19)    tprof.sh

20)    trace.sh

21)    utld

22)    vmstat.sh

安裝過程的輸出與示例 4 所示類似。

示例 4 perfpmr 安裝螢幕

# ./Install

(C) COPYRIGHT International Business Machines Corp., 2000

PERFPMR Installation started...

PERFPMR Installation completed.

4.2.3  運作 perfpmr

       在運作 perfpmr 指令時,有兩種情況需要考慮。

       如果您的系統在很長一段時間内性能低下,并且您可以預測出運作緩慢的具體時間,那麼您就可以運作 ./perfpmr.sh 600。

       在某些情況下,系統可能工作正常,但是在一天中的其他一些時間,卻運作緩慢。如果您運作 perfpmr.sh 600,那麼 perfpmr 可能出現無法捕獲性能緩慢的情況。在這種情況下,您可以在系統運作緩慢的時候手動地運作該腳本,并使用一個較長的逾時時間段,例如,trace.sh 15 指令将執行跟蹤任務 15 秒,而不是預設的 5 秒。在運作各個腳本之前,我們可能還需要先運作 perfpmr.sh 600。這将確定捕獲所有的資料和配置。

       注意:如果您正在使用 HACMP,那麼您可能希望在收集 perfpmr 資料之前,延長 Dead Man Switch (DMS) 逾時、或者關閉 HACMP,以避免意外的故障轉移。

在執行 perfpmr.sh 之後,它将建立表 3 中給出的檔案。

config.sum crontab_l devtree.out
errpt_a etc_security_limits filemon.sum
genkex.out genkld.out gennames.out
getevars.out iptrace.raw lsps.after
lsps.before lsrset.out monitor.int
monitor.sum netstat.int nfsstat.int
perfpmr.int pprof.trace.raw psa.elfk
psb.elfk psemo.after psemo.before
svmon.after svmon.before tcpdump.raw
tprof.csyms tprof.ctrc tprof.out
tprof.sum trace.crash.inode trace.fmt
trace.inode trace.j2.inode trace.maj_min2lv
trace.nm trace.raw trace.raw-0
trace.raw-1 trace.raw-10 trace.raw-11
trace.raw-12 trace.raw-13 trace.raw-14
trace.raw-15 trace.raw-2 trace.raw-3
trace.raw-4 trace.raw-5 trace.raw-6
trace.raw-7 trace.raw-8 trace.raw-9
trace.syms tunables_lastboot tunables_lastboot.log
tunables_nextboot vfs.kdb vmstat_v.after
vmstat_v.before vmstati.after vmstati.before
vnode.kdb w.int

       技巧:在安裝 perfpmr 指令之後,您可以在任何時候運作該指令,以確定捕獲上述的所有檔案。通過執行這項操作,您可以确信将得到完整的測試用例。

4.2.4 上傳測試用例

       該目錄中還包含一個必須完成的、名為 PROBLEM.INFO 的檔案。按照 README 檔案中的說明,使用 tar 指令對這些檔案進行打包,将其上傳給 IBM。

示例 5 是運作 perfpmr.sh 600 的示例。

# perfpmr.sh 600

(C) COPYRIGHT International Business Machines Corp., 2000,2001,2002,2003

16:54:32-11/29/05 :     perfpmr.sh begin

PERFPMR:hostname:server2

PERFPMR:perfpmr.sh Version 530 2005/10/19

PERFPMR:current directory:/home/gpsilva

PERFPMR:perfpmr tool directory:/home/gpsilva

PERFPMR:Parameters passed to perfpmr.sh: 600

PERFPMR:Data collection started in foreground (renice -n -20)

TRACE.SH:Starting trace for 5 seconds

/bin/trace -r PURR -k 492,10e,254,116,117  -f -n -C all -d -L 20000000 -T

200000                                                                             

00 -ao trace.raw

TRACE.SH:Data collection started

TRACE.SH:Data collection stopped

TRACE.SH:Trace stopped

TRACE.SH:Collecting gennames data

TRACE.SH:Trcnm data is in file trace.nm

TRACE.SH:/etc/trcfmt saved in file trace.fmt

TRACE.SH:Binary trace data is in file trace.raw

TRACE.SH:Enabling locktrace

lock tracing enabled for all classes

TRACE.SH:Starting trace for 5 seconds

/bin/trace -r PURR -j 106,10C,10E,112,113,134,139,465,46D,606,607,608,609

-f -n -C all -d -L 20000000 -T 20000000 -ao trace.raw.lock

TRACE.SH:Data collection started

TRACE.SH:Data collection stopped

TRACE.SH:Trace stopped

TRACE.SH:Disabling locktrace

lock tracing disabled for all classes

TRACE.SH:Binary trace data is in file trace.raw.lock

MONITOR:Capturing initial lsps, svmon, and vmstat data

MONITOR:Starting system monitors for 600 seconds.

MONITOR:Waiting for measurement period to end....

MONITOR:Capturing final lsps, svmon, and vmstat data

MONITOR:Generating reports....

MONITOR:Network reports are in netstat.int and nfsstat.int

MONITOR:Monitor reports are in monitor.int and monitor.sum

IPTRACE:Starting iptrace for 10 seconds....

0513-059 The iptrace Subsystem has been started.Subsystem PID is 389334.

0513-044 The iptrace Subsystem was requested to stop.

IPTRACE:iptrace collected....

IPTRACE:Binary iptrace data is in file iptrace.raw

TCPDUMP:Starting tcpdump for 10 seconds....

TCPDUMP:tcpdump collected....

TCPDUMP:Binary tcpdump data is in file tcpdump.raw

FILEMON:Starting filesystem monitor for 60 seconds....

FILEMON:tracing started

FILEMON:tracing stopped

FILEMON:Generating report....

TPROF:Starting tprof for 60 seconds....

TPROF:Sample data collected....

TPROF:Generating reports in background (renice -n 20)

TPROF:Tprof report is in tprof.sum

17:07:43-11/29/05 :     config.sh begin

CONFIG.SH:Generating SW/HW configuration

17:07:43-11/29/05 :     copying ODM files

17:07:44-11/29/05 :     ipcs -Sa

17:07:44-11/29/05 :     lspv

0516-320 : Physical volume 00c478de09caf37f0000000000000000 is not assigned

to a volume group.

0516-320 : Physical volume 00c478de49630c6a0000000000000000 is not assigned

to a volume group.

0516-320 : Physical volume 00c478de006552460000000000000000 is not assigned

to a volume group.

17:07:45-11/29/05 :     lsvg -l

17:07:45-11/29/05 :     lslv lv

17:07:48-11/29/05 :     lsattr -E -l dev

17:07:49-11/29/05 :     df

17:07:49-11/29/05 :     netstat -in -rn -D -an -c

17:07:50-11/29/05 :     getmempool.sh

17:07:51-11/29/05 :     getj2mem.sh

17:07:51-11/29/05 :     genkld

17:07:51-11/29/05 :     genkex

17:07:51-11/29/05 :     getevars

17:07:51-11/29/05 :     errpt

17:07:51-11/29/05 :     emgr -l

There is no efix data on this system.

17:07:51-11/29/05 :     lslpp -ch

17:07:51-11/29/05 :     instfix -ic

17:07:52-11/29/05 :     lscfg -vp

17:07:53-11/29/05 :     xm -u |kdb

17:07:53-11/29/05 :     echo vnode|kdb

17:07:56-11/29/05 :     echo vfs|kdb

17:07:57-11/29/05 :     echo dmpdt_chrp -i

17:07:58-11/29/05 :     sysdumpdev -l, -e

CONFIG.SH:Report is in file config.sum

17:07:58-11/29/05 :     config.sh completed

PERFPMR:Data collection complete.

PERFPMR:Data files can be archived and gzipped using:

perfpmr.sh -z filename [-o "dirs"] where filename is the name of the archive file.

An example of a typical archive filename:

/tmp/NNNNN.bNNN.cNNN.perfpmr.pax.gz

where NNNNN is the pmr#, .bNNN is the pmr branch #,and .cNNN is the country code -o "dirs":

dirs is a list of directories enclosed in quotes.If -o is not specified, all files in current directory are archived.

You must be in the directory which contains the list

of directories when using the -z and -o flags

After pax gzip file has been created, ftp the file to:

testcase.software.ibm.com in /aix/toibm Login as user id:ftp

17:07:58-11/29/05 :     perfpmr.sh completed

       技巧:當您的系統負載較低,并且正常運作的時候,運作 perfpmr 指令是非常有價值的。這将為您提供一個基準,以确定将來的性能問題。

您應該在下列情況下再次運作 perfpmr 指令:

1)        您的系統出現了性能問題。

2)        您對系統進行了硬體更改。

3)        您對網絡配置進行了更改。

4)        您對 AIX 5L 作業系統進行了更改,比如當您安裝更新程式、或者優化 AIX 5L 時。

5)        您對應用程式進行了更改。

五. 撥打 IBM 的支援電話

要撥打 IBM 的支援電話,您必須執行下面的這些步驟:

1)        确定您的問題對業務的影響。

2)        描述您的問題,并收集背景資訊。

3)        将您的問題送出到 IBM Support。

4)        更新您的請求。

确定您的問題對業務的影響

       當您向 IBM 報告問題時,IBM 會要求您提供一個嚴重性級别。是以,您需要了解并評估所報告的問題對業務的影響。

使用表 4 以選擇相應的嚴重性級别。

嚴重性級别 業務影響
嚴重性級别1 嚴重的業務影響:您無法使用該程式,導緻對相關操作産生嚴重的影響。這種情況需要緊急的解決方案。
嚴重性級别2 重大業務影響:程式無法使用,受到很大的影響。
嚴重性級别3 一定的業務影響:程式無法使用,并且一些不是很重要的特性(并不會對相關操作産生嚴重的影響)無法使用。
嚴重性級别4 很小的業務影響:問題對相關操作産生很小的影響,或者已經對問題進行了合理的限制。

描述您的問題并收集背景資訊

       在向 IBM 解釋一個問題時,請盡可能具體一些。包括所有的相關背景資訊,以便 IBM 支援專家可以高效地幫助您解決這個問題。

為了節約時間,請仔細考慮并回答下面的這些問題:

1)        問題發生在哪台計算機上?記錄下序列号。

2)        在發生問題時,運作的是什麼版本的軟體?

3)        您是否有與問題症狀相關的日志、跟蹤和消息?

4)        這個問題是否可以重制?如果是,那麼什麼樣的操作将導緻這個故障?

5)        是否對系統進行過任何更改?例如,硬體、作業系統、網絡軟體,等等。

6)        對于這個問題,您是否正在使用某種權宜之計?如果是,請準備好在報告該問題時對其進行解釋。

7)         

将您的問題送出到 IBM Support

您可以采取下面兩種方式來送出您的問題:

線上:

       軟體問題:使用 http://www.ibm.com/software/support/esr/support_contracts 上的 Electronic Service Request (ESR)

       硬體問題:使用 http://www.ibm.com/support/esc/signin.jsp 上的 Electronic Service Call (ESC+)

打電話:要擷取您所在國家/地區的電話号碼,請在網站 (http://www.ibm.com/planetwide/) 上轉到聯系頁面,并選擇您所在國家/地區的名稱。

更新您的請求

       如上所述,通過使用聯機的表單或者電話,您始終可以更新您的支援請求。請引用支援專家為您提供的問題編号。對于報告到 IBM 支援中心的任何問題,将建立一個問題管理記錄(Problem Management Record,PMR)。PMR 是一種聯機的軟體記錄,用于跟蹤客戶所報告的軟體問題。

       以聯機的方式更新請求具有一個優點,那就是,您可以很容易地将相關檔案附加到 PMR,例如,螢幕截圖、日志,等等。

       可以采用相同的過程來結束電話、或者更改嚴重性級别。

FROM:

IBM AIX V5.3 系統管理(Test 222)認證指南系列,第 5 部分:問題的确定和解決(下)

http://www.ibm.com/developerworks/cn/aix/redbooks/test222/problem-determine/2.html

------------------------------------------------------------------------------

QQ:492913789

Email:[email protected]

Blog: http://www.cndba.cn/dave 

網上資源: http://tianlesoftware.download.csdn.net

相關視訊:http://blog.csdn.net/tianlesoftware/archive/2009/11/27/4886500.aspx

DBA1 群:62697716(滿); DBA2 群:62697977(滿)

DBA3 群:62697850   DBA 超級群:63306533;    

聊天 群:40132017

--加群需要在備注說明Oracle表空間和資料檔案的關系,否則拒絕申請