天天看點

dell PowerEdge R720 自動重新開機分析

一,問題描述:

   在同一批伺服器當中,碰到這樣一台伺服器,如果不跑任何服務時沒有問題,但一跑任務就是自動重新開機。既然同樣的系統别的伺服器都沒出現這種問題,此時通過快速服務代碼找dell售後。

二,安裝日志收集工具Dell System E-Support Tool (DSET) 3.5.1 - [Linux 64-bit],下載下傳位址:

<a href="http://downloads.dell.com/FOLDER01894671M/1/dell-dset-lx64-3.5.1.101.bin" target="_blank">http://downloads.dell.com/FOLDER01894671M/1/dell-dset-lx64-3.5.1.101.bin</a>

下載下傳後:

chmod +x dell-dset-lx64-3.5.1.101.bin

./dell-dset-lx64-3.5.1.101.bin

<a href="http://s3.51cto.com/wyfs02/M00/12/1E/wKioL1L5083Rgxo9AAKnvUqGtZg007.jpg" target="_blank"></a>

版權聲明,直接按q退出即可。如果提示這個,隻需要到/opt/dell/advdiages/dest/uninstall.sh 解除安裝即可。

Dell System E-Support Tool 3.5.1 is already installed on your system.

Uninstall DSET by running uninstall.sh from the /opt/dell/advdiags/dset location, and then install this version of DSET.

<a href="http://s3.51cto.com/wyfs02/M02/12/1D/wKiom1L51DryMitGAAEK7xpyS_8681.jpg" target="_blank"></a>

按y同意後

<a href="http://s3.51cto.com/wyfs02/M01/12/1E/wKioL1L51kSBLLU1AAKFHFqvlRo674.jpg" target="_blank"></a>

選擇2後,彈出下面對話框

<a href="http://s3.51cto.com/wyfs02/M00/12/1E/wKioL1L51jKTMvWjAAGoDqFP1FY274.jpg" target="_blank"></a>

等待收集完後,預設存儲在目前目錄下,下載下傳下來檢視日志中的錯誤。

三,分析日志,解壓需要輸入密碼,密碼是dell。解壓完後,用dsetreport.hta檢視日志。

這個報錯CPU 1 M01 VDDQ PG voltage is outside of range.,但是cpu 及電壓又都是正常的。

建議您機器關機拔除所有電源,長按開機按鈕30s-60s 後在 接上電源線開機,一般報錯就會消失。

另外更新下bios 版本到最新,更新方法直接在linux 系統下運作更新程式即可(更新過程中請勿斷電)

Bios 下載下傳位址

Bios Firmware Version 2.1.3, Released 12/18/2013, Recommended, requires immediate reboot

Red Hat: http://downloads.dell.com/FOLDER01866020M/1/BIOS_3VRRM_LN_2.1.3.BIN

本文轉自 deng304749970 51CTO部落格,原文連結:http://blog.51cto.com/damondeng/1358047,如需轉載請自行聯系原作者

繼續閱讀