天天看點

Troubleshooting OpenStack Bug- 每天5分鐘玩轉 OpenStack(162)問題描述問題分析解決問題

這是 OpenStack 實施經驗分享系列的第 12 篇。

客戶報告了一個問題:對 instance 執行 migrate 操作,幾個小時了一直無法完成,不太正常。

遇到這種情況,第一個要檢查的就是 instance 所在計算節點的 nova-compute.log 日志,但不幸的是沒有發現相關的錯誤。

如果 nova-compute 沒有錯誤,那更底層的 hypervisor 有相關報錯嗎? 打開 /var/log/libvirt/libvirtd.log,這裡我們發現了一些線索:

上面的 log 告訴我們:沒有找到 instance swap 對應 image backing file /var/lib/nova/instances/_base/swap_8192。

目前這個 instance 确實使用了一個 8192M 的 swap disk,但奇怪的是:正在使用的 image backing file 為什麼會不見了呢?

在排除了人為誤删後,懷疑是一個 bug。搜尋一下:

運氣不錯,第三個結果是 OpenStack 的 bug,好像就是我們要找的。 浏覽 bug 資訊發現描述的現象跟我們的情況一樣,而且在客戶使用的 kilo 版本上已經有 fix。

點選 commit 連結,可以看到 fix 都修改了哪些檔案。

對照客戶系統中的代碼,确實沒有包含該 fix,也印證了确實是這個 bug。

因為 fix 的檔案位于 nova 目錄,可見這是 nova 子產品的 bug。 接下來的工作就很直接了:

下載下傳 nova 的代碼。

安裝 kilo 的最新版本。

重新開機所有 nova-* 服務。

關于如何更新 OpenStack 元件,請參考上一節的方法。

下節教大家如何快速安全地給 instance 做快照。

本文轉自CloudMan6 51CTO部落格,原文連結:http://blog.51cto.com/cloudman/1905729

繼續閱讀