ceph叢集報錯：HEALTH_ERR 1 pgs inconsistent; 1 scrub errors

2017-07-24 19:35:23

報錯資訊如下：

[root@ceph-6-11 ~]# ceph health detail

HEALTH_ERR 1 pgs inconsistent; 1 scrub errors;

pg 2.37c is active+clean+inconsistent, acting [75,6,35]

1 scrub errors

報錯資訊總結：

問題PG：2.37c

OSD編号：75,6,35

執行正常修複：

ceph pg repair 2.37c

檢視修複結果：

HEALTH_ERR 1 pgs inconsistent; 1 scrub errors

問題依然存在，異常pg沒有修複；

然後執行:

要洗刷一個pg組，執行指令：

ceph pg scrub 2.37c

ceph pg deep-scrub 2.37c

以上指令執行後均未修複，依然報上面的錯誤，檢視相關osd 日志報錯如下：

2017-07-24 17:31:10.585305 7f72893c4700 0 log_channel(cluster) log [INF] : 2.37c repair starts

2017-07-24 17:31:10.710517 7f72893c4700 -1 log_channel(cluster) log [ERR] : 2.37c repair 1 errors, 0 fixed

此時已經被坑了好久了，決定修複pg 設定的三塊osd ，執行指令如下：

ceph osd repair 75

ceph osd repair 6

ceph osd repair 35

修複指令執行後等待一段時間，osd 修複完成，發現錯誤依然存在！！！！！！！！！此時想做下面兩個操作，

1：找到pg object資訊，把主osd 上面的資料删掉，讓後讓叢集修複；

2：修改pg現在使用的主osd資訊，現在是osd 75 ，改成别的磁盤（沒找到方法修改）；

此時看到ceph社群的一個bug 資訊：

http://tracker.ceph.com/issues/12577

發現有些嘗試有人已經做過了，而且又是一個bug！！！！！！！！！！

最後決定用一個最粗暴的方法解決，關閉有問題pg 所使用的主osd 75

查詢pg 使用主osd資訊

ceph pg 2.37c query |grep primary

"blocked_by": [],

"up_primary": 75,

"acting_primary": 75

執行操作如下：

systemctl stop ceph-osd@75

此時ceph開始資料恢複，将osd75 上面的資料在其它節點恢複，等待一段時間，發現資料滾動完成，執行指令檢視叢集狀态。

[root@ceph-6-11 ~]# ceph health detail

pg 2.37c is active+clean+inconsistent, acting [8,38,17]

看到上面的資訊，心都要碎了！為啥還是這樣？不報希望的執行以下正常修複！

[root@ceph-6-11 ~]# ceph pg repair 2.37c

'instructing pg 2.37c on osd.8 to repair

然後檢視叢集狀态：

HEALTH_OK

ceph叢集報錯：HEALTH_ERR 1 pgs inconsistent; 1 scrub errors

繼續閱讀

Eclipse安裝SVN插件通路遠端倉庫報錯

SVN：eclipse 中update操作報錯：E155004:Working copy 'xxxx/xxx/xxx' locked

Centos7 ceph叢集安裝 cephfs用戶端挂載 java代碼調用

openstack對接ceph第1章 Openstack對接ceph

建構超融合OpenStack [融合ceph做後端存儲]

openstack 管理三十九 - cinder 連接配接多個 ceph 存儲方法環境說明目标cinder server 配置

ceph-iscsi原理及部署

ceph元件介紹及基于ceph-deploy部署ceph元件介紹及基于ceph-deploy部署

ceph部署及使用一、機器換源

Error creating bean with name ‘entityManagerFactory‘ defined in class path resource [org/springframe

mybatis查詢報錯 invalid comparison: java.util.Date and java.lang.String

Ceph介紹（一）：基本原理

QT如何修改[設計師界面類]的名稱(視窗或控件名字)？

關于運作robot framework 報錯解決方法，ModuleNotFoundError: No module named ‘robot‘

cephadm離線搭建v17.2.0 Quincy版本Ceph叢集叢集規劃準備工作

myeclipse 搭建mybatis架構時報錯（1）Communications link failure 通訊連結故障