ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例
目錄
基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例
# 1、定義資料集
# 2、資料預處理
# 2.1、類别特征編碼
# 2.2、特征篩選且空值填充
# 3、模型訓練與推理
# 3.1、資料集切分
# 3.2、模型訓練
# 4、PDP實作模型可解釋性
4.1、Sex_encoding可視化
# (1)、繪制不同特征值(特征網格)的平均目标值:檢查特征和目标之間的資訊
# (2)、繪制跨不同特征值(特征網格)的模型預測分布
# (3)、計算并繪制PDP圖解釋模型預測
4.2、Pclass可視化
相關文章
ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例
ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例實作
基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例
# 1、定義資料集
PassengerId | Survived | Pclass | Name | Sex | Age | SibSp | Parch | Ticket | Fare | Cabin | Embarked |
1 | 3 | Braund, Mr. Owen Harris | male | 22 | 1 | A/5 21171 | 7.25 | S | |||
2 | 1 | 1 | Cumings, Mrs. John Bradley (Florence Briggs Thayer) | female | 38 | 1 | PC 17599 | 71.2833 | C85 | C | |
3 | 1 | 3 | Heikkinen, Miss. Laina | female | 26 | STON/O2. 3101282 | 7.925 | S | |||
4 | 1 | 1 | Futrelle, Mrs. Jacques Heath (Lily May Peel) | female | 35 | 1 | 113803 | 53.1 | C123 | S | |
5 | 3 | Allen, Mr. William Henry | male | 35 | 373450 | 8.05 | S |
# 2、資料預處理
# 2.1、類别特征編碼
# 2.2、特征篩選且空值填充
Pclass Age SibSp Parch Fare Sex_encoding Embarked_encoding \
0 3 22.0 1 0 7.2500 1 0
1 1 38.0 1 0 71.2833 0 1
2 3 26.0 0 0 7.9250 0 0
3 1 35.0 1 0 53.1000 0 0
4 3 35.0 0 0 8.0500 1 0
Survived
0 0
1 1
2 1
3 1
4 0
# 3、模型訓練與推理
# 3.1、資料集切分
# 3.2、模型訓練
# 4、PDP實作模型可解釋性
4.1、Sex_encoding可視化
# (1)、繪制不同特征值(特征網格)的平均目标值:檢查特征和目标之間的資訊
![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiI0gTMx81dsQWZ4lmZf1GLlpXazVmcvwFciV2dsQXYtJ3bm9CX9s2RkBnVHFmb1clWvB3MaVnRtp1XlBXe0xCMy81dvRWYoNHLwEzX5xCMx8FesU2cfdGLwMzX0xiRGZkRGZ0Xy9GbvNGLpZTY1EmMZVDUSFTU4VFRR9Fd4VGdsYTMfVmepNHLrJXYtJXZ0F2dvwVZnFWbp1zczV2YvJHctM3cv1Ce-cmbw5iM2kjM3UWOkVTO1MTN0QWZyYzX3MDOyADM2AzLchDMyIDMy8CXn9Gbi9CXzV2Zh1WavwVbvNmLvR3YxUjLyM3Lc9CX6MHc0RHaiojIsJye.png)