天天看點

ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例

ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例

目錄

​​基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例​​

​​# 1、定義資料集​​

​​# 2、資料預處理​​

​​# 2.1、類别特征編碼​​

​​# 2.2、特征篩選且空值填充​​

​​# 3、模型訓練與推理​​

​​# 3.1、資料集切分​​

​​# 3.2、模型訓練​​

​​# 4、PDP實作模型可解釋性​​

​​4.1、Sex_encoding可視化​​

​​# (1)、繪制不同特征值(特征網格)的平均目标值:檢查特征和目标之間的資訊​​

​​# (2)、繪制跨不同特征值(特征網格)的模型預測分布​​

​​# (3)、計算并繪制PDP圖解釋模型預測​​

​​4.2、Pclass可視化​​

相關文章

ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例

ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例實作

基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例

# 1、定義資料集

PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked
1 3 Braund, Mr. Owen Harris male 22 1 A/5 21171 7.25 S
2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Thayer) female 38 1 PC 17599 71.2833 C85 C
3 1 3 Heikkinen, Miss. Laina female 26 STON/O2. 3101282 7.925 S
4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35 1 113803 53.1 C123 S
5 3 Allen, Mr. William Henry male 35 373450 8.05 S

# 2、資料預處理

# 2.1、類别特征編碼

# 2.2、特征篩選且空值填充

   Pclass   Age  SibSp  Parch     Fare  Sex_encoding  Embarked_encoding  \

0       3  22.0      1      0   7.2500             1                  0   

1       1  38.0      1      0  71.2833             0                  1   

2       3  26.0      0      0   7.9250             0                  0   

3       1  35.0      1      0  53.1000             0                  0   

4       3  35.0      0      0   8.0500             1                  0   

   Survived  

0         0  

1         1  

2         1  

3         1  

4         0  

# 3、模型訓練與推理

# 3.1、資料集切分

# 3.2、模型訓練

# 4、PDP實作模型可解釋性

4.1、Sex_encoding可視化

# (1)、繪制不同特征值(特征網格)的平均目标值:檢查特征和目标之間的資訊

ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例

# (2)、繪制跨不同特征值(特征網格)的模型預測分布

ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例

# (3)、計算并繪制PDP圖解釋模型預測

ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例

4.2、Pclass可視化

ML之PDP:基于titanic泰坦尼克是否獲救二分類預測資料集利用PDP部分依賴圖對RF随機森林和LightGBM模型實作可解釋性案例