搞懂一般的stacking和blending只需一张图片,搞不懂我把这张图片的纸吃了!!!
下面再简单参考一下其他博主的对于这两种集成方法的比较:
Blending的优点在于:
1.比stacking简单(因为不用进行k次的交叉验证来获得stacker feature)
2.避开了一个信息泄露问题:generlizers和stacker使用了不一样的数据集
3.在团队建模过程中,不需要给队友分享自己的随机种子
而缺点在于:
1.使用了很少的数据
2.blender可能会过拟合(其实大概率是第一点导致的)
3.stacking使用多次的CV会比较稳健
感觉很多博客都有这段文字,也不知道谁是一开始的原创,就贴我复制的这个博主的链接吧!!
参考文献:https://blog.csdn.net/sinat_29819401/article/details/71191219