天天看点

机器学习(周志华)4.1-4.1习题解答

4.1

        题:试证明对于不含有冲突数据(即特征向量完全相同但标记不同)的训练集,必然存在与训练集一致(即训练误差为0)的决策树。

        答:根据决策树学习基本算法可知:

                1.当前节点包含的样本全属于同一类别,无需划分

                2.当前属性集为空,或者样本所有属性上取值相同,无法划分

            故若两个特征向量完全相同,则决策树有相同点,若特征向量不同,则会出现误差,决策树和训练集不一致。即证

4.2

        题:试分析使用“最小训练误差”作为决策树划分选择准则的缺陷。