决策树基本概念
决策树构建的两个阶段
?决策树生成:利用训练样本生成决策树模型;
?决策树剪枝:通过删除部分节点和子树以避免
“过度适合”。
※ 过度适合:也称过学习,指推出过多的假设与训练数据
集相一致。过学习将导致我们所作出的假设
泛化能力过差。
两类剪枝算法
? 预先剪枝:在树生成的过程中根据一定的准则(如树已
达到某高度,节点中最大的样本的比例达到 数据挖掘研究院
设定阈值)来决定是否继续扩张树。
? 后剪枝: 待决策树完全生成以后再进行剪枝。 数据挖掘研究院

