如果把用于决策树模型建立的数据集称为训练集,而另一独立的,对建立的决策树模型进行测评的数据集称为测试集,则“最大树”模型可能不仅拟合了训练集中主要分支变量的特征,也拟合了其中的误差,即“噪声”,因此需要对其进行修剪,使过度拟合得以纠正。为复杂度参数,是对于决策树某一分支在增加了树的复杂性的同时应保证增加多少额外的精确性的一种度量。建立决策树的目标在于获得最高精度的分类或预测值,以期为决策提供参考依据。可按以下特性对决策树模型进行评估:准确、简洁、易行、易于理解和解释以及能发掘复杂数据的内在关系。其他相关方 ......