分类与预测是两种数据分析形式,它们可以用来抽取能够描述重要数据集合或预测未来数据趋势的模型。分类方法(classification)用于预测数据对象的离散类别(categorical label)。目前数据挖掘方法都要求具有基于外存以处理大规模数据集合能力且具有可扩展能力。另外,由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。神经网络是基于经验风险最小化原则的学习算法,有一些固有的缺陷,比如层数和 ......