聚类是一个无监督的学习过程,它同分类的根本区别在于:分类是需要事先知道所依据的数据特征,而聚类是要找到这个数据特征,因此,在很多应用中,聚类分析作为一种数据预处理过程,是进一步分析和处理数据的基础。作为数据挖掘的功能,聚类分析可以作为一个获得数据分布情况、观察每个类的特征和对特定类进一步分析的独立工具。然而数据挖掘的对象复杂多样,要求聚类分析的方法不仅能够对属性为数值类型的数据进行,而且要适应数据类型的变化。为了将数据或对象集合划分成不同类别,必须定义差异性或相似性的测度来度量同一类别之间数据的相似性和不 ......