当待分类的样品较多时,如海量数据挖掘,系统聚类分析将耗费较多的计算资源来储存相似性系数矩阵,计算速度缓慢。针对系统聚类方法的这些缺陷,统计学者提出所谓动态聚类分析方法,这种分类方法既解决了计算速度问题,又能随着聚类的进展对样品的归类进行调整。动态样品聚类的原理是:首先确定几个有代表性的样品,称之为凝聚点,作为各类的核心,然后将其他样品逐一归类,归类的同时按某种规则修改各类核心直至分类合理为止。动态样品聚类方法中最常用的一种是k‐means法,此法的聚类步骤如下:指定拟分类数目k,随机选择k个样品作为凝聚点 ......