聚类分析是被广泛应用的一种多元统计分析方法,它是根据“物以类聚”的基本原理将相似的对象组成群体的一种方法。样品聚类分析的主要目的就是将相似的样品放在一类中。对样品亲疏关系描述目前用得最多的是距离,距离越近的事物归为一类,距离较远的事物归为不同的类。对于基因表达谱数据,样品聚类分析的目的是利用基因将不同类型的样品分开,从基因水平上阐明造成这些样品类型不同的原因以便进一步研究。针对COLON数据,利用SAS 9.2 CLUSTER过程筛选得到的30个差异基因对62例样本进行分类。可以根据30个差异基因进行新的 ......