变量聚类分析是基因表达谱分析中最常用的方法之一,其目的就是将基因从功能表达的角度进行分类。聚类分析在对变量进行分类时,通常采用相似系数来表示变量之间的亲疏程度,常用的相似系数主要有相关系数和夹角余弦,它们的定义分别如下:相关系数:变量x 1与变量x 2的相关系数通常用r ij来表示,其定义如下:公式19-。在实际应用时,可以应用WEIGHT指令将所有的变量视为同等重要,也可以指定各变量的加权值等于各变量的标准差的倒数。FREQ语句与上述的WEIGHT语句类似,是根据变量中的频数对变量进行加权,因此它后面的 ......