权威医学专著速查系统

二、常用的聚类方法

K均值聚类(k-means clustering)是根据对象的均值进行聚类划分的分割算法,适用于各种数据类型,受初始化问题的影响较小,算法简单,运算速度快。另外,k均值聚类需要预先指定类别个数,但是由于是无监督学习方法,在实际应用中一般不知道真实的类别个数,一些启发式的方法可以帮助确定k的取值。该软件给出四种度量方法,分别是质心距离、最小距离、最大距离和平均距离,在此我们选择质心距离的方法对数据进行聚类,参数选择如图2-26所示:图2-25对数据进行Center处理。打开TreeView软件,导入GSE5 ......

——《生物信息学理论与医学实践》
书名:《生物信息学理论与医学实践》
栏目:生物信息学理论与医学实践 > 第二章 基因芯片数据分析 CHAPTER 2 MICROARRAY DATA ANALYSIS > 第四节 基因芯片数据的聚类分析
作者:李霞
参编:张岩,陈秀杰,陈丽娜,王艳秋,刘磊
页码:100-107
版本:1
出版社:人民卫生出版社
出版时间:2013-01-01
© 2015-2019 天山医学院 XiaBBY#VIP.QQ.COM