基因芯片数据的分类分析是一种有监督的学习方法,即样本的类别是已知的,通常以基因为特征,通过已知类别的样本训练分类器,评价分类器的效能,并对未知类别的样本进行预测。目前常用的分类方法包括线性判别法、贝叶斯分类法、人工神经网络、k近邻分类法、支持向量机、决策树和决策森林等,本节主要介绍k近邻、决策树、支持向量机等分类方法以及一些常用的分类效能的评价指标。不同疾病涉及的基因不同,同种疾病在分子层面也存在着较大的异质性,因此,针对疾病相关的芯片数据进行分类分析时,如何选取合适的基因作为特征构建稳定的分类器以达到临 ......