由于基因芯片平台的差异、系统误差的存在以及后期计算的需要,在对基因芯片数据进行聚类、分类等分析之前,往往需要先进行预处理(pre-procession)。预处理的过程主要包括数据提取,将高通量的荧光信号转化成基因表达数据。数据过滤,去除异常数据和噪声数据。补缺失值,保证数据的完整性。通过选择文件中的标题行、第一行数据、探针所在列、第一列数据和第二列数据来确定基因表达谱的数据区域,点击“ Next ”会显示导入的文件中所包含的基因芯片的个数,即数据的列数。经过以上步骤,基因芯片的预处理已经结束,我们获得了经 ......