由于获取的芯片原始数据来自不同的芯片平台,数据信息会有差异。往往需要前期的数据预处理以后才能进行深层次的数据挖掘,这种预处理主要包括数据提取、数据对数转化、数据过滤、补缺失值和标准化处理等。芯片原始数据一般呈偏态分布,如果对数据做对数化转换后,数据可近似正态分布,从而为后续的数据分析带来方便。单通道芯片的标化方法与cDNA芯片的标化方法有所差别,但它不是应用于两种不同的染色通道,而是应用于两张芯片。 ......