由于不同种族间等位基因频率普遍存在差异,若某些位点在种族间差异明显,且种族本身某疾病患病率就有所差异,那么这些位点和疾病间可能存在虚假的关联性。例如, Campbell等报道了LCT基因与身高的虚假关联,该基因中的若干个位点(如rs4988235和rs3754686 )在高加索人群内的若干个亚群间存在等位基因频率的差异,而这些亚群间平均身高也有差异,因而造成了LCT基因与身高的虚假关联性。在利用随机森林法挖掘一个高加索人的GWAS数据中身高的遗传因素时,研究者发现,若不校正人群分层, LCT基因中的位点具 ......