对数据中的缺失值所在的样本或变量常常不能采用简单删除的方法,例如当非随机缺失值集中在少数个体,或缺失值散布于多个个体或多个变量,删除的处理方式会影响资料的代表性和组间的均衡性,造成信息的丧失,因此建议采用其他缺失值处理方式,估计缺失值。即利用辅助信息为每个缺失值寻找替代值。首先,用带有完整资料(没有缺失值)的样本数据(若干个变量)建立回归方程,用该方程预测带有不完整资料的样本缺失值,如在例8 - 1中首先把带有缺失值的1 , 3 , 5 , 8 , 14 , 15号样本去掉,则剩下的14个样本资料为完整资 ......