针对不同的数据缺失情况,目前缺失数据的处理方法大致可分为以下四大类:完全数据的方法、加权的方法、填补的方法、模型的方法。缺失数据看似简单,但要区分其内在机制是十分复杂的,现在很多处理方法都是针对完全随机缺失和随机缺失,对于非随机缺失,尚没有很好的处理办法。上述介绍了很多种缺失值处理方法,那么该怎样选择处理方法呢?有研究认为数据缺失率< 1%时,对结果影响很小,可采用删除的方法。当缺失率在15%~60%之间时,可以用一些复杂精密的方法,比如多重填补、模型法等。然而当数据缺失率> 60%时,所有填补方法都无能 ......