数据资料的清理需要结合调查设计、研究现场特点和专业知识,以便确信数据是干净、完整和适合于要作的分析。对于分类变量,则观察频数分布范围是否超出变量标签中定义的变量值,如性别分为:“ 1 ”为男,2”为女,但是变量值如果出现“ 4 ”即为奇异值。有时可根据具体情况进行适当的替代,如牙龈出血分为:“ 0 ”无出血,1”有出血,某一受检者的连续几个牙位的“牙龈出血”变量均为“ 1 ”,除了中间有一个牙位的变量值为“ 11 ”,这个数值明显超出了变量标签的范围,而且很可能是由于录入过程中的手误导致的。所以需要查阅原 ......