进行流行病学数据分析,必须首先了解和确定数据中变量的分类、用途和特征。典型的流行病学研究数据中的变量主要可分为以下5种:暴露、结局、混杂因素、效应修饰因素和其他变量。识别这些变量在流行病学研究中的分类和用途,是分析数据的基础。比如,在研究吸烟和肺癌关系的队列研究中,吸烟是暴露因素,肺癌是结局指标,年龄、性别和肺癌的其他危险因素是潜在的混杂因素,同时也是潜在的效应修饰因素。其他变量可能包括病人的联系信息、数据收集的可重复性信息、抽样概率信息等,它们在一般数据分析中的用途不大。混杂因素和效应修饰因素从本质上必 ......