大型队列研究是一种系统的病因学研究方法,主要针对数万或数十万人群,在数十年内持续对人群健康状况和疾病(尤其是慢性病)进行追踪、随访调查和相关研究,以了解人群健康状况和疾病发生情况随社会经济改变而发生的变化及其影响因素,为人群疾病的防治提供科学证据。大型队列的建设,将伴随产生海量的数据。数据种类多种多样,例如问卷数据、标本数据、随访数据以及实验室检测结果等。基于大样本队列人群的流行病学多元数据库、全基因组关联研究、基因表达研究、全基因组测序等获得的信息维度高、体量大,蕴含了丰富的信息(体量巨大) 。这些收集 ......