利用生物信息学相关的各种方法可以建立不同知识库,并将这些库里面的内容相互关联,提供综合的解释,由此诞生了基因组注释数据库。当前最著名的两个基因组注释数据库为日本京都基因与基因组百科全书( kyoto encyclopedia of genes and genomes , KEGG )和基因本体论( cene ontology , GO ) 。KEGG GENES是一个收集所有物种基因(来自RefSeq数据库中的完整测序的基因组)的数据库。其中数据库代码可以由KEGG GENOME数据库中的T编码标识符替换,如人类“ hsa ”等价于T01001 。使用富集分析时只需将所获取的与研究表型相关的基因集输入,选定本体类型和物种类型即可进行分析。
……