一些主要的生物信息学数据库如GenBank 、 EMBL 、 PIR 、 SWISS-PROT ,在建库的初期主要靠人工搜索科学期刊中核酸和蛋白质序列数据,然后录入到数据库中。这种收集方式费时费力,跟不上生物信息数据增长的速度。随着测序技术和克隆技术的发明和广泛应用,使得序列数据急剧增长,特别是人类基因组和各种模式生物基因组计划的启动和顺利实施,生物信息数据更是呈指数增长,巨大的生物信息数据仅靠科学期刊出版发行已经不可能,靠人工收集科学期刊中的信息数据更是不可能。 ......