我们通常所说的生物信息学中的生物信息主要是指由实验测定和通过计算机运算得到的生物学数据,将这些数据按一定目标与功能分类收集整理,形成了目前海量的生物信息学数据库。事实上,通常所说的生物信息学数据库主要是指核酸和蛋白质一级结构即序列数据库、基因组数据库、生物大分子三维空间结构数据库。从数据库中的生物信息来源来看则可以将它分为原始数据库(也称一级数据库)和在原始数据库基础上通过一定的算法提取出的有用信息,并将它们整理搜集而成的二级数据库。比如蛋白质结构数据库即PDB、Swiss Prot数据库、EMBL、Gen Bank数据库等。最近有文献报道,截止2005年,人们已建立了719个生物信息学数据库,比2004年新增了171个。
……