（一）PIR

PIR是一个全面的、经过注释的、非冗余的数据库，几乎包含所有序列已知的自然界中野生型蛋白质的信息。包括蛋白质序列数据库（PSD）、PIR注释和相似性数据库（ASDB）、文献数据库（NREF）等。所有的数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族分类。PSD的注释中还包括对许多序列、结构、基因组和文献检索数据库的交叉索引，以及数据库内部条目之间的索引。结合序列相似性、注释信息和蛋白质家族信息的高级搜索。