PIR是一个全面的、经过注释的、非冗余的数据库,几乎包含所有序列已知的自然界中野生型蛋白质的信息。包括蛋白质序列数据库(PSD)、PIR注释和相似性数据库(ASDB)、文献数据库(NREF)等。所有的数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族分类。PSD的注释中还包括对许多序列、结构、基因组和文献检索数据库的交叉索引,以及数据库内部条目之间的索引。结合序列相似性、注释信息和蛋白质家族信息的高级搜索。