这里所说的结构域,是指在一级结构上连续的残基顺序,它们除具有上述的蛋白质折叠单位的结构特征外,还有一些明显的序列特征,如二硫键的位置、不同蛋白质分子的局部序列同源单位,可称为序列结构域。序列结构域应包含在PROSITE数据库所收集的模式或位点中,但是与PROSI TE的模式或位点相比,结构域是较长的序列片段,一般含100~200个残基。同一类结构域其序列差异可能极大,因此难于用一个简单的“基准”序列或模式来描述。各种不同的模式匹配方法所共有的基本步骤是发展一种对一组序列的重要特征的基准表示或由此转化的权值 ......