在对一个蛋白质进行其家族分析时,先以该蛋白质的氨基酸序列作为查询序列,对蛋白质数据库进行同源建模。即在蛋白质数据库中进行其直系或旁系同源序列的蛋白质搜索,通常至少能找到一条同源序列,且两条序列存在显著相似的区域。这些有序列或结构显著相似的区域在不同的数据库中的命名可以是不一样的,但其生物学意义却是一致或近似的。如:结构域( domain ) 、签名( signature ) 、模块( module ) 、模块元件( modular element ) 、折叠子( fold ) 、模体( motif ) 、 ......