从前面几种序列分析方法我们知道:当比对得分越高,则这两个序列越相似,表现。如果某个比对得分为S,与这个比对相同序列长度的随机序列比对得平均值为u,对应的标准偏差为σ,则Z值的计算为:10‐。在实际序列比对中,通常是确定待比对两个序列的长度,然后根据其长度及表10‐1的背景概率,由计算机产生一定量(通常是大于10000对)的序列对,应用局部比对法进行比较计算出相应的得分值,根据这些得分值计算出其平均值和标准偏差。总之,序列比对的统计显著性在生物大分子序列分析中非常重要,因为根据它可判断两个比对的质量。值得说明的是,序列的局部比对中得分的极值分布是从无空段比对(ungapped alignment)中推导得出的结论。
……