真核基因的识别问题一直是生物信息学的一个重要内容,基因启动子区的识别是完整基因结构识别中的重要一环。启动子是一段位于结构基因5 ’端上游的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地结合并具有转录起始的特异性。启动子的结构影响了它与RNA聚合酶的亲和力,从而影响了基因表达的水平。人类启动子区的识别是生物医学研究的基本需要,是构建基因调节网络的一个核心问题。但是,当用这些启动子预测工具来处理未知的、复杂的DNA序列时,识别的结果往往是比较严重的遗漏和偏高的假阳性率。 ......