基因的编码序列具有一些特征性序列,比如,可阅读框、蛋白质翻译的起始密码子和终止密码子,而且真核基因的外显子(编码序列)和内含子(非编码序列)之间有特殊序列等,都为基因编码区的鉴定提供了线索。一般认为,4和-6位碱基对蛋白质的翻译起始非常重要,在意大利东南部的一个家庭发现β-球蛋白(β +)mRNA中Kozak序列的-6位G变成了C,使血红蛋白的球蛋白比例出现错误,链减少而α链相对过剩,导致地中海贫血的发生。 ......