造血是维持人的一生的重要生理过程。造血涉及造血干细胞(hematopoietic stem cells,HSC)的自我更新以及分化发育成多种具有不同形态和功能的血液细胞。这些过程受到微环境和造血细胞因子的调节,更重要的是受基因表达的严格控制。分化了的细胞的功能特异化与细胞中基因的特异表达密切相关,如红细胞中产生大量的血红蛋白,而粒细胞中产生特有的髓过氧化物酶、淋巴细胞中产生免疫球蛋白、血小板产生纤维蛋白原受体等。各种血液学疾病都与基因的结构改变或基因表达异常相关。

遗传信息流动中心法则

蛋白质由20种氨基酸组成,氨基酸之间的区别在于其不参与肽键形成的侧链基团的不同。细胞、组织和器官的性状主要取决于其聚集的蛋白质的结构和性质。分子生物学研究表明,基因是生物遗传信息贮存、传递和受控表达的最基本单位。基因通过控制蛋白质的结构、合成蛋白质的时间和数量,以及产生其他蛋白质来控制细胞、组织和器官的性状。基因线性排列于脱氧核糖核苷酸(DNA)链上。遗传信息贮存于核苷酸序列的排列中,DNA上的遗传信息经转录成核糖核酸(RNA),由RNA指导蛋白质的生物合成。遗传信息流动的方向为:DNA→RNA→蛋白质,即分子生物学中心法则。从分子生物的角度看来,自然界中发生的任何生命现象最终都是由基因控制的。任何一个细胞、组织和器官的生物特性和行为都可以在基因水平上进行研究。

中心法则的一个例外是在一些病毒中遗传信息贮存在RNA分子上。如与T-细胞白血病/淋巴瘤和获得性免疫缺陷综合征(艾滋病,AIDS)有关的反转录病毒。当反转录病毒进入细胞后,反转录酶将RNA基因组反转录成DNA,由其DNA版本进行转录和翻译。

人类基因与基因组

按照经典的遗传学概念,基因是控制生物性状的遗传物质的功能和结构单位。随着分子生物学的发展,人们认识到基因是携带一定遗传信息的特定DNA片段,它可以通过转录和翻译等过程表达具有一定生物功能的多肽链(称为蛋白质基因),或转录出在蛋白质生物合成过程中起重要作用的转运RNA和核糖体RNA(分别称为tRNA基因和rRNA基因),以及其他RNA(这些又统称非蛋白质基因)。

人类基因组(即人类一套完整单体的遗传物质的总和)包含细胞核中的24个线性DNA分子(分别包含在22条常染色体和X、Y两条性染色体上,又称核基因组,总长度为3×109bp)以及胞质线粒体上的遗传物质(一个长16 569bp的环状DNA分子,又称线粒体基因组)。

首先由美国科学家于1990年启动,随后有世界多国科学家参加,以揭示人类基因组3×109bp DNA序列为目标的人类基因组计划(Human Genome Project,HGP)已经圆满完成。2001年2月,国际人类基因组合作组(International Human Genomic Sequencing Consortium)和Celera公司分别把自己的人类基因组框架图发表在Nature和Science上。人类基因组的参考顺序于2003年4月完成。2004年10月21日,国际人类基因组合作组在Nature宣布,已确定的人类常染色体基因组顺序有2. 85×109bp,占了全部常染色体基因组顺序的99%(尚存341个缺口,其中许多与片段重复有关)。人类基因组计划的完成奠定了生物医学研究的基础。

人类基因组的DNA组成是复杂的,概括地,可以分为以下DNA类型。

编码蛋白质的DNA

编码蛋白质的DNA(protein-coding DNA)。对人类基因组顺序的分析说明仅包含20 000~25 000个蛋白编码基因(一些蛋白编码基因的确切位置和功能尚待确定),远少于原先估计的50 000~100 000个。人类蛋白质基因都包含外显子和内含子结构,基因长度也不相同,如珠蛋白基因长约1. 5kb,凝血因子Ⅷ基因长约180kb,已知最大的基因是抗肌营养不良基因(Destrophin),长达2300kb。包括内含子在内的蛋白编码基因完全转录单位DNA占了整个基因组的30%(而与蛋白质肽链相应的编码顺序只占整个基因组的1. 6%)。其中一半为单基因,即在基因组中只有一个拷贝。另一半为基因家族中的重复基因或歧化基因。在这些基因家族中的基因编码若干蛋白质,其氨基酸顺序具有很高的同源性。许多蛋白质家族包含从几个到多至20个成员(个别蛋白质家族可能包含数百个成员),它们有着相似但不完全相同的氨基酸顺序。其中有的基因家族成员,其DNA顺序与功能蛋白基因高度同源,但并不能最终表达出蛋白质(虽然可能转录成RNA),因此称为歧化基因(或假基因)。

串联重复的rRNA、tRNA、snRNA和组蛋白基因

串联重复的rRNA、tRNA、snRNA(核小RNA)和组蛋白基因。45s pre-rRNA(其转录和切接后产生28s和18srRNA)、5srRNA、各种tRNA、snRNA及组蛋白家族成员的基因在基因组中是以串联重复排列存在的,即在一段长的DNA内,同一基因顺序的若干拷贝常常以首尾相接的方式逐个排列。每个基因在基因组中的拷贝数为20~300。这些基因共占了基因组的0. 3%。

重复DNA(repetitious DNA)

重复DNA(repetitious DNA)除了编码rRNA、tRNA、snRNA和组蛋白及重复蛋白基因家族表现出重复现象外,真核生物细胞也包含其他称之为重复顺序DNA(repetitious DNA)的区域。这些区域有着不同的序列类型。

简单顺序DNA(simple-sequence DNA):一类重复顺序由以串联形式重复许多次的寡聚核苷酸组成,因此称为简单顺序DNA(simple-sequence DNA),或称串联重复DNA。它们占了整个基因组的3%。绝大部分的这类DNA由2~10bp寡聚核苷酸串联重复组成,但也发现20~200bp的串联重复单位。以往称之为卫星DNA的顺序均属于简单顺序DNA。

散布于基因组的重复子(可移动的遗传元件):另一类重复序列散布于基因组,这些常常是所谓中度重复序列,它们在基因组内的位置可能是变化的,故称可移动的DNA元件(mobile DNA elements),总长度占了基因组的45%。

人类中的这类元件主要是逆转座子(retroposons),在基因组中有几百万个拷贝。逆转座子分为两类。一类为LTR(Long terminal repeats,长末端重复子)逆转座子(LTR retroposons),长度在6~11kb,在人基因组中约有40 000个拷贝,占全部基因组DNA的0~8%。另一类为非LTR逆转座子(non-LTR retroposons),是可移动元件中最共同的类型(占基因组的34%)。非LTR逆转座子包括两种序列类型,即长散布组件(long interspersed elements,LINEs)和短散布组件(short interspersed elements,SINEs)。LINEs长6~8kb,在人基因组中有87 000个拷贝,总长度占基因组的21%。SINEs长100~300bp,在人基因组中有1 600 000个拷贝,总长度占基因组的13%。人基因组也存在少量DNA转座子(transposons)。

这些可移动元件中的一些可以转录出RNA。虽然未发现这些可移动DNA元件在有机体的生命周期中有着规则的功能,但它们可能已经通过作为导致产生新基因和对于基因表达的新控制的重组位点,而在高等有机体的进化中作出贡献。

未分类的间隔DNA

人类基因组中约有25%的DNA顺序不归于上述4种类型,属于未分类的间隔DNA,其中大部分是单拷贝顺序。近几年的研究说明这些DNA中的一些可以转录出RNA。

DNA的分子结构

DNA分子是长的、无分支多聚核苷酸链。核苷酸由脱氧核糖及其C-5'原子上结合的磷酸基因和C-1'上结合的嘌呤或嘧啶碱基组成。DNA中的碱基主要有4种,即腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。RNA的化学结构与DNA十分相似,只是由核糖(C-2'为羟基)取代了脱氧核糖(C-2'为氢原子),尿嘧啶取代了胸腺嘧啶。尿嘧啶和胸腺嘧啶除了C-5'上一个为氢原子,一个为甲基外,其他成分和结构完全相同。这些碱基通常用大写字母A、G、C、T和U来表示。

A. DNA的核糖-磷酸骨架与四种碱基的化学结构、氢键形成与碱基配对(碱基间形成氢键总是发生在A与T、C与G之间。A与T间形成两个氢键,C与G间形成三个氢键)、DNA双链的互补结合与DNA的方向性。B. DNA反向平行双螺旋结构。糖-磷酸骨架位于螺旋外侧,碱基被包裹在中间。同时显示DNA局部双螺旋打开,RNA聚合酶以其中一条DNA链为模板合成mRNA。C. DNA双链反向平行结构的简示图

核苷酸之间由一个核苷酸C-3'上的羟基与下一个核苷酸C-5'连接的磷酸羟基脱水缩合成3',5'磷酸二酯键连接。这种核糖-磷酸的连接构成多核苷酸链的骨架,嘌呤或嘧啶碱与核糖-磷酸链垂直。链内核苷酸C-5'的磷酸和C-3'的羟基均参与二酯链的形成,称为核苷酸残基。

多核苷酸链的两个末端在化学上是不同的,其一端核苷酸C-5'连接的磷酸只有一个酯键,称此核苷酸为链的5'磷酸末端或5'端;链的另一端核苷酸C-3'上羟基是自由的,故称此核苷酸为3'羟基末端或3'端。多核苷酸链因此而具有方向性。

在正常生理条件下的细胞内,DNA分子通常由两条方向相反的多核苷酸链,通过碱基上-NH2的氢与另一链上碱基的氧或氮形成氢键而结合,盘绕成反向平行右手双螺旋结构。碱基间形成氢链总是发生在A与T、C与G之间。A与T间形成两个氢键,C与G间形成3个氢链。糖-磷酸骨架位于螺旋外侧,碱基被包裹在中间。

 DNA结构和DNA的模板功能

DNA结构和DNA的模板功能

基因的功能来自于DNA的分子结构。DNA双螺旋结构决定了DNA或RNA分子间相互作用的方式。

遗传信息的半保留复制

遗传信息贮存于DNA分子核苷酸顺序的排列中。DNA的分子结构为双螺旋,两股核苷酸链都携带有遗传信息。在细胞分裂之前,两股DNA链均作为模板,按碱基配对的规律各复制一条,从而将遗传信息传递给下一代。复制后的DNA分子中一股链是新合成的,而另一半是原有的,因此称为半保留复制。

 DNA的半保留复制

DNA的半保留复制

DNA复制时除需要模板、4种脱氧核糖核苷酸底物外,还需要具有3'-OH的DNA或RNA作为引物。由引物末端的3'-OH与脱氧核糖核苷酸的α磷酸基团结合,生成酯键,使链沿着5'→3'方向延伸。DNA复制过程包括起始位点的识别、DNA双链的解旋、双链分开的维持、引物合成、脱氧核糖核苷酸聚合、冈崎片段连接以及引物去除等许多步骤,涉及多种酶与蛋白质的参与。

DNA两链打开,形成复制叉,按碱基配对规律分别复制子链。复制后的DNA分子中一股链是新合成的,而另一半是原有的,因此称为半保留复制

由于DNA碱基排列具有方向性,同样一段DNA序列从3'→5'方向解读和从5'→3'解读所得到的遗传信息是不同的。细胞中的酶可以识别DNA链的方向性。大部分酶只能沿着一个方向解读DNA序列,或者3'→5',或者5'→3',不能两个方向都读。核酸聚合酶通常沿5'→3'方向延伸核苷酸链。

系统的医学参考与学习网站:天山医学院, 引用注明出处:https://www.tsu.tw/edu/11583.html