1.25k likes | 1.44k Views
第三章 生物信息的传递(上)-从 DNA 到 RNA. 1 、 RNA 的转录 2 、启动子与转录起始 3 、原核生物与真核生物 mRNA 的特征比较 4 、终止与抗终止 5 、内含子的剪接、编辑及化学修饰. DNA 序列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成信使 RNA 、翻译生成蛋白质的过程来控制生命现象。.
E N D
第三章 生物信息的传递(上)-从DNA到RNA 1、RNA的转录 2、启动子与转录起始 3、原核生物与真核生物mRNA的特征比较 4、终止与抗终止 5、内含子的剪接、编辑及化学修饰
DNA序列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成信使RNA、翻译生成蛋白质的过程来控制生命现象。DNA序列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成信使RNA、翻译生成蛋白质的过程来控制生命现象。
基因表达包括转录(transcription)和翻译(translation)两个阶段。转录是指拷贝出一条与DNA链序列完全相同(U替换T)的RNA单链的过程,是基因表达的核心步骤;翻译是指以新生的mRNA为模板,把核苷酸三联遗传密码子翻译成氨基酸序列、合成多肽链的过程,是基因表达的最终目的。基因表达包括转录(transcription)和翻译(translation)两个阶段。转录是指拷贝出一条与DNA链序列完全相同(U替换T)的RNA单链的过程,是基因表达的核心步骤;翻译是指以新生的mRNA为模板,把核苷酸三联遗传密码子翻译成氨基酸序列、合成多肽链的过程,是基因表达的最终目的。
与mRNA序列相同的那条DNA链称为编码链(coding strand)或称有意义链(sense strand),并把另一条根据碱基互补原则指导mRNA合成的 DNA链称为模板链(template strand)或称反义链(antisense strand)。
贮藏在任何基因中的生物信息都必须首先被转录生成RNA,才能得到表达。RNA主要以单链形式存在于生物体内,其高级结构很复杂,它们既担负着贮藏及转移遗传信息的功能,又能作为核酶直接在细胞内发挥代谢功能。贮藏在任何基因中的生物信息都必须首先被转录生成RNA,才能得到表达。RNA主要以单链形式存在于生物体内,其高级结构很复杂,它们既担负着贮藏及转移遗传信息的功能,又能作为核酶直接在细胞内发挥代谢功能。
RNA分子来自DNA。储存于DNA双链中的遗传信息通过转录酶促反应按照碱基互补配对的原则被转化成为单链RNA分子。生物体内共有3种RNA:1、信使RNA(messenger RNA,mRNA)-编码特定蛋白质序列;2、转移RNA(transfer RNA,tRNA)-特异性解读mRNA中的遗传信息、将其转化成相应氨基酸并将其加入多肽链中;3、核糖体RNA(ribosomal RNA,rRNA)直接参与核糖体中蛋白质合成。
3.1 RNA的转录 • 3·1·1 转录的基本过程 • 无论是原核还是真核细胞,转录的基本过程都包括:模板识别、转录起始、通过启动子及转录的延伸和终止。
本节 目录
在原核生物中,模板识别阶段主要指RNA聚合酶与启动子DNA双链相互作用并与之相结合的过程。转录起始前,启动子附近的DNA双键分开形成转录泡以促使底物核糖核苷酸与模板DNA的碱基配对。转录起始就是RNA链上第一个核苷酸键的产生。在原核生物中,模板识别阶段主要指RNA聚合酶与启动子DNA双链相互作用并与之相结合的过程。转录起始前,启动子附近的DNA双键分开形成转录泡以促使底物核糖核苷酸与模板DNA的碱基配对。转录起始就是RNA链上第一个核苷酸键的产生。
转录起始后直到形成9个核酸苷短链是通过启动子阶段,此时RNA聚合酶一直处于启动子区,新生的RNA链与DNA模板链的结合不够牢固,很容易从DNA链上掉下来并导致转录重新开始。一旦RNA聚合酶成功地合成9个以上核苷酸并离开启动子区,转录就进人正常的延伸阶段。所以,通过启动子的时间代表一个启动子的强弱。一般说来,通过启动子的时间越短,该基因转录起始的频率也越高。转录起始后直到形成9个核酸苷短链是通过启动子阶段,此时RNA聚合酶一直处于启动子区,新生的RNA链与DNA模板链的结合不够牢固,很容易从DNA链上掉下来并导致转录重新开始。一旦RNA聚合酶成功地合成9个以上核苷酸并离开启动子区,转录就进人正常的延伸阶段。所以,通过启动子的时间代表一个启动子的强弱。一般说来,通过启动子的时间越短,该基因转录起始的频率也越高。
RNA聚合酶离开启动子,沿DNA链移动并使新生RNA链不断伸长的过程就是转录的延伸。在37℃时,大肠杆菌RNA聚合酶完成该反应的速度为每秒40个核苷酸。随着RNA聚合酶的移动,DNA双螺旋持续解开,暴露出新的单链DNA模板,新生RNA链的3’末端不断延伸,在解链区形成RNA-DNA杂合物。而在解链区的后面,DNA模板链与其原先配对的非模板链重新结合成为双螺旋。RNA聚合酶离开启动子,沿DNA链移动并使新生RNA链不断伸长的过程就是转录的延伸。在37℃时,大肠杆菌RNA聚合酶完成该反应的速度为每秒40个核苷酸。随着RNA聚合酶的移动,DNA双螺旋持续解开,暴露出新的单链DNA模板,新生RNA链的3’末端不断延伸,在解链区形成RNA-DNA杂合物。而在解链区的后面,DNA模板链与其原先配对的非模板链重新结合成为双螺旋。
当RNA链延伸到转录终止位点时,RNA聚合酶不再形成新的磷酸二酯键,RNA-DNA杂合物分离,转录泡瓦解,DNA恢复成双链状态,而RNA聚合酶和RNA链都被从模板上释放出来,这就是转录的终止。当RNA链延伸到转录终止位点时,RNA聚合酶不再形成新的磷酸二酯键,RNA-DNA杂合物分离,转录泡瓦解,DNA恢复成双链状态,而RNA聚合酶和RNA链都被从模板上释放出来,这就是转录的终止。
真核生物RNA聚合酶不能直接识别基因的启动子区,需要转录调控因子(辅助蛋白质)按特定顺序结合于启动子上,RNA聚合酶才能与之相结合并形成复杂的前起始复合物。真核生物RNA聚合酶不能直接识别基因的启动子区,需要转录调控因子(辅助蛋白质)按特定顺序结合于启动子上,RNA聚合酶才能与之相结合并形成复杂的前起始复合物。 • 转录和翻译的速度基本相等,37℃时,转录生成mRNA的速度每秒钟合成14个密码子,而蛋白质合成的速度大约是每秒钟15个氨基酸。
3·1·2 转录机器的主要成分 3·1·2·1 RNA聚合酶 • 以DNA序列为模板的RNA聚合酶主要以双链DNA为模板,以4种核苷三磷酸作为活性前体,并以Mg2+/Mn2+为辅助因子,催化RNA链的起始、延伸和终止,它不需要任何引物,催化生成的产物是与DNA模板链互补的RNA。RNA或RNA-DNA双链杂合体不能作为模板。原核和真核生物的RNA在分子组成、种类和生化特性上各有特色。
大肠杆菌RNA聚合酶的主要成分与功能 • 大多数原核生物RNA聚合酶的组成是相同的,大肠杆菌RNA聚合酶由2个α亚基、一个β亚基、一个β’亚基和一个ω亚基组成,称为核心酶。加上一个σ亚基后则成为聚合酶全酶(holoenzyme),相对分子质量为4.65×lO5(图3-3)。
Enzyme assembly, promoter recognition, activator binding Possible catalytic subunits Role unknown (not needed in vitro) 151 155 11 kDa 36.5 kDa Promoter specificity (32-90 kDa) The E. coli RNA polymerase holoenzyme consists of six subunits: a2bb’ s.
由β和β’亚基组成了聚合酶的催化中心。β亚基能与模板DNA、新生RNA链及核苷酸底物相结合。由β和β’亚基组成了聚合酶的催化中心。β亚基能与模板DNA、新生RNA链及核苷酸底物相结合。 • α亚基与核心酶的组装及启动子识别有关,并参与RNA聚合酶和部分调节因子的相互作用。
σ因子的作用是负责模板链的选择和转录的起始,它使酶专一性识别模板上的启动子。σ因子可以极大地提高RNA聚合酶对启动子区DNA序列的亲和力,酶底结合常数提高103倍,酶底复合物的半衰期可达数小时甚至数十小时。σ因子还能使RNA聚合酶与模板DNA上非特异性位点的结合常数降低104倍,使酶底复合物的半衰期小于1s。因此,加入σ因子以后,RNA聚合酶全酶识别启动子序列的特异性总共提高了107倍。σ因子的作用是负责模板链的选择和转录的起始,它使酶专一性识别模板上的启动子。σ因子可以极大地提高RNA聚合酶对启动子区DNA序列的亲和力,酶底结合常数提高103倍,酶底复合物的半衰期可达数小时甚至数十小时。σ因子还能使RNA聚合酶与模板DNA上非特异性位点的结合常数降低104倍,使酶底复合物的半衰期小于1s。因此,加入σ因子以后,RNA聚合酶全酶识别启动子序列的特异性总共提高了107倍。
每个细胞中约有7000个RNA聚合酶分子,每一时刻有2000~5000个酶在执行转录DNA模板的功能。σ因子大大增加聚合酶对启动子的亲和力,并降低酶对非专一位点的亲和力,使酶专一性识别模板上的启动子。每个细胞中约有7000个RNA聚合酶分子,每一时刻有2000~5000个酶在执行转录DNA模板的功能。σ因子大大增加聚合酶对启动子的亲和力,并降低酶对非专一位点的亲和力,使酶专一性识别模板上的启动子。
转录的起始从化学过程来看是单个核苷酸与开链启动子-酶复合物相结合构成新生RNA的5’端,再以磷酸二酯键的形式与第二个核苷酸相结合,起始的终止反映在σ因子的释放。当新生RNA链达到6~9个核苷酸时,能形成稳定的酶-DNA-RNA三元复合物,并释放σ因子,转录进人延伸期。转录的起始从化学过程来看是单个核苷酸与开链启动子-酶复合物相结合构成新生RNA的5’端,再以磷酸二酯键的形式与第二个核苷酸相结合,起始的终止反映在σ因子的释放。当新生RNA链达到6~9个核苷酸时,能形成稳定的酶-DNA-RNA三元复合物,并释放σ因子,转录进人延伸期。
当聚合酶按5’→ 3’方向延伸RNA链时,解旋的DNA区域也随之移动。聚合酶可以横跨约40个碱基对,而解旋的DNA区域大约是17个碱基对。自由核苷酸能被聚合酶加到新生的RNA链上,并形成DNA-RNA杂合体。随着聚合酶在模板上的运动,靠近3'端的DNA不断解旋,同时在5'端重新形成DNA双链,将RNA链挤出DNA-RNA杂合体。RNA的3'端大约有20~30个核苷酸与DNA和聚合酶相结合。
真核生物中共有3类RNA聚合酶,它们在细胞核中的位置不同,负责转录的基因不同。真核生物RNA聚合酶一般有8~14个亚基所组成,相对分子质量超过5×105。不同生物3类聚合酶的亚基种类和大小存在两条普遍遵循的原则:一是聚合酶中有两个相对分子质量超过l×105的大亚基;二是同种生物3类聚合酶有"共享"小亚基的倾向,即有几个小亚基是其中3类或2类聚合酶所共有的。真核生物中共有3类RNA聚合酶,它们在细胞核中的位置不同,负责转录的基因不同。真核生物RNA聚合酶一般有8~14个亚基所组成,相对分子质量超过5×105。不同生物3类聚合酶的亚基种类和大小存在两条普遍遵循的原则:一是聚合酶中有两个相对分子质量超过l×105的大亚基;二是同种生物3类聚合酶有"共享"小亚基的倾向,即有几个小亚基是其中3类或2类聚合酶所共有的。
真核生物线粒体和叶绿体中还存在着不同的RNA聚合酶。线粒体RNA聚合酶只有一条多肽链,相对分子质量小于7x104,是已知最小的RNA聚合酶之一,与T7噬菌体RNA聚合酶有同源性。叶绿体RNA聚合酶比较大,结构上与细菌中的聚合酶相似,由多个亚基组成,部分亚基由叶绿体基因组编码。真核生物线粒体和叶绿体中还存在着不同的RNA聚合酶。线粒体RNA聚合酶只有一条多肽链,相对分子质量小于7x104,是已知最小的RNA聚合酶之一,与T7噬菌体RNA聚合酶有同源性。叶绿体RNA聚合酶比较大,结构上与细菌中的聚合酶相似,由多个亚基组成,部分亚基由叶绿体基因组编码。
3·1·2·2 转录复合物 启动子选择阶段包括RNA聚合酶全酶对启动子的识别,聚合酶与启动子可逆性结合形成封闭复合物(closed complex)。伴随着DNA构象上的重大变化,封闭复合物转变成开放复合物(open complex),聚合酶全酶所结合的DNA序列中有一小段双链被解开。
强启动子→从封闭复合物到开放复合物的转变是不可逆的,是快反应。开放复合物与最初的两个NTP相结合并在这两个核苷酸之间形成磷酸二酯键后→(RNA聚合酶、DNA和新生RNA)三元复合物。强启动子→从封闭复合物到开放复合物的转变是不可逆的,是快反应。开放复合物与最初的两个NTP相结合并在这两个核苷酸之间形成磷酸二酯键后→(RNA聚合酶、DNA和新生RNA)三元复合物。 真核生物转录起始复合物的分子量很大:RNA聚合酶、7种辅助因子,辅助因子又包含多个亚基。
三元复合物可以进入两条不同的反应途径,一是合成并释放2~9个核苷酸的短RNA转录物--流产式起始;二是尽快释放σ亚基,转录起始复合物通过上游启动子区并生成由核心酶、DNA和新生RNA所组成的转录延伸复合物。三元复合物可以进入两条不同的反应途径,一是合成并释放2~9个核苷酸的短RNA转录物--流产式起始;二是尽快释放σ亚基,转录起始复合物通过上游启动子区并生成由核心酶、DNA和新生RNA所组成的转录延伸复合物。
转录的真实性取决于有特异的转录起始位点,转录起始后按照碱基互补原则准确地转录模板DNA序列及具有特异的终止部位。RNA的合成是在模板DNA的启动子位点上起始的,而这个任务是靠σ因子来完成的。RNA聚合酶的核心酶虽可合成RNA,但不能找到模板DNA上的起始位点。核心酶的产物是不均一的,因为它没有固定的起始位点,而且DNA两条链都可作为模板。转录的真实性取决于有特异的转录起始位点,转录起始后按照碱基互补原则准确地转录模板DNA序列及具有特异的终止部位。RNA的合成是在模板DNA的启动子位点上起始的,而这个任务是靠σ因子来完成的。RNA聚合酶的核心酶虽可合成RNA,但不能找到模板DNA上的起始位点。核心酶的产物是不均一的,因为它没有固定的起始位点,而且DNA两条链都可作为模板。
只有带σ因子的全酶才能专一地与DNA上的启动子结合,选择其中一条链作为模板,合成均一的产物。σ因子的作用只是起始而已,一旦转录开始,它就脱离了起始复合物,而由核心酶负责RNA链的延伸。因此,聚合酶全酶的作用是启动子的选择和转录的起始,而核心酶的作用是链的延伸。只有带σ因子的全酶才能专一地与DNA上的启动子结合,选择其中一条链作为模板,合成均一的产物。σ因子的作用只是起始而已,一旦转录开始,它就脱离了起始复合物,而由核心酶负责RNA链的延伸。因此,聚合酶全酶的作用是启动子的选择和转录的起始,而核心酶的作用是链的延伸。
转录延伸复合物是转录循环中一个十分重要的环节。与转录起始复合物相比,延伸复合物极为稳定,可以长时间地与DNA模板相结合而不解离。只有在它遇到转录终止信号时,RNA聚合酶才停止加入新的核苷酸,RNA-DNA杂合物解离,释放转录产物并导致聚合酶本身从模板DNA上掉下来。转录延伸复合物是转录循环中一个十分重要的环节。与转录起始复合物相比,延伸复合物极为稳定,可以长时间地与DNA模板相结合而不解离。只有在它遇到转录终止信号时,RNA聚合酶才停止加入新的核苷酸,RNA-DNA杂合物解离,释放转录产物并导致聚合酶本身从模板DNA上掉下来。
3·2 启动子与转录起始 • 大肠杆菌RNA聚合酶与启动子的相互作用主要包括启动子区的识别、酶与启动子的结合及σ因子的结合与解离。下面分别介绍这3个方面的内容。
3·2·1 启动子区的基本结构 • 启动子是一段位于结构基因5'端上游的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地结合并具有转录起始的特异性。基因的特异性转录取决于酶与启动子能否有效地形成二元复合物,所以,RNA聚合酶如何有效地找到启动子并与之相结合是转录起始过程中首先要解决的问题。有实验表明,对许多启动子来说,RNA聚合酶与之相结合的速率至少比布朗运动中的随机碰撞高100倍。
转录的起始是基因表达的关键阶段,而这一阶段的重要问题是RNA聚合酶与启动子的相互作用。启动子的结构影响了它与RNA聚合酶的亲和力,从而影响了基因表达的水平。转录的起始是基因表达的关键阶段,而这一阶段的重要问题是RNA聚合酶与启动子的相互作用。启动子的结构影响了它与RNA聚合酶的亲和力,从而影响了基因表达的水平。
转录单元(transcription unit)是一段从启动子开始至终止子(terminator)结束的DNA序列。RNA聚合酶从转录起点开始沿着模板前进,直到终止子为止,转录出一条RNA链。在细菌中,一个转录单元可以是一个基因,也可以是几个基因。
转录起点是指与新生RNA链第一个核苷酸相对应DNA链上的碱基,研究证实通常为一个嘌呤。常把起点前面,即5'末端的序列称为上游(upstream),而把其后面即3’末端的序列称为下游(downstream)。在描述碱基的位置时,一般用数字表示,起点为+1,下游方向依次为+2、+3……,上游方向依次为-1、-2、-3……。转录起点是指与新生RNA链第一个核苷酸相对应DNA链上的碱基,研究证实通常为一个嘌呤。常把起点前面,即5'末端的序列称为上游(upstream),而把其后面即3’末端的序列称为下游(downstream)。在描述碱基的位置时,一般用数字表示,起点为+1,下游方向依次为+2、+3……,上游方向依次为-1、-2、-3……。
启动子区是RNA聚合酶的结合区,其结构直接关系到转录的效率。那么,启动子区有什么结构特点呢?Pribnow设计了一个实验,他把RNA聚合酶全酶与模板DNA结合后,用DNaseI水解DNA,然后用酚抽提,沉淀纯化DNA后得到一个被RNA聚合酶保护的DNA片段,约有41~44个核苷酸对。启动子区是RNA聚合酶的结合区,其结构直接关系到转录的效率。那么,启动子区有什么结构特点呢?Pribnow设计了一个实验,他把RNA聚合酶全酶与模板DNA结合后,用DNaseI水解DNA,然后用酚抽提,沉淀纯化DNA后得到一个被RNA聚合酶保护的DNA片段,约有41~44个核苷酸对。
他分离了fd噬菌体等被酶保护的区域,并进行了序列分析,以后又有人做了50多个启动子的序列分析后发现,在被保护区内有一个由5个核苷酸组成的共同序列,是RNA聚合酶的紧密结合点,现在称为Pribnow区(Pribnow box),这个区的中央大约位于起点上游10bp处,所以又称为-10区。
科学家不久后又从噬菌体的左、右启动子PL及PR和SV40启动子的-35bp附近找到了另一段共同序列:TTGACA。经过数年的努力,分析了46个大肠杆菌启动子的序列以后,确证绝大部分启动子都存在这两段共同序列,即位于-10bp处的TATA区和-35bp处的TTGACA区。科学家不久后又从噬菌体的左、右启动子PL及PR和SV40启动子的-35bp附近找到了另一段共同序列:TTGACA。经过数年的努力,分析了46个大肠杆菌启动子的序列以后,确证绝大部分启动子都存在这两段共同序列,即位于-10bp处的TATA区和-35bp处的TTGACA区。 • -10位的TATA区和-35位的TGACA区是RNA聚合酶与启动子的结合位点,能与σ因子相互识别而具有很高的亲和力。
在真核生物基因中,位于转录起始点上游-25~-30bp处的共同序列TATAAA,也称为TATA区(图3-7)。另外,在起始位点上游-70~-78bp处还有另一段共同序列CCAAT,这是与原核生物中-35bp区相对应的序列,称为CAAT区(CAATbox)。在真核生物基因中,位于转录起始点上游-25~-30bp处的共同序列TATAAA,也称为TATA区(图3-7)。另外,在起始位点上游-70~-78bp处还有另一段共同序列CCAAT,这是与原核生物中-35bp区相对应的序列,称为CAAT区(CAATbox)。
3.2.2 启动子区的识别 • RNA聚合酶是通过氢键互补的方式识别启动子的。在启动子区DNA双螺旋结构中,腺嘌呤、鸟嘌呤和胞嘧啶上的某些基团是氢键供体,而4种碱基中的某些基团是氢键受体。由于它们分别处于DNA双螺旋的大沟或小沟内,因此都具有特定的方位,而酶分子中也有处于特定空间构象的氢键受体与供体,当它们与启动子中对应的分子在一定距离内互补时,就形成氢键,相互结合。
3·2·3 酶与启动子区的结合 • 在RNA聚合酶与启动子相互作用的过程中,聚合酶首先与启动子区闭合双链DNA相结合,形成二元闭合复合物,然后经过解链得到二元开链复合物。解链区一般在-9~+13之间,而酶与启动子结合的主要区域在其上游。
一旦开链区解链,酶分子能以正确的取向与解链后的有关单链相互作用,形成开链复合物。因此,RNA聚合酶既是双链DNA结合蛋白,又是单链DNA结合蛋白。DNA开链是按照DNA模板序列正确引入核苷酸底物的必要条件。一旦开链区解链,酶分子能以正确的取向与解链后的有关单链相互作用,形成开链复合物。因此,RNA聚合酶既是双链DNA结合蛋白,又是单链DNA结合蛋白。DNA开链是按照DNA模板序列正确引入核苷酸底物的必要条件。
3.2.4 -10区和-35区的最佳间距 • 在原核生物中,-35区与-10区之间的距离大约是16~19bp,小于15bp或大于20bp都会降低启动子的活性。保持启动子这二段序列以及它们之间的距离都是重要的,否则就会改变它所控制基因的表达水平。
因为增减bp ,-35区相对于-10区旋转(增减一个bp会使两者之间的夹角发生360的变化)所产生的超螺旋会发生改变。若要使酶与DNA在这个区域内保持正确的取向,就必须使二者之一发生扭曲,需要增加结合自由能。
在细菌中常见两种启动子突变,一种叫下降突变(down mutation),如果把Pribnow区从TATAAT变成AATAAT就会大大降低其结构基因的转录水平;另一类突变叫上升突变(up mutation),即增加Pribnow区共同序列的同一性。例如,在乳糖操纵子的启动子中,将其Pribnow区从TATGTT变成TATATT,就会提高启动子的效率,提高乳糖操纵子基因的转录水平。