1 / 36

南京农业大学 生命科学学院

南京农业大学 生命科学学院. 分 子 生 物 学. 第九章 基因组与比较基因学. 20 世纪人类科技发展史上的三大创举之一。. 人类基因组计划( HGP ). 第九章 基因组与比较基因学. 1940 年代第一颗原子弹爆炸, 1960 年代人类首次登上月球和 1990 年代提出并已基本完成的人类基因组计划( HGP )是 20 世纪人类科技发展史上的三大创举。对人类以及其他生物体全基因组的测序是人类科学发展史上的一项浩大工程。. 第九章 基因组与比较基因学. 基因组学是美国人 T·H·Rodehck 在 1986 年 7 月造出来的。

Download Presentation

南京农业大学 生命科学学院

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 南京农业大学 生命科学学院 分 子 生 物 学

  2. 第九章 基因组与比较基因学 20世纪人类科技发展史上的三大创举之一。 人类基因组计划(HGP) 南京农业大学 生命科学学院

  3. 第九章 基因组与比较基因学 1940年代第一颗原子弹爆炸,1960年代人类首次登上月球和1990年代提出并已基本完成的人类基因组计划(HGP)是20世纪人类科技发展史上的三大创举。对人类以及其他生物体全基因组的测序是人类科学发展史上的一项浩大工程。 南京农业大学 生命科学学院

  4. 第九章 基因组与比较基因学 • 基因组学是美国人T·H·Rodehck在1986年7月造出来的。 • 基因组是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和(细胞内细胞器的DNA属于该细胞器的基因组)。 • 原核生物基因组:原核生物DNA分布在整个细胞之中,有时相对集中在类核体上。类核体上的DNA是一条共价、闭合双链分子,类核体通常也称为染色体。这条染色体的DNA就是原核细胞的基因组。 • 真核生物基因组:一个物种的单倍体的各条染色体中的全部DNA为该物种的基因组(genome)。例如,人有23对染色体,配子——单倍体是23条染色体,这23条染色体中的全部DNA就是人体基因组。 南京农业大学 生命科学学院

  5. 第九章 基因组与比较基因学 • 内容: • 高通量DNA分析技术 • 人类基因组计划 • 其他基因组 • 比较基因组学及相关研究 南京农业大学 生命科学学院

  6. 第一节 高通量DNA序列分析技术 南京农业大学 生命科学学院 1. DNA序列测定的基本原理 无论是对于重组质粒、单个基因还是整个基因组,分析DNA结构的最基本方法就是测定出这些DNA分子的一级结构——DNA序列。 DNA自动测序仪可快速测定DNA序列,计算机处理能力的快速提高则使得大量DNA小片段很容易拼接成较大的片段甚至整个染色体。 高效快捷的DNA测序方法是20世纪70年代中期发展起来的,主要有两种:Sanger的双脱氧链终止法和Maxam-Gilbert的化学修饰法。后者因更适应序列分析的自动化而逐渐占据优势。

  7. 南京农业大学 生命科学学院 Sanger 的双脱氧链终止法 基本原理: 核酸模板在核酸聚合酶、引物、四种单脱氧碱基存在条件下复制或转录时,如果在四管反应系统中分别按比例引入四种双脱氧碱基,只要双脱氧碱基掺入链端,该链就停止延长,链端掺入单脱氧碱基的片段可继续延长。如此每管反应体系中便合成以共同引物为5’端,以双脱氧碱基为3’端的一系列长度不等的核酸片段。反应终止后,分四个泳道进行电泳,以分离长短不一的核酸片段(长度相邻者仅差一个碱基),根据片段3’端的双脱氧碱基,便可依次阅读合成片段的碱基排列顺序。

  8. 南京农业大学 生命科学学院

  9. 第一节 高通量DNA序列分析技术 南京农业大学 生命科学学院 2. 基因组DNA大片段文库的构建 构建基因文库是测序前必须的预备工作。用细菌的F质粒及其调控基因构建了细菌染色体克隆载体BAC,其克隆能力在125- 150kb左右。以BAC为基础的克隆载体转化效率高,而且以环状结构存在于细菌体内,易于分辨和分离纯化。

  10. 第一节 高通量DNA序列分析技术 南京农业大学 生命科学学院 3. 鸟枪法基因组序列分析技术 DNA序列分析技术一次测序反应的长度不能超过1kb,不能直接用BAC等大片段作为序列分析的模板,采用全基因组鸟枪法测序技术——随机挑选插入基因组DNA的质粒做测序反应,然后用计算机程序进行序列拼接。

  11. 第一节 高通量DNA序列分析技术 南京农业大学 生命科学学院 3. 鸟枪法基因组序列分析技术 采用全基因组鸟枪法测序的基本原理: 对某基因组文库全部克隆片段进行末端序列测定中未测到的碱基数,即缺口(gap),与已测定的总碱基数相关。 随着已测定碱基数的增加,缺口的总碱基数目会按照泊松公式的一个推论(P=e-m)迅速减小。其中P为基因组中某个碱基未被测定的概率,m为所测定的碱基数与基因组大小相比的倍数。m越大P值越小。当m=5(即随机测定的碱基数达到基因组5倍),基因组中未测定的碱基数为总碱基数的0.67%(e-5=0.0067)。 对流感嗜血杆菌基因组(1.83Mb)来说,可能留有128个平均长为100bp的缺口。

  12. 第一节 高通量DNA序列分析技术 南京农业大学 生命科学学院 3. 鸟枪法基因组序列分析技术 鸟枪法测序的缺点: 随着所测基因组总量增大,所需测序的片段大量增加,各个片段重叠成一个连续体的概率是2n2-2n 。

  13. 第一节 高通量DNA序列分析技术 南京农业大学 生命科学学院 3. 鸟枪法基因组序列分析技术 对鸟枪法的改进: Clone contig法。首先用稀有内切酶把待测基因组降解为数百kb以上的片段,再分别测序。 靶标鸟枪法(direted shotgun)。首先根据染色体上已知基因和标记的位置来确定部分DNA片段的相对位置,再逐步缩小各片段之间的缺口。

  14. 改进后的鸟枪测序法原理图 南京农业大学 生命科学学院

  15. 第二节 人类基因组计划 南京农业大学 生命科学学院 2003年4月14日,国际人类基因组宣布:人类基因组序列图--“完成图”提前绘制成功。 人类基因组包括24条染色体,约30亿对核苷酸,编码5万~6万个基因,人类基因组中携带了有关人类个体生长发育、生老病死的全部遗传信息。 从整体上看,不同人类个体的基因是相同的,因此,我们说“人类只有一个基因组”,人生来是平等的。当然,不同的人可能拥有不同的等位基因,这一点决定了人与人之间个体上的差异。

  16. 第二节 人类基因组计划 南京农业大学 生命科学学院 1. 人类基因组计划的科学意义 确定人类基因组中约3-4万个编码基因的序列及其在基因组中的物理位置,研究基因的产物及其功能。 了解转录和剪接调控元件的结构与位置,从整个基因组结构的宏观水平上理解基因转录与转录后调节。 从整体上了解染色体结构,了解各种不同序列在形成染色体结构、DNA复制、基因转录及表达调控中的影响与作用。 研究空间结构对基因调节的作用。

  17. 第二节 人类基因组计划 南京农业大学 生命科学学院 1. 人类基因组计划的科学意义 发现与DNA复制、重组 研究DNA突变、重排和染色体断裂等,了解疾病的分子机制,为疾病诊断、预防和治疗提供理论依据。 确定人类基因组中转座子、逆转座子和病毒残余序列,研究其周围序列的性质。等有关的序列。 研究人类个体之间的多态性(SNP)情况,用于基因诊断、个体识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学的研究。

  18. 第二节 人类基因组计划 南京农业大学 生命科学学院 2. 遗传图 遗传图又称连锁图(Linkage Map),是指基因或DNA标志在染色体上的相对位置与遗传距离,通常以基因或DNA片段在染色体交换过程中的分离频率厘摩(cM)来表示。cM值越大,两者之间距离越远。 产生配子的减数分裂过程中,亲代同“号”的父源或母源染色体既能相互配对也可能发生片段互换,而父母源染色体等位基因互换导致子代出现DNA“重组”的频率与这两个位点之间的距离呈正相关,所以,用两个位点之间的交换或重组频率来表示其“遗传学距离”。 连锁分析是通过分析同一遗传位点在不同个体中等位基因的不同(多态性)来研究同一染色体上两位点之间的相互关系

  19. 第二节 人类基因组计划 注:上述4个基因都位于果蝇的X染色体上 南京农业大学 生命科学学院 2. 遗传图 遗传距离图的基本数据来自基因的重组。

  20. 第二节 人类基因组计划 南京农业大学 生命科学学院 2. 遗传图 由于不能对人类进行“选择性”婚配,而且人类子代个体数量有限、世代寿命较长,呈共显多态性的蛋白质数量不多,等位基因的数量不多。DNA技术的建立为人类提供了大量新的遗传标记。遗传标记有三代: 第一代DNA遗传标记是RFLP(限制性片段长度多态性)。DNA序列上的微小变化,甚至1个核苷酸的变化,也能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化

  21. 第二节 人类基因组计划 南京农业大学 生命科学学院 2. 遗传图 • 第二代DNA遗传标记利用了存在于人类基因组中的大量重复序列: • 重复单位长度在15-65个核苷酸左右的小卫星DNA; • 重复单位长度在2-6个核苷酸之间的微卫星DNA,又称为简短串联重复(STR、STRP或SSLP)。

  22. 第二节 人类基因组计划 南京农业大学 生命科学学院 2. 遗传图 第二代DNA遗传标记 STRP的优点是“多态性”与“高频率”。由于(A)n,(CA)n,(CGG)n等短重复序列在进化上不受选择,在同一位点上可重复单位数量变化很大,配对时又容易产生“错配”,使这样的位点遍布于整个基因组。 已有5264个STRP为主体的遗传标记“连锁图”,平均分辨率已达600kb,其中第17号染色体上平均每495 kb有一个标记,第9号染色体上平均每767 kb有一个标记,整个基因组中只有三处标记间距大于4Mb。

  23. 第二节 人类基因组计划 南京农业大学 生命科学学院 2. 遗传图 第三代DNA遗传标记,可能也是最好的遗传标记,是分散于基因组中的单个碱基的差异,即单核苷酸的多态性(SNP),包括单个碱基的缺失、插入和替换。 SNP中大多数为转换,即由一种嘧啶碱基替换另一种嘧啶碱基,或由一种嘌呤碱基替换另一种嘌呤碱基,颠换与转换之比为1:2。 SNP有可能在密度上达到人类基因组“多态”位点数目的极限。估计人类基因组中可能有300万个SNP位点! SNP与RFLP和STRP标记的主要不同之处在于,它不再以DNA片段的长度变化作为检测手段,而直接以序列变异作为标记。

  24. 第二节 人类基因组计划 南京农业大学 生命科学学院 2. 遗传图 “遗传图”的建立为人类疾病相关基因的分离克隆奠定了基础。拥有5000多个遗传学位点,相当于把整个人类基因组划分为5000多个小区,并分别设置了“标牌”。如果在家系中证实该基因与某个标记不连锁(重组率为50%),表明该基因不在这一标记附近。 如果发现该基因与某个标记有一定程度的“连锁”(重组率小于50%但大于0),表明它可能位于这个标记附近。 如果该基因与某标记间不发生重组(重组率等于0),我们就推测该标记与所研究的疾病基因可能非常接近。

  25. 第二节 人类基因组计划 南京农业大学 生命科学学院 3. 物理图 人类基因组的物理图是指以已知核苷酸序列的DNA片段(序列标签位点, STS)为“路标”,以碱基对(bp,kb,Mb)作为基本测量单位(图距)的基因组图。 STS是基因组中任何单拷贝的长度在100~500bp之间的DNA序列,与核酸内切酶识别序列相关联。 物理图主要内容是建立相互重叠连接的“相连DNA片段群”。

  26. 得到5套以上包含相关染色体或整个基因组的DNA片段是建立STS物理图的先决条件。然后,可以通过拼接而得STS物理图。两个STS标签在基因组上靠得近,它们就会一直同时出现在DNA大片段上几率就会小得多。得到5套以上包含相关染色体或整个基因组的DNA片段是建立STS物理图的先决条件。然后,可以通过拼接而得STS物理图。两个STS标签在基因组上靠得近,它们就会一直同时出现在DNA大片段上几率就会小得多。 南京农业大学 生命科学学院

  27. 酵母第三号染色体遗传图(右)和物理图(左)的比较 南京农业大学 生命科学学院

  28. 第二节 人类基因组计划 南京农业大学 生命科学学院 4. 转录图 人类的基因转录图(cDNA图),或者基因的cDNA片段图,即表达序列标签图(EST,expressed sequence tag)是人类基因组图的雏型。 在成年个体的每一特定组织中,一般只有10%~20%的结构基因(约1~2万个不同类型的mRNA)表达。 整个人类基因组中,有1%-5%的序列编码了蛋白质,最多可能有(5~7)万个蛋白质编码基因。得到了一段cDNA或一个EST,就能被用于筛选全长的转录本,并将该基因准确地定位于基因组上。 cDNA序列具有转录本的特异性,代表了不同基因的信息。可以将DNA序列和cDNA序列进行比对,找出对应于cDNA的基因。

  29. 第二节 人类基因组计划 南京农业大学 生命科学学院 4. 转录图 收集各种细胞或组织的基因表达谱进行两两或多重比较,能较全面地了解哪些基因是特异性表达的。在某一细胞或组织中特异性表达的基因可能与该组织或细胞类型的生理功能有关。 获得各类组织或细胞的基因表达谱,从而给出人体200余种基本组织或不同细胞组成的人体基因图(bodymap)。 转录图(基因表达谱)研究所提供的信息,使人们有可能系统地全面地从mRNA水平了解特定细胞、组织或器官的基因表达模式并解释其生理属性,深入认识细胞生长、发育、分化、衰老和疾病发生的机制。

  30. 第二节 人类基因组计划 南京农业大学 生命科学学院 5. 全序列图 人类基因组的核苷酸序列图是分子水平上最高层次、最详尽的物理图。测定总长约1米、由30亿个核苷酸组成的全序列是人类基因组计划的最终目标。 人类所拥有的基因位点都是相同的,不同种族、不同个体的基因差异(人类基因组的多样性)以及“正常”与“疾病”基因的差异,只是同一位点上的等位基因的差异。 人类基因组计划所提供的人类核酸序列图,蕴藏了决定我们生、老、病、死的所有遗传信息,将成为人类认识自我、改造自我-使人类健康长寿的知识源泉,为21世纪现代生物学和医学奠定了基础。

  31. 第三节 其它基因组 南京农业大学 生命科学学院 随着焦磷酸测序法等新技术的逐步成熟和现有测序技术成本的逐渐降低,近年来基因组序列数据每年呈指数形式增长。据2007年1月数据,全球已启动2296个基因组项目,其中607个已完成,481个已公开发表基因序列。 下页图为一些已公开基因组数据物种的全基因数据库入口。

  32. Rickettsia prowazekii Bacillus subtilis Ureaplasma urealyticum Drosophila melanogaster Helicobacter pylori Buchnerasp. APS Escherichia coli human Thermotoga maritima Arabidopsis Caenorhabitis elegans Thermoplasma acidophilum mouse rat Borrelia burgorferi Plasmodium falciparum Neisseria meningitidis Z2491 Borrelia burgorferi Mycobacterium tuberculosis Aquifex aeolicus 全基因组已经测序的一些生物 南京农业大学 生命科学学院

  33. 第四节 比较基因组学及相关研究 南京农业大学 生命科学学院 • 与数据库中已知序列比较,基因组的序列可分为3类: • 确知其生理功能的 • 有相匹配的蛋白质序列,但并不知道其功能的 • 在现有数据库中找不到任何相匹配的蛋白质序列的新基因 • 比较基因组学的威力——根据对一种生物相关基因的认识来理解、诠释和克隆分离另一种生物的基因。

  34. 第四节 比较基因组学及相关研究 南京农业大学 生命科学学院 1. 基因组数据的挖掘与分析 到2001年为止已经基本完成DNA序列分析的各种真核生物基因组数据的比较发现,低等真核生物如酵母、线虫以及高等植物拟南芥,基因组比较小,基因密度比较高,百万碱基对中含有200个或更多的基因。 人类基因组研究还发现,人类基因的平均长度为27kb左右,含有8·8个长约145bp的外显子,内含子的长度大大超过外显子,达到3365bp左右。人类基因的3‘非翻译区(URT)的平均长度为770bp,其5'非翻译区的平均长度为300bp,开放读码框的平均长度只有1340bp,编码447个氨基酸。

  35. 第四节 比较基因组学及相关研究 南京农业大学 生命科学学院 1. 基因组数据的比较分析 到尿殖道支原体是最小的基因组( 0·58Mb ),可依此确定能自我复制的细胞必需的一套最少的核心基因。流感嗜血杆菌的基因组为1.83Mb。流感嗜血杆菌基因大小平均900bp,尿殖道文原体的基因为1040bp。流感嗜血杆菌中平均1042bp有1个基因,尿殖道支原体中平均1235bp有1个基因。二者的差别在于基因数量上,流感嗜血杆菌有1743个ORF,尿殖道支原体有470个ORF。 通过流感嗜血杆菌能量代谢类群的ORF分析,了解到它缺乏三竣酸循环(TCA)中必需的3个酶,即柠檬酸合成酶基因、异柠檬酸脱氢酶基因和顺乌头酸酶基因。由此推断流感嗜血杆菌TCA缺失,不能合成谷氨酸,因为谷氨酸的供体是TCA的中间产生物α-酮戊二酸。

  36. Thank You !

More Related