330 likes | 939 Views
人类基因组计划的进展和内容 Human Genome Project HGP. Sequence the 3 billion base pairs of human DNA and identify the 100,000 genes contained in the human genome 测定人类染色体 DNA 上的30亿个核苷酸的排列顺序 确定染色体上的大约10万个基因. 人类的染色体组成. 基因和染色体的关系. HGP 的基本任务 遗传图谱:基因连锁图 物理图谱:
E N D
Sequence the 3 billion base pairs of human DNA and identify the 100,000 genes contained in the human genome • 测定人类染色体DNA上的30亿个核苷酸的排列顺序 • 确定染色体上的大约10万个基因
HGP的基本任务 • 遗传图谱:基因连锁图 • 物理图谱: 人类基因组的不同载体DNA克隆片 段重叠群图,大片段限制性内切酶切点图,DNA片段(探针)或一段特异DNA序列(STS)的路标图,以及基因组中广泛存在的特征性序列等的标记图,人类基因组的细胞遗传学图,最终在分子水平上与序列图的统一。
序列图谱: 30亿个核苷酸组成的人类基因组的序列图 • 基因图谱: 人类基因组中鉴别出占据2-5%长度的全部基因的位置、结构与功能
人类基因组计划大事记 • 一九九○年十月誉为生命科学「阿波罗登月计划」的国际人类基因组计划启动。 • 一九九八年五月一批科学家在美国罗克威尔组建塞莱拉遗传公司,目标是投入三亿美元,到二○○一年绘制出完整的人体基因组图谱,与国际人类基因组计划展开竞争。十月二十三日美国国家人类基因组研究所在美国《科学》杂志上发表声明说,人类基因组计划的全部基因测序工作将比原计划提前两年,即在二○○三年完成。
1999年九月中国获准加入人类基因组计划,负责测定人类基因组全部序列的百分之一,也就是三号染色体上的三千万个硷基对。中国是继美、英、日、德、法之後第六个国际人类基因组计划参与国,也是参与这一计划的唯一发展中国家。十二月一日国际人类基因组计划联合研究小组宣布,他们完整地破译出人体第二十二对染色体的遗传密码,这是人类首次成功地完成人体染色体基因完整序列的测定。2000年四月底中国科学家按照国际人类基因组计划的部署,完成了百分之一人类基因组的工作框架图。2000六月二十六日科学家公布人类基因组工作草图。1999年九月中国获准加入人类基因组计划,负责测定人类基因组全部序列的百分之一,也就是三号染色体上的三千万个硷基对。中国是继美、英、日、德、法之後第六个国际人类基因组计划参与国,也是参与这一计划的唯一发展中国家。十二月一日国际人类基因组计划联合研究小组宣布,他们完整地破译出人体第二十二对染色体的遗传密码,这是人类首次成功地完成人体染色体基因完整序列的测定。2000年四月底中国科学家按照国际人类基因组计划的部署,完成了百分之一人类基因组的工作框架图。2000六月二十六日科学家公布人类基因组工作草图。
不同的生物基因组序列大小比较 Human 3.0 x 109 Mouse 3.0 x 109 Drosophila 1.1 x 108 Worm 1.0 x 108 Dictyostellium 3.4 x 107 Yeast 1.2 x 107 Bacteria 1.0 - 5.0 x 106 BCM- HGSC
全基因组鸟枪法测序的主要步骤第一,建立高度随机、插入片段大小为2kb左的基因组文库。第二,高效、大规模的末端测序。对文库中每一个克隆,进行两端测序。第三,序列集合。TIGR发展了新的软件,修改了序列集合规则以最大限度地排除错误的连锁匹配。第四,填补缺口。
高等真核生物(如人类)基因组中有大量重复序列,导致判断失误高等真核生物(如人类)基因组中有大量重复序列,导致判断失误
对鸟枪法的改进(1) Clone contig法。首先用稀有内切酶把待测基因组降解为数百kb以上的片段,再分别测序。(2) 靶标鸟枪法(direted shotgun)。首先根据染色体上已知基因和标记的位置来确定部分DNA片段的相对位置,再逐步缩小各片段之间的缺口。
Regional mapping 已知基因位置 由已知基因向两端未知区域分别测序
Regional mapping 片段之间还存在未知缺口序列
Regional mapping Minimal tiling path selected for sequencing. 缺口片段逐渐减少,最后完成拼接
>20 kbp ~300 bp Molecular weight marker every 5th lane Restriction fragment fingerprinting - BAC clones are grown in 96-well format - Hind III digest - 1% agarose 限制性酶切指纹图谱
A B C D E F G * * * * * * Contig assembly FPC* • Overlap identification by restriction pattern similarities • Facilitated contig assembly • *Sanger Centre • C. Soderlund, I Longden and R. Mott Clone All restriction fragments within a clone selected for the tiling path must be verified by their presence in overlapping clones. : insert fragments : vector fragments
BCM- HGSC
Shotgun Sequencing I :RANDOM PHASE Sheared DNA: 1.0-2.0 kb Bac Clone: 100-200 kb Random Reads Sequencing Templates: BCM- HGSC
Single Stranded Region Low Base Quality Mis-Assembly (Inverted) Sequence Gap Shotgun Sequencing II:ASSEMBLY Consensus BCM- HGSC
Single Stranded Region Low Base Quality Mis-Assembly (Inverted) Sequence Gap Shotgun Sequencing III: FINISHING Consensus BCM- HGSC
Single Stranded Region Mis-Assembly (Inverted) Sequence Gap Shotgun Sequencing III: FINISHING Consensus BCM- HGSC
Mis-Assembly (Inverted) Sequence Gap Shotgun Sequencing III: FINISHING Consensus BCM- HGSC
Mis-Assembly (Inverted) Shotgun Sequencing III: FINISHING Consensus BCM- HGSC
High Accuracy Sequence: < 1 error/ 10,000 bases Shotgun Sequencing III: FINISHING BCM- HGSC
Whole Genome Shotgun Sequencing Sheared DNA: 1.0-2.0 kb Whole Genome: 3,000 Mb Random Reads Sequencing Templates: BCM- HGSC
Single Stranded Region Low Base Quality Mis-Assembly (Inverted) Sequence Gap Whole Genome Shotgun Sequencing:Assembly Consensus BCM- HGSC
Sequence Gap Whole Genome Shotgun Sequencing:Assembly Low Base Quality Consensus BCM- HGSC
基因图谱 BCM- HGSC
点击显示 人类基因组计划 人类基因组计划的意义