1 / 105

肿瘤基因组学 肿瘤整合组学

肿瘤基因组学 肿瘤整合组学. 中南大学肿瘤研究所 向娟娟 ( xiangjj@csu.edu.cn ) 2012 年 5 月 18 日. A turning point in cancer research: sequencing the human genome. Science. 1986 7;231(4742):1055-6.

shina
Download Presentation

肿瘤基因组学 肿瘤整合组学

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 肿瘤基因组学肿瘤整合组学 中南大学肿瘤研究所 向娟娟 (xiangjj@csu.edu.cn) 2012年5月18日

  2. A turning point in cancer research: sequencing the human genome. Science. 1986 7;231(4742):1055-6 • We have two options: either to try to discover the genes important in malignancy by a piecemeal approach, or to sequence the whole genome of a selected animal species. • I think that it will be far more useful to begin by sequencing the cellular genome. • In which species should this effort be made? If we wish to understand human cancer, it should be made in humans because the genetic control of cancer seems to be different in different species.

  3. From genetics to genomics • Genetics is the science of individual genes and their impact on inherited disease. • A Genome is an organism's complete set of DNA, including all of its genes. In humans, a copy of the entire genome-more than 3 billion DNA base pairs-is contained in all cells that have a nucleus. • Genomics is the study of the full collection of a person's genes and their interactions with each other and the internal and external environment they are exposed to.

  4. 一、基因组的概念

  5. 1、什么是基因? • 基因:基因是合成一种有功能的多肽链或者RNA分子所必需的一段完整的DNA序列。基因是遗传的物质基础,是DNA(脱氧核糖核酸)分子上具有遗传信息的特定核苷酸序列的总称,是具有遗传效应的DNA分子片段。

  6. 基因有三个基本特性: • ①基因可自体复制;②基因决定性状,即基因通过转录和翻译决定多肽链的氨基酸顺序,从而决定某种酶或蛋白质的性质,而最终表达为某一性状;③基因的突变,即基因虽很稳定,但也会发生突变。

  7. 2、什么是基因组 • 基因组是指单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。可是基因组测序的结果发现基因编码序列只占整个基因组序列的很小一部分。因此,基因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子(部分病毒是RNA) 。

  8. 原核生物的基因组结构特点 • 基因组长度较小,如λ噬菌体的基因组为4.8kb,含有46个基因; • 基因组结构简单,有单拷贝或者低拷贝DNA组成; • 排列紧密,有重叠基因 • 基因组DNA大部分具有编码转录功能,非编码重复序列和内含子极少

  9. 真核生物的基因组结构特点 • 基因组大; • DNA序列与蛋白质结合形成结构复杂的染色体; • 不连续的断裂基因,存在内含子; • 外显子序列高度保守,内含子序列可以不同。

  10. 二、基因组学的概念

  11. 1、什么是基因组学? • 基因组是描述生物全部基因和染色体组成的概念。1986年由美国科学家Thomas Roderick提出的基因组学(genomics)是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学。

  12. 2、基因组学研究的历史 • 第一个做基因测序的是1972年Walter fiers测了一个基因的序列:bacteriophage MS2 coat protein • 第一个基因组测序是Fred Sanger完成噬菌体DNA的测序(5368bp)。他们建立了测序,基因组图谱,数据储存和生物信息学分析。 • 第一个有机体的测序是1995年,嗜血性流感病毒的测序(1.8MB)。

  13. 3、基因组学研究的最终目标 • 获得生物体全部基因组序列 • 鉴定所有基因的功能 • 明确基因之间的相互作用关系 • 阐明基因组的进化规律

  14. 4、人类基因组计划(human genome project, HGP)

  15. HGP的历史回顾 • 1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义 • 1986 杜伯克在《Science》撰文“肿瘤研究的转折点:人 类基因组的测序” • 美国能源部(DOE)提出“人类基因组计划”草案 • 1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元 • 1989 美国成立“国家人类基因组研究中心”,Watson担任 第一任主任 • 1990.10 经美国国会批准,人类基因组计划正式启动

  16. HGP的最初目标: • 通过国际合作,用15年时间(1990~2005)至少投入$30亿 • 构建详细的人类基因组遗传图和物理图; • 确定人类DNA的全部核苷酸序列; • 对其它生物进行类似研究。

  17. HGP研究内容(mapping,sequencing) • 遗传图谱 • 物理图谱 • 序列图谱 • 基因图谱

  18. 遗传图谱(genetic map) 是指基因或DNA标志在染色体上的相对位置与遗传距离。遗传距离用重组率来衡量。即通过计算两个连锁的遗传标记在每次减数分裂中的重组概率,确定两者的相对距离。其单位用厘摩(cM )表示。1厘摩表示每次减数分裂的重组频率为1%。

  19. 遗传图是将每条染色体上的基因或遗传标记的相对位置经连锁分析确定下来,构成图谱,因此,需借助相应的遗传标记。遗传图是将每条染色体上的基因或遗传标记的相对位置经连锁分析确定下来,构成图谱,因此,需借助相应的遗传标记。 DNA技术的建立为人类提供了大量新的遗传标记。 遗传标记有三代

  20. 多态性DNA标记 • 人类的DNA序列上平均每几百个碱基会出现一些变异,这些变异通常不产生病理性后果,并按照遗传规律由亲代传给子代,从而在不同个体间表现出不同,既遗传多态性。多态性可用作为遗传标志。通过研究家系中多态性标记与某疾病(表型)的连锁遗传规律,确定标记位点与疾病基因间的遗传距离。这种基于连锁分析信息确定基因的理由是与致病基因连锁的两侧标记将致病基因“夹”在中间。如果在该区域选择较多的标记进行 连锁分析,就可进一步针对更狭窄的区域进行基因定位。

  21. 遗传图谱绘制的意义 • “遗传图”的建立为人类疾病相关基因的分离克隆奠定了基础。拥有6000多个遗传学位点,相当于把整个人类基因组划分为6000多个小区,并分别设置了“标牌”。如果在家系中证实该基因与某个标记不连锁(重组率为50%),表明该基因不在这一标记附近。 • 如果发现该基因与某个标记有一定程度的“连锁”(重组率小于50%但大于0),表明它可能位于这个标记附近。 • 如果该基因与某标记间不发生重组(重组率等于0),我们就推测该标记与所研究的疾病基因可能非常接近。

  22. 1、限制性片段长度多态性(RFLP) RFLP是指不同个体基因组内的核苷酸序列因某种原因产生碱基突变后,改变 了某种 限制性内切酶的剪切位点,使此酶在该位点不能剪切,形成了长度不等的限制性片段。这些 限制性片段在人类不同个体间呈现的多态性现象称为限制片段长度多态性。

  23. 2、可变数量串联重复(VNTR) • VNTR分布在人类基因组的非编码区,是一些串联排列的十几个碱基的重复序列,重复次数一般在十次左右。VNTR的等位基因常常在10个以上,信息量比RFLP大得多。重复单位长度在15-65个核苷酸左右的小卫星DNA;重复单位长度在2-6个核苷酸之间的微卫星DNA,又称为简短串联重复(STR、STRP或SSLP)。

  24. 第三代DNA遗传标记,可能也是最好的遗传标记,是分散于基因组中的单个碱基的差异,即单核苷酸的多态性(SNP),包括单个碱基的缺失、插入和替换。第三代DNA遗传标记,可能也是最好的遗传标记,是分散于基因组中的单个碱基的差异,即单核苷酸的多态性(SNP),包括单个碱基的缺失、插入和替换。 • SNP中大多数为转换,即由一种嘧啶碱基替换另一种嘧啶碱基,或由一种嘌呤碱基替换另一种嘌呤碱基,颠换与转换之比为1:2。 • 估计人类基因组中可能有300万个SNP位点 • SNP与RFLP和STRP标记的主要不同之处在于,它不再以DNA片段的长度变化作为检测手段,而直接以序列变异作为标记。

  25. 物 理 图 谱 物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离〔碱基对(bp) 或千碱基(kb)或兆碱基(Mb)〕的图谱。

  26. 序 列 图 谱 • 人类基因组的核苷酸序列图是分子水平上最高层次、最详尽的物理图。测定由30亿个核苷酸组成的全序列是人类基因组计划的最终目标。 • 人类所拥有的基因位点都是相同的,不同种族、不同个体的基因差异(人类基因组的多样性)以及“正常”与“疾病”基因的差异,只是同一位点上的等位基因的差异。

  27. 基 因 图 谱 在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。 在人类基因组中鉴别出占具2%-5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。

  28. 模式生物基因组计划:HGP的重要组成部分和必要补充模式生物基因组计划:HGP的重要组成部分和必要补充 • 将从模式生物中得到的数据和资料与人类基因组比较,通过不同生物基因 序列的同源性来阐明人类相应基因的功能; • 通过研究小而简单的模式生物的基因组,积累经验,发展技术,同时,对 模式生物的研究亦具有重要的经济价值。

  29. 未完成的测序部分 • 染色体的着丝粒位置,是高度重复的DNA序列,难以测序。大概有百万到千万碱基未测。 • 染色体的末端,称为端粒的位置,也是高度重复的序列。 • 编码多基因家族成员的位点; • 还有一些位点散在在基因组中未测序

  30. 人类基因组计划的发现 • 发现人类的基因总数在3万个左右 • 基因的分布在染色体上不平衡(基因密度在第17、19和22号染色体上最高,在X、Y、第4号和第18号染色体上密度较小 ) • 很多基因包含有重复序列 • 每个人都有自己的一套SNP,它对“个性”起着决定的作用。

  31. 人类基因组计划的意义 • 获得人类全部基因序列将有助于人类认识许多遗传疾病以及癌症等疾病的致病机理,为分子诊断、基因治疗等新方法提供理论依据。 • 破译生命密码的人类基因组计划有助于人们对基因的表达调控有更深入的了解。

  32. 5. SNP和GWAS

  33. 单核苷酸多态性(SNP) • 单核苷酸多态性(single nucleotide polymorphism,SNP),是指不同个体基因组DNA序列中同一位置上的单个核苷酸的差异。 • SNP是 基因组中出现频率最高的变异类型,平均每1000个碱基对序列中就可能发生一个SNP。 占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。 • SNPs开始的时候可以说一个点突变,最后在人群中达到1%以上,才能称之为是SNP。 • 由于SNP在不同个体间和不同组织、细胞间高度多态性,使其成为研究基因多样性和识别、定位疾病相关基因的一种新型手段。把这些单个核苷酸差别的基因座作为基因组作图的标记,开展大规模基因变异多态性和基因表达活性研究, 可推动基因组的整体研究和基因定位发展到一个新阶段。SNP检测可应用在连锁分析、疾病关联分析、多基因疾病的基因定位、发病机理、个体识别及亲子鉴定、生物进化关系等方面 的研究 

  34. 全基因组关联分析(GWAS) • 全基因组关联分析(Genome-wide association study,GWAS)是一种对全基因组范围内的常见遗传变异(单核苷酸多态性和拷贝数)基因总体关联分析的方法,在全基因组范围内进行整体研究,能够一次性对疾病进行轮廓性概览,适用于复杂疾病的研究。 • 高通量 --- 一个反应监测成百上千个SNPs • 是一种无假设的研究,不只局限与“候选基因”,基因可以是“未知”的; • 发现特定基因与疾病等的关联。

  35. 三、肿瘤基因组学的概念

  36. 肿瘤是个多基因病

  37. 肿瘤基因组学 • 肿瘤基因组学是研究人类肿瘤基因组的一门学科。是在癌症患者和癌症家族中测序全部基因,定位突变(遗传性突变和散发性突变),明确这些突变在肿瘤发生发展中的作用。

  38. 1、瘤基因与抑瘤基因 • 瘤基因(oncogene),也叫转化基因,是人类或其它动物细胞以及致癌病毒基因组中固有的、在一定条件下能使正常细胞转变为恶性细胞的核苷酸序列。 分为病毒癌基因和细胞癌基因两类。 • 抑瘤基因(tumor suppressor gene)又称为抗瘤基因(antioncogene)、肿瘤易感基因(tumor susceptibility gene),是在正常情况下存在于细胞内能抑制细胞生长并能潜在抑制细胞癌变的核苷酸序列。

  39. 病毒癌基因 • 肿瘤病毒是一类能使宿主产生肿瘤或使培养细胞转化成癌细胞的动物病毒。 • 其核酸组成分为DNA病毒和RNA病毒。 • 病毒癌基因*(virus oncogene,v-onc*)是一类存在于肿瘤病毒(大多数是逆转录病毒)中的、能使靶细胞发生恶性转化的基因。

  40. 细胞癌基因 • 存在于正常细胞基因组中的一类基因,正常情况下处于静止或低表达状态,其表达产物对细胞正常的生长和分化起着精密调控作用,当其活化后可使细胞癌变。

  41. 肿瘤的突变类型 • 点突变 • 易位 • 扩增和缺失 • 全染色体的丢失/倍增 • 表观遗传学

  42. 2、癌症基因组分析的策略 • 癌症基因组研究发现癌症基因 对候选基因家族测序发现癌症基因 Sanger法外显子组测序 新一代测序技术全基因组测序 • 癌症基因组分析检测体细胞改变的类型 • 癌症基因组分析中的信号通路导向模型 • “乘客”和“驱动”突变:在肿瘤生长中没有功能的中性突变

  43. PIK3CA PIK3CA TP53 TP53

  44. 3、肿瘤基因组学的研究目标 • 发现:促进癌症的分子机制的研究 • 技术:加快基因组科学和技术的发展 • 转化:将基因组数据用于提高癌症的治疗,诊断

  45. 4、癌症基因组学对于医学研究的意义 • 癌症基因组学改变了肿瘤的分类,推动从组织学分类向遗传学分类转变; • 分子靶向药物证实了体细胞的遗传改变是癌症治疗的靶标; • 肿瘤分子分型帮助实现个体化医疗; • 肿瘤特异性的DNA改变作为高度灵敏的生物标记可用于疾病的检测和监控

  46. 肺癌的分子分型 EGFR 突变 EML4-ALK融合基因型 分子分型 乳腺癌的分子分型 • ER(+)、PR(+) • HER2 扩增 • 三阴性 结直肠癌的分子分型 • K-Ras 突变 • BRAF 突变

  47. 经批准的激酶抑制剂 小分子激酶抑制剂的靶向治疗

More Related