680 likes | 905 Views
第十一章. 动物基因组学 ( Animal Genomics ). 主要内容. 第一节 人类基因组计划 第二节 比较基因组与功能基因组 第三节 生物信息学 第四节 表观遗传学 第五节 分子遗传标记. 第一节 人类基因组计划 ( Human Genome Project ). 人类基因组计划( 1 ). * 1990 年多国合作小组启动, 2001 年在 Nature 上公布结果;. * Craig Venter 博士采用散弹法于 Science 上发表结果。 * 人基因组测序的完成可与人类登月媲美。. 人类基因组计划( 2 ).
E N D
第十一章 动物基因组学 (Animal Genomics)
主要内容 第一节 人类基因组计划 第二节比较基因组与功能基因组 第三节 生物信息学 第四节 表观遗传学 第五节 分子遗传标记
第一节 人类基因组计划 (Human Genome Project)
人类基因组计划(1) * 1990年多国合作小组启动,2001年在Nature上公布结果; *Craig Venter博士采用散弹法于Science上发表结果。 * 人基因组测序的完成可与人类登月媲美。
人类基因组计划(2) * 耗时10载,耗费20余亿美圆; * 基因组大小30亿碱基; * 1%为外显子,99%为内含子和重复序列; * 表达蛋白质的基因组数量约为3万; * 约含100万个SNP标记。
序列测定方法 1 全基因组鸟枪法: 在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。
基因组与基因组学 基因组(Genome)就是指生物体染色体、细胞器中所含的全套遗传物质;一种生物全部基因的集合称为“基因组”。 基因组学(Genomics)就是研究基因组结构和功能的科学。
基因组学的分类 基因组学可以分为结构基因组学和功能基因组学。 对基因组物理结构的作图和测序的研究称为结构基因组学; 功能基因组学是指应用整体的研究技术阐明这些基因和蛋白的生物学功能. 结构基因组学 功能基因组学
后基因组时代 • ( Postgenome era) * 人类基因组计划完成之后,生物学被重新划分为前基因组和后基因组两部分。 * 科学研究已开始进入“后基因组时代”。主要是开展蛋白质组的研究。 * 有科学家形象地说道:即使基因测序全部完成,也只好像是一本没有姓名、只有号码的电话簿。“后基因组时代”的最终目标,是要把深奥的DNA语言变成一本基因大百科全书。
第二节 比较基因组与功能基因组 (Comparative Genome & Functional Genome)
遗传图谱与物理图谱 遗传图谱:又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。 物理图谱:物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。
序列图谱与基因图谱 随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。 基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。
什么是比较基因组学? 利用生物在进化上的亲缘关系,来比较它们与人类之间的相似与相异,即比较基因组学。
蛋白组学与功能基因组学 * 蛋白组(Proteome) 蛋白质组是指“一种基因组所表达的全套蛋白质”。 * 蛋白组学(Proteomics) 一门在整体水平上研究细胞内蛋白质的组成及其活动规律的新兴学科。 * 蛋白组学与功能基因组学息息相关。
蛋白质组学的研究内容 1.蛋白质分离和鉴定:2.翻译后修饰:翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。3.蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子的生物分析/配基-受体结合分析。可以利用基因敲除和反义技术分析基因表达产物-蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。4.对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展。如寻找药物的靶分子。很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质-蛋白质相互作用。
第三节 生物信息学 (Bioinformatics)
背景知识 包括人、鸡、水稻等动植物以及大肠杆菌等原核生物的数十种模式生物的基因组序列的成功获得;以及更多生物基因组序列的即将获得。 生物信息学是在此背景下发展起来的综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。生物信息学是内涵非常丰富的学科,其核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和解释。
什么是生物信息学? 生物信息学是以生物大分子为研究对象,以计算机为工具,运用数学和信息科学的观点、理论和方法去研究生命现象、组织和分析呈指数级增长的生物信息数据的一门科学.
主要研究内容 1 1、生物信息的收集、存储、管理与提供 包括建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统;生物信息的在线服务;生物信息可视化和专家系统。 2、基因组序列信息的提取和分析 包括基因的发现与鉴定;基因组中非编码区的信息结构分析,提出理论模型,阐明该区域的重要生物学功能;进行模式生物完整基因组的信息结构分析和比较研究;利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与DNA折叠的关系以及基因组信息与生物进化关系等生物学的重大问题。
主要研究内容 2 3、功能基因组相关信息分析 包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测的研究。 4、生物大分子结构模拟和药物设计 包括RNA(核糖核酸)的结构模拟和反义RNA的分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于DNA结构的药物设计等。
主要研究内容 3 5、生物信息分析的技术与方法研究 包括发展软件、数据库工具;改进现有的理论分析方法;创建一切适用于基因组信息分析的新方法、新技术。包括引入复杂系统分析技术、信息系统分析技术等;建立严格的多序列比较方法;发展与应用密码学方法以及其他算法和分析技术;发展研究基因组完整信息结构和信息网络的研究方法等;发展生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。 6、应用与发展研究 汇集与疾病相关的人类基因信息,发展患者样品序列信息检测技术和基于序列信息选择表达载体、引物的技术,建立与动植物良种繁育相关的数据库以及与大分子设计和药物设计相关的数据库。
基因和基因组数据库 1 EMBL、GenBank和DDBJ是国际上三大主要核酸序列数据库。 EMBL是由EuropeanMolecularBiology Laboratory于1982年创建的,目前由欧洲生物信息学研究所负责管理。数据库网址是:http://www.ebi.ac.uk/embl/。
基因和基因组数据库 2 美国国家健康研究院NIH也于80年代初委托洛斯阿拉莫斯国家实验室建立GenBank,后移交给国家生物技术信息中心NCBI,隶属于NIH下设的国家医学图书馆。NCBI的网址是:http://www.ncbi.nlm.nih.gov。
基因和基因组数据库 3 DDBJ是DNADataBaseofJapan的简称,创建于1986年,由日本国家遗传学研究所负责管理。DDBJ的网址是:http://www.ddbj.nig.ac.jp/。 1988年,EMBL、GenBank与DDBJ共同成立了国际核酸序列联合数据库中心,建立了合作关系。
蛋白质数据库 1 1. PIR和PSD PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。PIR和PSD的网址是:http://pir.georgetown.edu/。 2. SWISS-PROT SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。
蛋白质数据库 2 3. PROSITE PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。PROSITE的网址是:http://www.expasy.ch/prosite/。 4. PDB 蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。 RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。
功能数据库 1. KEGG 京都基因和基因组百科全书(KEGG)是系统分析基因功能,联系基因组信息和功能信息的知识库。http://www.genome.ad.jp/kegg/。 2. DIP 相互作用的蛋白质数据库(DIP)收集了由实验验证的蛋白质-蛋白质相互作用。http://dip.doe-mbi.ucla.edu/。
3. ASDB 可变剪接数据库(ASDB)包括蛋白质库和核酸库两部分。ASDB的网址是:http://cbcg.nersc.gov/asdb。 4. TRRD 转录调控区数据库(TRRD)是在不断积累的真核生物基因调控区结构-功能特性信息基础上构建的。http://wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/。 5. TRANSFAC TRANSFAC数据库是关于转录因子、它们在基因组上的结合位点和与DNA结合的profiles的数据库。 http://transfac.gbf.de/TRANSFAC/。
常用操作举例 基因组序列信息分析 序列比对和数据库搜索(BLAST) 核酸与蛋白质结构和功能的预测分析 蛋白质的三维结构预测 分子进化分析(序列进化树) 功能基因组相关信息分析
第四节 表观遗传学 (Epigenetics)
什么是表观遗传学 在基因组中除了DNA和RNA序列以外,还有许多调控基因的信息,它们虽然本身不改变基因的序列,但是可以通过基因修饰,蛋白质与蛋白质、DNA和其它分子的相互作用,而影响和调节遗传的基因的功能和特性,并且通过细胞分裂和增殖周期影响遗传的一门新兴学科。因此表观遗传学又称为实验遗传学、化学遗传学、特异性遗传学、后遗传学、表遗传学和基因外调节系统,它是生命科学中一个普遍而又十分重要的新的研究领域。
表观遗传学与表观基因组学 • 表观遗传学(epigenetics)则是指基于非基因序列改变所致基因表达水平变化,如DNA甲基化和染色质构象变化等。 • 表观基因组学(epigenomics)则是在基因组水平上对表观遗传学改变的研究。
表观遗传学的分子机制 1、DNA甲基化; 2、 RNA干扰; 3、组蛋白修饰; 4、染色质改型;
DNA甲基化 • DNA 甲基化:DNA的甲基化是生物关闭基因表达的一种有效手段,也是印迹遗传的主要机制之一;基因的去甲基化可能使得印迹丢失,基因过度表达,甚至引起肿瘤或癌症的发生,如促肿瘤生长因子IGF2基因过度表达引发大肠癌。
RNA干扰 RNA干扰(RNA interference,RNAi)是正常生物体内抑制特定基因表达的一种现象,它是指当细胞中导入与内源性mRNA编码区同源的双链RNA(double stranded RNA,dsRNA)时,该mRNA发生降解而导致基因表达沉默的现象,这种现象发生在转录后水平,又称为转录后基因沉默。
RNA干扰的作用机制 长片段dsRNA在细胞内被Ⅲ型RNA酶Dicer切成长度大约为19-23nt的小片段干扰 RNA (small interfering RNA,siRNA),由siRNA参与构成复合物RISC(RNA-induced silence complex)。siRNA通过与同源mRNA的特异配对,引导RISC特异地降解同源mRNA,导致基因表达的抑制。因此小片段的siRNA也可以诱导高效的基因沉默。
RNA干扰的应用 1、研究基因功能的新工具; 2、病毒性疾病的治疗; 3、遗传性疾病的治疗; 4、肿瘤病的治疗
组蛋白修饰 组蛋白的修饰可通过影响组蛋白与DNA双链的亲和性,从而改变染色质的疏松或凝集状态,或通过影响其它转录因子与结构基因启动子的亲和性来发挥基因调控作用。组蛋白修饰对基因表达的调控有类似DNA遗传密码的调控作用。
第二节 分子遗传标记 (Molecular Genetic Marker)
什么是遗传标记? 遗传标记genetic marker:指可追踪染色体、染色体某一节段、某个基因座在家系中传递的任何一种遗传特性。 它具有两个基本特征,即可遗传性和可识别性; 因此生物的任何有差异表型的基因突变型均可作为遗传标记。