690 likes | 965 Views
疾病相关常见多态与罕见变异的比较分析. 徐良德 副教授 哈医大生物信息学院. 复杂疾病的复杂性. 复杂疾病的分子遗传特征 多基因 (polygenic) 微效性 (minor effect) 多效性 (pleiotropy) 异质性 (heterogenity) 上位效应 (epistasis) 复杂疾病与生物信息学 高通量、数量化、系统性. SNP 与 SNV. 量度指标. 等位 (Allele) 最小等位频率 (Minor Allele Frequency, MAF) >5%, <5%&>1%, <1% 基因型 (Genotype)
E N D
疾病相关常见多态与罕见变异的比较分析 徐良德 副教授 哈医大生物信息学院
复杂疾病的复杂性 • 复杂疾病的分子遗传特征 • 多基因 (polygenic) • 微效性 (minor effect) • 多效性 (pleiotropy) • 异质性 (heterogenity) • 上位效应 (epistasis) • 复杂疾病与生物信息学 • 高通量、数量化、系统性
量度指标 • 等位(Allele) • 最小等位频率(Minor Allele Frequency, MAF) • >5%, <5%&>1%, <1% • 基因型(Genotype) • 基因型频率 • Hardy-Weinberg平衡 • 连锁不平衡(Linkage Disequilirium) • D’, r2, LOD
SNP的特点 • 人类基因组中有1000万个常见SNP,不同人群的SNP存在异质性 • SNP分布均匀,是一种2态多态,易于分型 • SNP与附近的DNA处于连锁不平衡状态,可以特异的代表某个区段 • 将SNP作为分子标记可以用于识别疾病相关染色体区段或作为疾病诊断分子标志物 • 常见变异常见疾病假说是定位研究的基础
SNV的特点 • SNV的最小等位频率小于1%,数量巨大 • 很多SNV是Singleton,在人群中出现频率极低,与某些孟德尔遗传病直接相关 • 一个世代传递会发生约200个新突变位点,体细胞DNA也可能产生SNV • SNV与常见疾病发生有关,可能被常见SNP俘获,也可能独立行使功能
记录年龄、性别、民族、BMI、吸烟史、饮酒史等记录年龄、性别、民族、BMI、吸烟史、饮酒史等 • 检测血压、血糖、血脂值及其他与诊断有关的重要生理、病理指标 • 存档特定疾病的特殊生化、血液指标信息 • 保存外周血样 • 条件允许时记录随访信息 • 样本量要求:参考研究经费,越多越好
候选疾病基因 基因与疾病潜在的相关性 作用机理 功能类 分子实验 群体移植 高通量计算 候选基因的筛选
利用HapMap筛选TagSNP • http://hapmap.ncbi.nlm.nih.gov/ • http://hapmap.ncbi.nlm.nih.gov/biomart/martview/50fe71de2801008a858746a71f63bbf0
利用dbSNP筛选功能性SNP • http://www.ncbi.nlm.nih.gov/projects/SNP/
Alu I 内切酶位点 500bp 200bp AGCT 样品A 内切酶位点突变 X ATCT 样品B G/G G/T T/T 700bp 片段长度 500bp 200bp SNP的实验室分型:限制性内切酶法
研究对象:PLA2G7 • 研究样本:947个对照样本,827个冠心病样本,512个心肌梗死样本 • 研究SNP:3个TagSNP,4个非同义SNP(改变三联密码子编码)
常用的分析工具 • Plink • Merlin • SNPtest
基因组范围关联分析特点 • 研究SNP数量大(数十万计) • 研究样本量大(case-control数据各大于1000) • 研究的统计显著性水平要求高(p<10-7) • 研究花费大,研究结果意义重大,研究效率不高
实验一:Texas I (1154 case:1173 control) • 315450个SNP • 实验二:Texas II (711 case:632 control) • 实验三:UK (2013 case:3062 control)
肺癌基因定位15q25.1 • PSMA4\CHRNA5\CHRNA3\CHRNB4
实验平台一:1924 case:2938 control • 393 143个SNP • 实验平台二:1464 case:1467 control • 378 860个SNP • 实验平台三:1161 case:1174 control • 44 750个SNP
重点推荐 • SNP识别工具日新月异,基本的提取和质量控制工具应经过大量应用的方法,支持多样本整合 • 单个位点质量估计推荐使用GATK或SOAPsnp • 短读长与参考基因组比对推荐使用较为敏感的工具,如Novoalign或Stampy • 基因型提取方法最好支持多样本贝叶斯推断,并考虑到LD的作用,以提高准确率