640 likes | 1.06k Views
定性性状的连锁研究. 一、 outline. IBD/IBS 介绍 受累同胞对分析 (Affected Sib-pair) 受累亲属对分析 (Affected relative-pair). 一、 outline. IBD/IBS 介绍 受累同胞对分析 (Affected Sib-pair) 受累亲属对分析 (Affected relative-pair). 二、 IBD/IBS 介绍. IBD (identical by descent): 来源同一,指的是子代中共有的一段 DNA 区域或共有的 等位基因 来源于一个共同的祖先。
E N D
一、outline • IBD/IBS介绍 • 受累同胞对分析(Affected Sib-pair) • 受累亲属对分析(Affected relative-pair)
一、outline • IBD/IBS介绍 • 受累同胞对分析(Affected Sib-pair) • 受累亲属对分析(Affected relative-pair)
二、IBD/IBS介绍 • IBD (identical by descent):来源同一,指的是子代中共有的一段DNA区域或共有的等位基因来源于一个共同的祖先。 • An allele is shared by two family members (e.g. siblings, uncle-niece). It can be elucidated that this allele was transmitted from a common ancestor.
二、IBD/IBS介绍 • IBS (identical by state):状态同一,只考虑家系成员之间遗传标记或等位基因的相似性,而不管其是否来源于一个共同的祖先,也不需进行亲代的等位基因分型。 • An allele is shared by two family members (e.g. siblings, uncle-niece). Although the allele is of the same type , they may or may not share this allele from a common ancestral chromosome.
1 2 1 3 1 2 1 2 二、IBD/IBS介绍 IBD=2 IBS=2
1 1 1 2 1 2 1 2 二、IBD/IBS介绍 IBD=? IBS=2
1/2 1/3 1/2 1/3 1/2 1/3 1/2 1/2 1/3 1/3 1/2 1/1 二、IBD/IBS介绍 IBD=0 IBS=1 IBD=1 IBS=1 IBD=2 IBS=2
1 2 1 2 1 2 1 2 IBD= IBS=2 二、IBD/IBS介绍
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 二、IBD/IBS介绍 Prob 1/2 IBD=2 Prob 1/2 IBD=0
1/2 2/2 2/3 二、IBD/IBS介绍-缺失数据 2/3
2/3 1/2 2/3 1/3 1/3 2/3 2/3 1/3 二、IBD/IBS介绍-缺失数据 2/3 1/? 2/3 1/3 P(0) = 0, P(1) = 1, P(2) = 0 P(0) = 1, P(1) = 0, P(2) = 0
二、IBD/IBS介绍-缺失数据 • 对于上面的群体,等位2的频率为0.25,等位3的频率为0.5。根据2、3的等位频率可以计算出两种可能的基因型的相对频率: • P(父亲基因型为1/2)=0.25/(0.5+0.25)=0.333 • P(父亲基因型为1/3)=0.5/(0.5+0.25)=0.667
二、IBD/IBS介绍-缺失数据 • P(父亲基因型为1/2)=0.25/(0.5+0.25)=0.333 • P(父亲基因型为1/3)=0.5/(0.5+0.25)=0.667 • 计算出IBD=0,1,2概率: P(IBD=0)=0.333*0+0.667*1=0.667 P(IBD=1)=0.333*1+0.667*0=0.333 P(IBD=2)=0.333*0+0.667*0=0
12 13 12 12 33 13 二、IBD/IBS介绍-扩展家系 叔叔-侄女 IBS=1 IBD=1
一、outline • IBD/IBS介绍 • 受累同胞对分析(Affected Sib-pair) • 受累亲属对分析(Affected relative-pair)
三、受累同胞对数据分析 • 受累同胞对分析(Affected Sib-Pair, ASP):通过确定的父母和受累(非受累)后代的基因型数据能够确定多个受累个体的同胞关系,只有孩子具有表型。 • 当父母的表型有缺失时,可以使用非受累后代与受累的后代在同胞对之间比较共享的等位。
三、受累同胞对(ASP)数据分析 • ASP分析的三种抽样方法: 1.同胞对都患病; 2.同胞对一个患病,一个正常; 3.同胞对都正常
1/2 2/3 1/3 2/3 三、受累同胞对(ASP)数据分析 • 观察两个受累同胞对标记等位 的遗传特性。如果疾病与标记 有关,那么在同胞之间有相似 的基因型。 利用同胞对之间共享的IBD的数目来衡量基因型的相似性。
三、受累同胞对(ASP)数据分析 • 假设父代在标记位点的基因型分别为 (g1,g2) 和 (g3,g4).假定sib1的基因型为(g1,g3). • Pr(sib2 has allele g1) = Pr(sib2 has allele g2) = 0.5 • Pr(sib2 has allele g3) = Pr(sib2 has allele g4) = 0.5 • Pr(sib2 has (g1,g3)) = Pr(IBD=2) = 0.52 = 0.25 • Pr(sib2 has (g2,g4)) = Pr(IBD=0) = 0.52 = 0.25 • Pr(sib2 has (g1,g4)) = Pr(sib2 has (g2,g3)) = 0.52 = 0.25 • Pr(IBD=1) = Pr(sib2 has (g1,g4)) + Pr(sib2 has (g2,g3)) = 0.5
三、受累同胞对(ASP)数据分析 • 根据孟德尔分离法则同胞对共享情况如下: • Both marker alleles 0.25 • One marker allele 0.5 • No marker allele 0.25 • The average number of shared alleles is: (0.25 * 2) + (0.5 * 1) + (0.25 * 0) = 1 However, if the marker is linked to the disease locus the overall amount of sharing between affected sibs will be increased !
1/2 2/3 1/3 2/3 三、受累同胞对数据分析 • 如果疾病与标记没有连锁,那么共享IBD数目分别为0,1,2的亲属对的比例为1:2:1。 • 父亲或者母亲或者将相同的等位(共享IBD)或者将不同的等位(不共享IBD)传递给两个后代。如果疾病与标记没有连锁,传递相同等位给后代的父亲或者母亲的比例为50%,如果有连锁,那么此比例高于期望的50%。 • 如上图,一个传递共享IBD(“3”),一个传递不共享IBD(“2”=“1”)。
Close to disease locus (θ<<0.5): affected sibs share on average more than 1 allele IBD if the genetic component is strong. Far away (θ=0.5): affected sibs share on average 1 marker allele IBD. 三、受累同胞对(ASP)数据分析 • Main Idea:如果一个标记与疾病位点连锁患病的同胞对比随机情况(无连锁)更倾向于获得相同的标记等位。 Disease Locus
三、受累同胞对数据分析 • IBD sharing probabilities: 0.25, 0.5, 0.25. • IBS sharing probabilities: 依赖于标记位点的等位频率,一个公共的等位比一个稀少的等位在同胞对之间更可能是共享的IBS。 • 由于IBS没有用到父母的信息所以比IBD分析的检验效能要低,而且如果等位频率错误可能会产生偏奇。
三、受累同胞对数据分析 • 假设一个同胞对和一些位点,父亲或者母亲向下传递相同等位(共享IBD)或者不同等位(不共享IBD)给同胞对的概率是0.5。 • N表示同胞对之间共享IBD的数目,可以将N看作是两次试验中成功的次数,这里的成功是指父亲或者母亲将相同的等位传递给同胞对。 • 成功的概率为0.5。
三、受累同胞对数据分析 • 如果给定的是疾病位点,受累同胞对共享IBD的概率,相当于计算条件概率: • z0 = P(N=0|ASP) • z1 = P(N=1|ASP) • z2 = P(N=2|ASP) • 此条件概率依赖于疾病的遗传模式
三、受累同胞对数据分析 • 隐性疾病: f0=f1=0, f2=1 • 显性疾病:f0= 0, f1= f2=1/2
三、受累同胞对数据分析 P( N=k): k = 0, 1, 2 ? • 父母在疾病位点的可能基因型为: • 满足哈代温伯格平衡下相应的基因型频率为:
三、受累同胞对数据分析 P( N=k): k = 0, 1, 2 ? Assume a genetic model of a recessive disease with full penetrance: f =(0,0,1). Explanation: both affected sibs must have 2 disease alleles and these Must be of different parental origin…
P(N=0) = 0.000 P(N=1) = 0.002 P(N=2) = 0.998 P = 0.001 三、受累同胞对数据分析 P( N=k): k = 0, 1, 2 ? In a similar way:
三、受累同胞对数据分析 • 隐性疾病: z0=z1=0, z2=1 • 显性疾病:z0= 0, z1= z2=1/2 • 标记位点与疾病无关: z0=0.25,z1=0.5, z2=0.25
三、受累同胞对数据分析 • 根据上述两个假设,提出关于受累同胞对分析的三种检验方法: 1.拟和优度检验:IBD=0,1,2的卡方检验,自由度为2; 2.均值检验:受累同胞之间共享等位数均值与期望值1相比较; 3.比例检验:检验IBD=2的数目与期望值相比较
三、受累同胞对数据分析 • 根据上述两个假设,提出关于受累同胞对分析的三种检验方法: 1.拟和优度检验:IBD=0,1,2的卡方检验,自由度为2; 2.均值检验:受累同胞之间共享等位数均值与期望值1相比较; 3.比例检验:检验IBD=2的数目与期望值相比较
三、受累同胞对数据分析——拟和优度检验(goodness of fit) • 设一个受累同胞对(ASP)共享IBD=0,1,2的概率分别为z0,z1,z2 • 在疾病与标记没有连锁的零假设下z0=1/4,z1=1/2,z2=1/4
三、受累同胞对数据分析——拟和优度检验(goodness of fit) • n=受累同胞对的总数 • n0=共享IBD(0)的同胞对数目 • n1=共享IBD(1)的同胞对数目 • n2=共享IBD(2)的同胞对数目
三、受累同胞对数据分析——拟和优度检验(goodness of fit)
三、受累同胞对数据分析——拟和优度检验(goodness of fit) • 案例:研究119个患有糖尿病的同胞对,研究人员已经测定同胞对在候选位点FGF3的基因型,研究问题:胰岛素依赖性糖尿病(IDDM)与FGF3是否存在连锁? • 测定119个同胞对在FGF3候选位点的基因型之后确定20个同胞对共享0个IBD,59个同胞对共享1个IBD,40个同胞对共享2个IBD。 • 通过检验决定在IDDM与FGF3之间是否存在显著连锁。
三、受累同胞对数据分析 • 根据上述两个假设,提出关于受累同胞对分析的三种检验方法: 1.拟和优度检验:IBD=0,1,2的卡方检验,自由度为2; 2.均值检验:受累同胞之间共享等位数均值与期望值1相比较; 3.比例检验:检验IBD=2的数目与期望值相比较
三、受累同胞对数据分析——均值检验(Mean Test) • 均值检验:受累同胞之间共享等位数均值与期望值1相比较,无连锁的零假设下共享等位的期望为50%。 服从标准正态分布
三、受累同胞对数据分析 • 根据上述两个假设,提出关于受累同胞对分析的三种检验方法: 1.拟和优度检验:IBD=0,1,2的卡方检验,自由度为2; 2.均值检验:受累同胞之间共享等位数均值与期望值1相比较; 3.比例检验:检验IBD=2的数目与期望值相比较
三、受累同胞对数据分析——比例检验(Proportion Test) • 共享IBD=2的同胞对数目与期望的进行比较。
三、受累同胞对(ASP)数据分析 • 在利用上面三种检验统计量时,需要知道在标记位点同源等位基因的IBD值。而在实际问题中,往往不能由已有的信息得到同胞对的确切IBD值,所以需要用估计值来代替。
三、受累同胞对(ASP)数据分析 • 如果受累同胞对其中的一个或者是他们的父母在特定位点的基因型缺失,可以估计此人在该位点可能基因型的概率值,根据概率值计算IBD。 P(i alleles IBD) :家系中所有可能的基因型共享i个IBD的概率和。
三、受累同胞对(ASP)数据分析 • Siblings share 0,1, or 2 alleles IBD at a marker locus with probabilities p0=0.25, p1=0.5, and p2=0.25, respectively under the null hypothesis of no linkage, but what is the corresponding IBD-distribution for father and son ? • p0 = 0, p1 = 1, and p 2= 0; • p0 = 0, p1 = 0.5, and p 2= 0.5; • p0 = 0.25, p1 = 0.5, and p 2= 0.25; • p0 = 0.5, p1 = 0.5, and p 2= 0;
三、受累同胞对(ASP)数据分析 • 优点: 1.不依赖于遗传模式; 2.计算相对简单; 3.同胞对数据相对容易得到; • 缺点: 1.效能较低; 2.未对重组率进行估计;
Parametric • Assume genetic model known • Non-parametric • No assumptions about the genetic model • The parametric model is more powerful when the genetic model is correctly specified. • Problem size limitations • Parametric – large pedigrees, small number of markers • Non-parametric – small pedigrees, many markers
一、outline • IBD/IBS介绍 • 受累同胞对分析(Affected Sib-pair) • 受累亲属对分析(Affected relative-pair)
四、患病亲属对(ARP)数据分析 • 如果某种疾病被某一位点所控制,因为亲属对比非亲属对更倾向于具有相同的基因,那么在给定亲属对一个成员患病的条件下,另一个成员也患病的条件概率要比群体的流行率高。 • 单个位点模式
四、患病亲属对数据分析 • 假设随机从群体中抽取一个个体,1表示患病状态,0表示正常。 • 在哈代-温伯格平衡成立的假设下,群体的流行率为