340 likes | 437 Views
§6.4 群体遗传的数学模型. 一 . 问题与背景 1. 问题 生物的细微变异在进化中很重要,可以为物种进化提供原始材料。 但变异的个体在群体中数量很少。 它会不会在群体的随机交配的过程中逐渐减弱直至消失? 人类的遗传病(如色盲)在群体中会不会由于一代一代地遗传而使患者越来越多?. 农作物的新品种主要是用杂交的方法培育的。 即选择某种作物具有互补性状的两个品种杂交,在它们的后代中选择培育出合乎要求的新品种。 由于杂交后代性状分离的不稳定性,使得它不可能杂交后直接用于农业生产。 多少代以后就可以达到生产所需要的稳定性呢?.
E N D
一. 问题与背景 • 1. 问题 • 生物的细微变异在进化中很重要,可以为物种进化提供原始材料。 • 但变异的个体在群体中数量很少。 • 它会不会在群体的随机交配的过程中逐渐减弱直至消失? • 人类的遗传病(如色盲)在群体中会不会由于一代一代地遗传而使患者越来越多?
农作物的新品种主要是用杂交的方法培育的。 • 即选择某种作物具有互补性状的两个品种杂交,在它们的后代中选择培育出合乎要求的新品种。 • 由于杂交后代性状分离的不稳定性,使得它不可能杂交后直接用于农业生产。 • 多少代以后就可以达到生产所需要的稳定性呢?
2. 背景:孟德尔遗传学的要点 • 1. 生物体的性状是由一对(多对)基因控制的。 • 染色体是基因的载体。基因在染色体上的位置称为基因座,处于同一基因座的不同的基因为等位基因。 • 等位基因对性状的控制有显性和隐性之分。
2. 处于同一基因座上的两个基因的组合形式称为基因型。 • 生物体表现出来的特征为表现型。 • 一般表现型反映显性基因所控制的性状。 • 3. 遗传的过程是由亲代每基因座上的等位基因分离并随机进入到一个配子中去 • 在交配过程中雌雄配子将随机结合形成新的合子而传入下一代。
二. 假设 • 1. 雌性和雄性在遗传上是对等的。 • 2. 没有迁移、突变和选择。 • 3. 群体足够大。 • 4. 随机交配,控制有关性状的雌雄配子完全随机结合。
三. 模型 • 1. 群体的遗传结构:一个基因座,两个等位基因 A,a。三个基因型 AA,Aa,aa。 • 基因型频率:f1,f2,f3, (f1+f2+f3=1). • 基因频率: p= f1+f2/2, q=f3+f2/2. • 群体的遗传结构:F=(f1,f2,f3)T. • 基本群体: • F1=(1,0,0)T,F2=(0,1,0)T,F3=(0,0,1)T. • F = f1×F1+f2×F2+ f3×F3.
2. 遗传过程的基本平衡关系 • 由孟德尔遗传学的理论可知, 有 • AAAA=AA, AAaa=Aa, aaaa=aa, • AAAa =(1/2)AA+(1/2)Aa, • aaAa =(1/2)Aa +(1/2)aa, • AaAa =(1/4)AA+(1/2)Aa+(1/4)aa • 即, 有如下的平衡关系 • F1F1= F1,F1F3=F2,F3F3=F3, • F1F2= (1/2)F1+(1/2)F2, • F3F2= (1/2)F2+(1/2) F3, • F2F2 = (1/4)F1+(1/2) F2+(1/4) F3.
3. 群体遗传的模型: • F(n)=(f1(n), f2(n), f3(n))T: 第 n 代群体的结构. • 10. 基本遗传过程: • F1与F(n)交配的后代 F(n+1)=F1F(n)=F1[f1(n)F1+f2(n)F2+f3(n)F3] • = f1(n)[F1F1]+f2(n)[F1F2]+f3(n)[F1F3] • =[F1F1 F1F2 F1F3]F(n) • = [F1(F1+F2)/2F2]F(n) = M1F(n)
F2与F(n)交配的后代 • F(n+1)=F2F(n)= M2F(n) • F3与F(n)交配的后代 • F(n+1)=F3F(n)= M3F(n)
20. 随机交配群体的遗传模型: 一个结构为F的群体与第n世代的群体G(n)随机交配的后代. • G(n+1)=FG(n)=(f1F1+f2F2+f3F3) G(n) • = f1[F1 G(n)]+f2[F2 G(n)]+f3[F3 G(n)] • = f1M1G(n)+f2M2G(n)+f3M3G(n) • = (f1M1+ f2M2 + f3M3 )G(n)= MrG(n)
30. 自交群体的遗传模型. 自交群体指每个个体自交所产生的后代群体. • F(n+1)=F(n)F(n) • =f1(n)FF1+ f2(n)F2F2+ f 3(n)F3F3 • =[F1 F1/4+F2/2+F3/4F3]F(n) • = MSF(n)
四. 模型的分析 • 1. Hardy–Weinberg 平衡(H–W平衡) • 在前述假设下, 一个随机交配的有性繁殖的群体中,等位基因频率保持不变,基因型频率至多经过一个世代也将保持不变。 • 一个基因座,两个等位基因。 • 群体 F=( f1, f2, f3 )T; • f1, f2, f3基因型 AA, Aa, aa 的频率; • p = f1+ f2/2, q = f3 + f2/2 基因 A, a 的频率.
群体自身的随机交配, 有模型: • F(n+1)= Mr(n)F(n) • 其中 • p(n) = f1(n)+ f2(n)/2, • q(n) = f3(n) + f2(n)/2.
1. 证明 p(n+1)=p(n) , q(n+1)=q(n) • 由模型可以得到 • f1(n+1) = p(n)f1(n)+p(n)f2(n)/2 • = p(n)[f1(n)+f2(n)/2]=p(n)2 • f3(n+1) = q(n)f3(n)+q(n)f2(n)/2 • =q(n)[f3(n)+f2(n)/2]=q(n)2 • f2(n+1) =q(n)f1(n)+[p(n)+q(n)]f2(n)/2+p(n)f3(n) • = q(n)[f1(n)+f2(n)/2]+p(n)[f3(n)+f2(n)/2] • =2p(n)q(n) • p(n+1)=f1(n+1)+f2(n+1)/2=p(n), • q(n+1)=f3(n+1)+f2(n+1)/2=q(n).
2. 证明基因型频率不变(至多经过一个世代) • 矩阵 Mr 的列和为 1, 因此它有全 1 的左特征向量 1 =(1, 1, 1)T,且有 1TMr = 1T. • 由此可知 • 矩阵有特征值λ=1,并且只有这一个正特征根 • 它所对应的右特征向量为F*>0, • (Perron–Frobenious 定理) • 由 MrF*=F*不难得到 F*=(p2 2pq q2)T就是模型的平衡态。 • 对于任意的初始状态F(0)=(f1(0),f2(0),f3(0))T,容易算出 F(1) = Mr F(0) = F*. • 因此, 至多经过一个世代, 群体的基因型频率将处于平衡状态不变。
例 1. M–N血型: • 血红细胞膜上的特异抗原类型,分别对抗体M和抗体N成阳性反应,这一性状分别由一对等位基因 LM 和 LN 控制,呈并显性。 • 调查1279人三种基因型频数的比例为 • LMLM : LMLN : LNLN = 363 : 634 : 282 • 由此可以算出群体的遗传结构为: • (f1 f2 f3) =( 0.284,0.496,0.220 ) • 群体中基因 LM 和 LN 的频率分别为 • p=0.532, q=0.468 • p2 = 0.283, 2pq = 0.498, q2 = 0.219 • 与群体的遗传结构基本相同。 • 群体为H–W群体。
例 2. 地中海贫血病, • 由一对等位基因Tm 、Tn控制。 • 调查意大利群体10000人三种基因型的频数为 • TmTm : TmTn : TnTn = 4 : 400 : 9596 • 基因 Tm 和Tn 的频率分别为 • p = 0.0204,q = 0.9796 • p2=0.00042,2pq=0.03997, q2 = 0.95961。 • 与群体的遗传结构基本相同。 • 群体为H–W群体
2. 杂交育种的稳定性 • 作物的品种:同型合子的基因型 • 育种的过程: • 双亲杂型合子 分离后代 优良组合 分离后代优良组合…
问题:杂交后要自交多少世代就可以形成品种?问题:杂交后要自交多少世代就可以形成品种? • F(n)=MSF(n-1)= … =MSn-1F(1)=MSnF2. • λ=1 u1=(1,0,-1)T • λ=1 u2=(0,0, 1)T • λ=0.5 u3=(1,-2,1)T. • 令 • 则有分解式MS=U-1ΛU, MSn = U-1ΛnU.
由此不难算出 • 可得 • F(n)= (0.5-0.5n+1, 0.5n, 0.5-0.5n+1)T. • F(6)= (0.4921875, 0.015625, 0.4921875)T. • 一般杂交后至少要经过六代的选择、自交才有可能作为一个稳定的品系参加品比试验。
五. 状态转移的马尔可夫链模型 • 1. 遗传模型的特征与马尔可夫链 • 10. 研究的对象具有几个可能的不同状态。 • 20. 各状态之间可能会发生随机转移的现象。 • 30. 状态转移时将来的状态只与现在的状态有关,而独立与过去的状态。 • 我们称描述这一类状态随机转移问题的模型为马尔可夫链模型。
2. 状态转移的流程图: • 用图示来描述状态及其相互转移的关系。 • F1F2 1/2 • 1/2 AA Aa aa F2 F2 1/41/4 1/2 AA Aa aa
F1 F 1/2 1 1 1/2 Aa aa AA AA Aa aa F2 F 1/4 1/2 1/2 ¼ 1/2 1/2 1/2 F3 F 1/2 1 1/2 1 AA Aa aa
随机交配群体 • p12=q p23=q/2 • p21=p/2 p32= p • p11=p p22=1/2 p33=q F1:AA F2:Aa F3:aa
其中,{fi} 表示参与转移的状态的频率,pij表示从状态 j向状态 i转移的概率。 • 如果用 F(n)=(f1(n), f2(n), f3(n))T 表示第 n 代群体的遗传结构, • 它实际上描述了一个个体在群体中处于各种状态的概率, • 我们称之为状态向量.
矩阵 M 则描述了状态随机转移的状况, • 称之为转移矩阵. • M 非负且列和等于1。 • 流程图所描述的状态转移的过程就可以用模型 F(n+1)= M F(n)来描述. • 由此得到的状态向量序列{F(n)}称之为马尔可夫链. 模型就称为马氏链模型.
4. 模型的分析 • 10. 正则链. 对于转移矩阵 M, 若存在正整数 k, 使得 Mk > 0 (pij > 0), 则称 M 是正则的, M所描述的链为正则链. 我们有: • (1) M 有唯一的不动点向量 π= (π1, …, πn)T,使得 M π= π. • (2) , 其中 1=(1,…, 1)T. • (3) . • 正则链的状态向量一定趋向于一个稳定的分布π, 并且这个分布与状态向量的初始取值无关.
20. 吸收链. 若状态转移矩阵有形式 • 其中 Ir为 r 阶单位阵, O为零阵, • R 的行和均为正 . • 则称由 M 给出的马氏链为吸收链 . • 矩阵 Ir所对应的状态 S1 称为吸收态, • 其余的状态 S2 为非吸收态.
(2)分析 • 10lim S(n)T=(S1T, 0T) • 20称 F=(I – Q)-1为吸收链的基本矩阵. • F= ( fij ), 其中 fij为从非吸收状态 si 在被吸收前转移到非吸收状态 sj的平均转移次数. • 30令 B = F RT = ( bij ), 则给出了从非吸收状态 fi出发, 被吸收状态 fj吸收的概率.
F = (I – Q)-1 = (1- ½)-1 = 2 • 从非吸收状态S3出发, 平均转移2 次, 就会被吸收状态S1, S2吸收. • B = F RT = 2 ×(1/4 1/4) • = (1/2 1/2) • 从非吸收状态S3出发, 被吸收状态S1, S2吸收的概率分别为 1/2.
问题: • 1. 乒乓球比赛,每胜一球得一分,先得三分者胜一局。建模描述一局乒乓球的比赛过程。 • 2. 在上面的乒乓球比赛中,如果双方打成 2 : 2 平局,则在后面的比赛中需要一方连续胜两球才能赢得此局。是给出模型描述一局乒乓球比赛的过程。