180 likes | 359 Views
数量性状的 TDT 检验功效. 华南农业大学动物科学学院 张豪 博士. 方差分析的缺陷. 优点 简单 : 标准统计软件 灵活 : 可以分析各种已知的效应 缺点 假阳性,检验功效低 受群体分层的影响 解决办法 提高阈值 : Bonferroni t test 换用其它的分析方法 : TDT. 原理 Xu(1995). 混杂的概念. HLA 座位的 A1 等位基因与用筷子吃饭能力 用筷子吃饭 : A1 等位基因频率 95%, 中国人 不用筷子吃饭 : A1 等位基因频率 5%, 白人 人种为混杂因素 家畜 非随机交配 , 引种等.
E N D
数量性状的TDT检验功效 华南农业大学动物科学学院 张豪 博士
方差分析的缺陷 • 优点 • 简单: 标准统计软件 • 灵活: 可以分析各种已知的效应 • 缺点 • 假阳性,检验功效低 • 受群体分层的影响 • 解决办法 • 提高阈值: Bonferroni t test • 换用其它的分析方法: TDT 2009信息学会
原理 Xu(1995) 2009信息学会
混杂的概念 • HLA座位的A1等位基因与用筷子吃饭能力 • 用筷子吃饭: A1等位基因频率95%, 中国人 • 不用筷子吃饭: A1等位基因频率5%, 白人 • 人种为混杂因素 • 家畜 • 非随机交配, 引种等 2009信息学会
TDT • TDT • Transmission disequilibrium test • 当存在连锁时, 检验是否存在关联 • 不受群体分层等的影响 • 风险因素(risk factor) • 影响疾病的座位 2009信息学会
TDT • 原理 • 比较传递了某个等位基因的个体和没有传递某个等位基因的个体 • 可用于只有两个等位基因的座位和多个等位基因的座位 2009信息学会
病例-对照设计 李照海, 覃红, 张红, 2006 • “+”表示风险因素存在, “-”表示风险因素不存在. • a 和 d 不提供任何信息. • 已知 b + c的总数, 如果病症和风险因素无关, b和 c有相同的概率0.5, b|b+c服从二项分布B(b+c, ½) 2009信息学会
病例-对照设计 此时有 根据中心极限定理 服从标准正态分布 于是 服从2(1) McNemar Test 2009信息学会
数量性状: 统计数 Kolbehdari et al. 2006 Z服从自由度等于njk – 1的 t分布 Yjk= 第 jth个家系第 k个后裔的性状值 Ybar = 所有家系性状的均值 TDSjk =第 jth个家系第 k个后裔从父亲继承的某个等位基因的指示变量 TDDjk =第 jth个家系第 k个后裔从母亲继承的某个等位基因的指示变量 2009信息学会
评价 • 实际上是传递了某个等位基因的个体与总体平均数的比较 • 统计数绝对值下降, 降低检验功效 2009信息学会
TDT的变体 Xiong et al. 1998 2009信息学会
符号意义及评价 • YMK = M 等位基因后裔的表型值 • Ymk = m 等位基因后裔的表型值 • nM = 传递给后裔 M 等位基因的杂合亲本数量 • nm = 传递给后裔 m 等位基因的杂合亲本数量 • k = 第 k 个亲本 • j = 第 k 个亲本第 j 个后裔 • 实际上为独立样本的 t检验 • 检验功效比较高, 因为统计数增大 2009信息学会
TDT: 回归法: 检验回归系数 Hernandez-Sanchea et al. 2003 2009信息学会
原理 • 把自变量分为5类:-1,-1/2,0,1/2,1 TD = Hf(Tf – ½) + Hm(Tm – ½) • 如果亲本为“12”,则Hf(m)=1,否则等于0 • 如果后裔从基因型为“12”的亲本遗传了等位基因“1”,则Tf(m) = 1,否则为0 • 统计数:回归系数 2009信息学会
群体分层的影响 Hernandez-Sanchea et al. 2003 D: 连锁不平衡 S: 分层 C: 重组率 2009信息学会
纵轴: P值, 横轴: 等位基因频率 Solid line = sires are heterozygous, and dams are randomly selected; broken line = both sires and dams are randomly selected 10 sires are typed; the ratio of dam to sire and the number of full sibs are 10 and 7 respectively 2009信息学会
样本含量和检验功效 ♦=both parents are heterozygous; =sires are heterozygous, and the frequency of trait-increasing allele equals 0.5; ○= sires are heterozygous, and the frequency of trait-increasing allele equals 0.1; ∆=both parents are randomly selected, and the frequency of trait-increasing allele equals 0.5; ✳ = both parents are randomly selected, and the frequency of trait-increasing allele equals 0.1. In all the 5 cases, there are 10 sires and 100 dams. 2009信息学会
样本含量固定 Case 1: 10 sires are typed, the ratio of dam to sire is 10, and the number of full sibs is 10. Case 2: 10 sires are typed, the ratio of dam to sire is 20, and the number of full sibs is 5. Case 3: 20 sires are typed, the ratio of dam to sire is 10, and the number of full sibs is 5 2009信息学会