130 likes | 363 Views
医 学论文 写 作系列 讲座 I 数据统 计分析 思 路 第二部分: 回归分 析基础. 哈佛大学医学院: 陈常中 2012 年 11 月 Mark.chen@empowerstats.com Changzhong_chen@dfci.harvard.edu. 回归方程 与 t 检验 / 方差分析 / 卡方检验 等. 原来你也能做我的工作,不会抢我的饭碗吧?哈哈!. Y i = β 0 + β 1 * X i + e i. β 0. e i. X = 0. β 1. X = 1. e i. ? β 1 = 0. β 0 + β 1.
E N D
医学论文写作系列讲座I 数据统计分析思路 第二部分:回归分析基础 哈佛大学医学院: 陈常中 2012年11月 Mark.chen@empowerstats.com Changzhong_chen@dfci.harvard.edu
回归方程 与 t检验 / 方差分析 /卡方检验等 原来你也能做我的工作,不会抢我的饭碗吧?哈哈!
Yi=β0+β1*Xi+ei β0 ei X = 0 β1 X = 1 ei ?β1= 0 β0+β1
X=0,1 X=1, Y=β0+β1*X • X=0, • Y=β0 • Y=β0+β1
X=0,1,2 I:Y=β0+β1*X • X=0, Y=β0 X=2, Y=β0+β2 • X=1, Y=β0+β1 • X=2, Y=β0+β1*2 II:Y=β0+β1*(X=1) +β2*(X=2) • X=0, Y=β0 • X=1, Y=β0+β1
Y5 = β0 + β1*(X6=1) + β2*(X6=2) Y5 = β0 + β1*X6
广义线性回归方程 f(Y) = β0 + β1*X1+ β2*X2+ β3*X3+ β4*X4+ …… Y:收缩压值? f(y)=Y Y: 是否高血压?f(y)=logit(y)
三组(X=0、1、2)率的比较 • Y=0 Y=1合计 率(p) 比值 • X=0, n00n01N0 n01/N0n01/n00 • X=1, n10n11N1 n11/N1n11/n10 • X=2, n20n21N2 n21/N2n21/n20
率与比值 率: p = N(y=1) / N(total) 0 - 1 比值: odd = N(y=1) / N(y=0) 0 - ∞ odd = p / (1-p) logit(Y) = log(p / (1-p) ) 两组比值比: Odds ratio (OR) =(P1/(1-P1) ) / ( P0/(1-P0) )
三组(X=0、1、2)率的比较 log(P/(1-P)) = β0 + β1*(X=1) + β2*(X=2) • X=0, log(P0/(1-P0))=β0 • X=1, log(P1/(1-P1))=β0 + β1 • X=2, log(P2/(1-P2))=β0 + β2 • log( P1/(1-P1) ) - log( P0/(1-P0) ) =β1 log( ( P1/(1-P1) ) / ( P0/(1-P0) ) ) =β1 • OR(X=1 vs. x=0) = eβ1 • OR(X=2 vs. x=0) = eβ2
练习 读入 regdd.xls • 用单因素分析模块分析X6 与Y5 关系 • 将X6转换成连续性变量X6.CONT分析其余Y5 的关系 • 将Y5转换成2分类变量Y5.P80,取最高的20%为1,下面的80%为0。分析X6、X6.CONT 与Y5.P80的关系