1.06k likes | 5.17k Views
Longitudinal Data Analysis 縱貫式資料分析 GEE 之原理•應用與 SAS 程式操作. 台中榮總教學研究部 生統小組 主講人: 研究助理 邱顯財 時間: 94年12月6日(二). 授課大綱. I. 縱貫式資料 ☆★ 從 研 究設計之觀點出發 I I. 處理縱貫式資料的統計方法 ☆★ GEE 之 原理 III . GEE 之 SAS 程式操作 ☆★ 資 料結構•語法•報表解讀 IV. 結論與重點回顧 ☆★ Q & A 時間終於到了. I. 縱貫式資料. 研究設計 : 綜觀與概說 現代流行病學的發展
E N D
Longitudinal Data Analysis縱貫式資料分析GEE之原理•應用與SAS程式操作 台中榮總教學研究部 生統小組 主講人: 研究助理 邱顯財 時間: 94年12月6日(二)
授課大綱 I.縱貫式資料☆★ 從研究設計之觀點出發 II.處理縱貫式資料的統計方法☆★ GEE之原理 III.GEE之SAS 程式操作☆★ 資料結構•語法•報表解讀 IV. 結論與重點回顧☆★ Q & A 時間終於到了
I.縱貫式資料 研究設計 : 綜觀與概說 • 現代流行病學的發展 Rothman KJ and Greenland S.(1998) Modern Epidemiology 2nd.. • 世代研究 (Cohort Study) ex.Framingham Heart Study(Dawber, 1980) • 病例對照研究 (Case-control Study) ex.Cigarette smoking and lung cancer (Doll and Hill, 1950) • 因果推論 (Causal Inference) ex.Exposure vs. Disease
Longitudinal Repeated measurements through time Cross-sectional Single outcome measured individually 研究設計 : 縱貫式 vs.橫斷式 t1 t2 t3 time time at one single time point • perspective ( ex. Cohort study ) • ex. Survey • retrospective ( ex. Case-Control study )
Longitudinal Data correlated Time variable Identification variable Independent Hsiao CY, Wu HDI, Lai JS, Kuo HW. A longitudinal study of the effects of long-term exposure to lead among lead battery factory workers in Taiwan (1989-1999). The Science of the Total Environment 2001. 279:151-158.
II.處理縱貫式資料的統計方法 • Approach dealing with repeated-measures • Generalized Linear Model (GLM) • Generalized Estimating Equations (GEE)
How to deal with “ repeated-measures” • Longitudinal data require special methods because the set of observations on one subject trends to be“inter-correlated” Diggle, Liang and Zeger (1994), Analysis of Longitudinal Data, Clarendon Press • OXFORD
Generalized Linear Model • Formulae G { E(Y)} =β0+β1X1+β2X2+…+βkXk
Generalized Estimating Equations • A model-based approach • Generalized Estimating Equations (GEE) are methods of parameter estimation for correlated data • Based on GLM framework • Working Correlation Structure Auto Regression (1) M-dependence Exchangeable
III.GEE之SAS 程式操作 • DATA SOURCE • STUDY DESIGN & OBJECTIVE • SAS SYNTAX FOR GEE APPROACH • OUTPUT INTERPRETATION • TABLE & FIGURE MANUFACTURING
DATA SOURCE • 邱顯財 : 孕婦吸菸與暴露二手菸對其胎兒出生結果的影響。中國醫藥大學環醫所碩士論文,2005。 • 吳芳鴦:吸菸或二手菸影響懷孕期、生產期女性之健康研究。中國醫藥大學環醫所研究報告,2004。(行政院衛生署國民健康局補助計畫:BHP-92-Anti-Tobacco-F204) • Study subject recruitment Pregnant women seeking for prenatal care (n=685) • Data Collection Questionnaire Urine and serum sample • One of the Main Outcomes Maternal cotinine level (ng/mL)
STUDY DESIGN & OBJECTIVE • Design 懷孕世代研究 • Objective (一)探討問卷評估而得的菸害暴露程度 和尿液、血液可丁寧濃度的關聯性 (二)瞭解孕婦尿液、血液可丁寧濃度在懷孕過程中的變化趨勢 (三)探討孕婦菸害暴露狀態與可丁寧濃度的危險因子 (四)評估孕婦不同孕期的可丁寧濃度以及暴露狀態對胎兒出生結果的影響
SAS SYNTAX FOR GEE APPROACH [1] • Check for data frame first!
SAS SYNTAX FOR GEE APPROACH [2] • SAS procedure: PROC GENMOD PROC GENMOD < options > ; CLASS variables ; MODEL response = < effects > < /options > ; REPEATEDSUBJECT= subject-effect < / options > ; RUN;
SAS SYNTAX FOR GEE APPROACH [3] • Data exploration: Before GEE Analysis i. univariate analysis ii. correlation plots iii. t-test or ANOVA iv. trend analysis ( ex. box plots across time)
SAS SYNTAX FOR GEE APPROACH [4] • Let’s use SAS step by step! I.Data Management Step PROC IMPORT II.Data Exploration Step PROC UNIVARIATE PROC CORR III.Model Building Step PROC GENMOD
SAS SYNTAX FOR GEE APPROACH [5] I.Data Management Step [a]. Import Data to SAS Library WORK
SAS SYNTAX FOR GEE APPROACH [6] I.Data Management Step [b]. Check Data in the WORK Library
SAS SYNTAX FOR GEE APPROACH [7] I.Data Management Step [c]. Rearrange or Manipulate Data
SAS SYNTAX FOR GEE APPROACH [8] II.Data Exploration Step [a]. Univariate Analysis
SAS SYNTAX FOR GEE APPROACH [9] II.Data Exploration Step [b]. Correlation Analysis
*Spearman 等級相關係數 0.375* 0.411 0.601 0.492 0.709 0.801 0.829 0.362 0.371 0.451 0.890
可丁寧濃度隨著懷孕週數變化 : GEE分析 Working correlation structure : AR(1) (auto-regression with first order correlation)
SAS SYNTAX FOR GEE APPROACH [10] III.Model Building Step [a]. Continuous covariate
SAS SYNTAX FOR GEE APPROACH [11] III.Model Building Step [b]. Categorized covariate in Dummy variable
TABLE & FIGURE MANUFACTURING 吸菸 血液可丁寧濃度 (ng/ml) 二手菸 非吸菸
IV.結論與重點回顧 • 研究設計 -- 清楚了解‘縱貫式’與‘橫斷式’的差異 • 資料結構 -- 認識研究資料的特性與類型,並做適當整理 • 資料探索分析 -- 在套用統計模式之前, 需先做探索性分析以免錯失重要訊息 • 如何有效呈現統計分析結果 -- 參考相關文獻, 圖示的效果比表列更好 • 驗證研究假說 -- 就各個層面來探究結果是否合理, 有統計顯著意義不一定具生物醫學意義
教學研究部 生統小組之簡介 • 組織架構與成員簡介 何惠卿4019 hcho@vghtc.gov.tw 劉聖文4047wen626@vghtc.gov.tw 邱顯財4081 cht310@vghtc.gov.tw 生統小組網頁 http://www3.vghtc.gov.tw/der/der/statistic/bio_page0.htm • 提供業務之說明 統計諮詢 個案分析 院內計劃申請完全免費!!!
謝謝您 蒞臨參加!! 敬請指教!!