80 likes | 312 Views
2007 겨울 통계강좌 중급과정. 제 4 강 : GLM(General Linear Model) ▫ 다변량 일반선형 모형. ▣ 변량분석의 종류와 차이점에 따른 알기 쉬운 구분법. ▣ 다변량 일반선형모형. 변인의 수와 측정방법 다변량 일반선형모델의 경우는 명목 ( 명명 ) 척도로 측정된 두 개 이상의 독립변인이 등간 혹은 비율척도로 측정된 여러 개의 종속변인에 대해 다수의 요인변수 또는 공변량이 측정된 자료에 대해 모델링 분석을 하는 것이다 .
E N D
2007 겨울 통계강좌 중급과정 제4강 : GLM(General Linear Model) ▫ 다변량 일반선형 모형
▣변량분석의 종류와 차이점에 따른 알기 쉬운 구분법
▣다변량 일반선형모형 • 변인의 수와 측정방법 • 다변량 일반선형모델의 경우는 명목(명명)척도로 측정된 두 개 이상의 독립변인이 등간 혹은 비율척도로 측정된 여러 개의 종속변인에 대해 다수의 요인변수 또는 공변량이 측정된 자료에 대해 모델링 분석을 하는 것이다. • 요인의 차이가 다수의 반응(종속)변수 각 각에 대하여 어떠한 영향을 주는지? • 요인들간의 상호작용이 존재하는지? • 요인조합간에는 어떠한 차이가 있는지를 알고자 할 때 활용한다. [GLM : 다변량 일반선형모형의 성립요건] ▶ 독립변인 ① 수: 두 개 이상 ② 측정 : 명명척도(다른 척도 명목척도로 리코딩) ③ 독립변인은 요인(factor)이라 칭함 ▶ 종속변인 ① 수: 두 개 이상 ② 측정: 등간 또는 비율척도(연속변수임)
▣다변량 일반선형모형 분석의 절차 및 실제사례 • 1) 독립변인과 종속변인의 기술통계 값을 교차비교분석표를 통해 살핀다. 각 집단의 사례 수와 평균값, 표준편차 값을 분석한다. • 2) 설명변량을 살펴보고 변량분석표를 통해 독립변인 전체의 유의도, 주 효과와 상호작용효과를 분석하여 유의도를 검증하고 에타(eta)계수 분석을 통해 개별 변인의 영향력을 분석. • 3) 집단간 차이를 사후검정한다. 실제사례 : 플라스틱 개발에 대한 실험연구 ▣ 연구주제 : 공정조건에 따라 플라스틱의 특성이 어떤 영향을 받는지? ▶ 변수설정 : 독립변수 -> 공정조건 : ① extrusn(=extrusion rate, 사출률) - 2수준[명목] ②additive(additive amount, 첨가제 량) - 2수준[명목] 종속변수 -> 반응특성 : ① tear_res(tear resistance, 찢어짐에 견디는 정도) - 연속형 ② gloss(반질거리는 정도)- 연속형 ③ opacity(불투명도)-연속형 공정조건에 따른 결합별 반복횟수는 5회로 2(extrusn)*2(additive) *5회(반복) = 20
Instruction step 1 : Analyze -> General Linear Model -> Multivariate -> 다변량 대화상자 Instruction step 2 : 변수투입 : 독립변인 -> Fixed Factor(모수요인) : extrusn , additive 종속변수 -> Dependent Variable : tear_res, gloss, opacity * 다변량 대화상자에서는 Random Factor를 선택할 수 없음 ** Covariate(공변량)은 연구에서 사전에 설정할 수 있는 변수로, 연구주제에 따른 공통적인 속성으로 독립이나 종속에 영향을 미칠 수 있는 변인이다. 예를 들면 서울시 중고생 학업수준에 대한 연구를 진행하면서 거주지역에 대한 공변량을 설정치 않을 경우 심각한 오류를 가져올 수 있다. Instruction step 3 : 모형설정 : Custom 선택 -> 독립변수 투입 주 효과와 상호작용 효과 설정 -> 실행
Instruction step 4 : Contrast : Change Contrast 선택 -> 옵션 선택 • 옵션 : • deviation(편차) : 각 수준과 전체 평균간의 차이를 대비로 정의한다 • simple(단순) : 지정된 수준(처음/마지막)과 각 수준의 차이를 대비로 정의. • difference(차분) : 각 수준과 이전 수준들간의 평균간 차이를 대비로 정의. • ,Helmert : 각 수준과 이후 수준들의 편균간 차이를 대비로 정의. • Repeated(반복) : 모든 연이은 2개 수준간 차이를 대비로 정의. • Polynomial(다항) : 서로 직교하는 1차항, 2차항, 3차항 등의 대비를 설정. Instruction step 5 : • Plot(Profile Plots) -> • horizontal Axis(수평축 변수), • Separate Lines(선구분 변수) –도표에 제2의 요인을 넣기 위해 • 사용되는 다수의 선을 구별 • Separate Plots(도표구분 변수) : 다수의 도표를 구분 • horizontal Axis(수평축 변수) extrusn 투입, • Separate Lines(선구분 변수)에 additive 투입
Instruction step 6 : 사후검정(Post Hoc Multiple Comparison) : 1) Factor(요인) -> Post Hoc test for (사후검정 변수 지정) extrusn, additive 지정 2) 등분산을 가정할 때 -> Turkey, scheffe 검증 지정 Instruction step 7 : 옵션(Option) : 선택 1) Discriptive statistic -> 기술통계량 체크 2) Estimates of Effect Size -> 에타(eta) 값 산출 체크 3) Observed Power -> 관측값의 정확도 측정 4) Parameter estimates -> 모수 추정값 체크 5) SSCP MATRIX -> sum of squares and cross products : 제곱합 및 교차곱 행렬 => 각 종속변수에 대한 잔차들의 공변성(covariation)을 보여줌 Instruction step 8 : 실행 다변량 결과물.spo 참조
앞선 2 way – anova 사례처럼 사후검증에 대한 결과가 산출이 안되기에[extrusn, additive가 3미만의 집단으로 구성되어 있기에 사후검증 비교가 실행되지 않음] 사후검증을 실시하기 위해 compute를 실시한 후 다시 한번 다변량 일반선형 모형 실행 • 학력과 종교에 따라 ‘심리적 이웃관계’와 ‘실질적 이웃관계’에 통계적으로 유의미한 차이가 있는지 검증하시오. • 성별과 학력에 따른 ‘심리적 이웃관계’ 와 ‘실질적 이웃관계’에 통계적으로 유의미한 차이가 있는지 검증하시오 • 성별과 종교에 따른 ‘심리적 이웃관계’ 와 ‘실질적 이웃관계’에 통계적으로 유의미한 차이가 있는지 검증하시오. 다변량 결과물.spo 참조 직접 실습 검증 과제 : 지역조사.sav 실습-학력-종교.spo 참조