500 likes | 600 Views
第 17 章. 一般線性模式. 前言. Y i = b 0 + b 1 X i 1 + b 2 X i 2 + … + b p X ip + e i e i ~ N (0, s 2 ) 。這稱為一般線性模式。 效標變項 Y 一定只有一個,而且是量的變項。 預測變項可以有好幾個。如果預測變項只有一個,而且是一次方(直線)的話,稱為簡單線性迴歸,如果預測變項只有一個,但迴歸方程式是多次方,就稱為多項式迴歸,或稱一元多次迴歸方程式。. 前言. 如果預測變項有好多個,而且每一個都是量的變項,稱為複迴歸,
E N D
第17章 一般線性模式
前言 • Yi= b0 + b1Xi1 + b2Xi2 + … +bpXip + ei • ei ~ N(0, s2)。這稱為一般線性模式。 • 效標變項Y一定只有一個,而且是量的變項。 • 預測變項可以有好幾個。如果預測變項只有一個,而且是一次方(直線)的話,稱為簡單線性迴歸,如果預測變項只有一個,但迴歸方程式是多次方,就稱為多項式迴歸,或稱一元多次迴歸方程式。
前言 • 如果預測變項有好多個,而且每一個都是量的變項,稱為複迴歸, • 如果預測變項都是質的變項,稱為變異數分析。如果預測變項中有些是質的變項,有些是量的變項,稱為共變數分析(analysis of covariance, ANCOVA)。
第一節 單因子變異數分析(1) • 單因子變異數分析的結構模式:Yij= m + aj + eij • 若實驗處理有三種水準,a1,a2,和a3,三者總和為0,因此a3 = -a1 - a2。 • 對於接受行為改變法的受試者而言: • Yi1= m + a1+ ei1 • 對於接受認知改變法的受試者而言: • Yi2= m + a2+ ei2 • 對於接受安慰丸法的受試者而言: • Yi3= m - a2 - a2 + ei3
第一節 單因子變異數分析(2) • 產生虛擬變項(dummy variable) ,X1 和X2以表示受試者的組別。
第一節 單因子變異數分析(3) • 一般線性模式 :Yi= b0 + b1Xi1 + b2Xi2 + ei • 對於接受行為改變法的受試者而言, • Yi= b0 + b1 + ei • 對於接受認知改變法的受試者而言, • Yi= b0 + b2 + ei • 對於接受安慰丸法的受試者而言, • Yi= b0 - b1 - b2 + ei • 由於m = b0,a1= b1,a2= b2,單因子變異數分析是一般線性模式的特例。
第一節 單因子變異數分析(4) • 例子1 • 以一般線性模式進行單因子變異數分析。
第一節 單因子變異數分析(5) • 一般線性模式為Yi= b0 + b1Xi1 + b2Xi2 + ei,用X1和X2聯合預測Y。
第一節 單因子變異數分析(6) • b0、b1、b2的參數估計值分別為50、-10、-20。迴歸方程式為: = 50 -10Xi1 - 20Xi2。
第二節 多因子變異數分析(1) • 二因子變異數分析的結構模式 • Yijk= m + aj+ gk + agjk +eijk • 以第十四章的心理治療為例,共有兩個因子:治療時間和治療方法。令j表示時間,令k表示治療方法。由於
第二節 多因子變異數分析(2) • 因此a2 = -a1;g3 = -g1 - g2;ag 13= -ag11 - ag12,ag21= -ag11,ag 22 =- ag12,ag 23 = ag11 + ag12。 • 對於白天/行為改變法的受試者而言: • Yi11= m + a1+ g1 + ag11 +ei11 • 對於白天/認知改變法的受試者而言: • Yi12= m + a1+ g2 + ag12 +ei12 • 對於白天/安慰丸法的受試者而言: • Yi13= m+a1-g1-g2-ag11-ag12+ei13(以此類推)
第二節 多因子變異數分析(3) • 時間需要一個虛擬變項:X1。 對白天的受試者而言,X1 = 1;對晚上的受試者而言,X1 = -1。 • 治療方法需要兩個虛擬變項X2和X3。X2和X3的設定方式如同表1。 • 令X4 = X1X2,X5 = X1X3。時間和治療方法的交互作用。 • 用X1到X5聯合預測Y,即 • Yi= b0 + b1Xi1 + b2Xi2 + b3Xi3 + b4Xi4 + b5Xi5 +ei
第二節 多因子變異數分析(4) • 對於白天/行為改變法的受試者而言: • Yi= b0 + b1 + b2 + b4 +ei • 對於白天/認知改變法的受試者而言: • Yi= b0 + b1 + b3 + b5 +ei • 對於白天/安慰丸法的受試者而言: • Yi= b0 + b1 - b2 - b3 - b4 - b5 +ei (以此類推) • 可以發現m = b0,a1= b1,g1= b2,g2= b3,ag11 = b4,ag12 = b5。二因子變異數分析是一般線性模式的特例。
第二節 多因子變異數分析(5) • 如果是三因子(含)以上變異數分析,也可產生虛擬變項,用一般線性模式進行變異數分析。 • 透過虛擬變項對於效標變項的複迴歸,可以再製二因子變異數分析摘要表。再製的方法必須視細格樣本數是否相同而定。
第二節 多因子變異數分析(6) • 細格樣本數相同 • 1. 用X1進行預測,產生SST,SSreg,SSe。此處的SSreg稱做SSA。 • 2. 用X2和X3進行預測,產生SSreg,稱做SSB。 • 3. 用X4和X5進行預測,產生SSreg,稱做SSAB, • 共得到SST,SSA,SSB,SSAB,然後SSe = SST - SSA - SSB -SSAB,配合自由度,算出均方,進行二因子變異數分析,製作摘要表。 • 若用X1到X5進行預測,產生SSreg,稱做SSA,B,AB,恰等於SSA + SSB +SSAB。
第二節 多因子變異數分析(7) • 細格樣本數不相等 • 法並不恰當,因為此時A因子的主要效果、B因子的主要效果、AB因子的主要效果會有所重疊,因此總平方和無法分割為SSA,SSB,SSAB,和SSe四個部份。 • 圖1(a) 細格樣本數相同的話,SSA,SSB,SSAB各自獨立,因此SST = SSA + SSB + SSAB + SSe。 • 如果細格樣本數不相等,A因子主要效果、B因子主要效果、AB因子交互作用就如圖1(b)所示,互有重疊。此時如何界定SSA,SSB,SSAB?
第二節 多因子變異數分析(8) • 最保守且常用的界定方式就是:圖1(b)中的1為SSA, 5為SSB, 7為SSAB。2、3、4、6捨棄。 • 1. 用X1到X5預測,產生SST,SSreg,SSe。SSreg稱做SSA,B,AB, • 2. 用X1,X2,X3預測,SSreg稱做SSA,B。 • 3. 用X2,X3,X4,X5預測,SSreg稱做SSB,AB • 4. 用X1,X4,X5預測,SSreg稱做SSA,AB
第二節 多因子變異數分析(9) • SSA = SSA,B,AB - SSB,AB (17.27) • SSB = SSA,B,AB – SSA,AB (17.28) • SS AB = SSA,B,AB – SSA,B (17.29) • 其實如果細格樣本數相等,利用公式(17.27)到(17.29)的作法,所得結果和上述細格樣本數相等時的作法一樣。
第二節 多因子變異數分析(10) • 例子2 • 以一般線性模式進行分析,並製作二因子變異數分析摘要表。
第二節 多因子變異數分析(11) • 作法 • 1.如表5產生5個虛擬變項。 • 2.用X1預測,得SSreg SSA = 607.5。SSA的自由度為1。 • 3.用X2和X3預測,得SSreg SSB = 7655。SSB的自由度為2。 • 4. 用X4和X5預測,得SSreg SSAB = 1755。SSAB的自由度為2。
第二節 多因子變異數分析(12) • 5. 用X1到X5預測,得SST = 14531.5,SSreg SSA,B,AB = 10017.5,SSe = 4514。 • 6. 製作二因子變異數分析摘要表如表7。
第二節 多因子變異數分析(13) • 例子3 • 將白天/行為改變法的前兩個數值35和25刪去,使得該細格的樣本數變為3。進行二因子變異數分析。
第二節 多因子變異數分析(13) • 作法 • 1. 由於細格樣不數並不相等,只能用一般線性模式進行分析。如表5產生5個虛擬變項。 • 2. 利用X1到X5預測,得SST = 13195.25,SSreg SSA,B,AB = 9064.58,SSe= 4130.67。 • 3. 用X1,X2,X3預測,得SSregSSA,B = 7109.89。 • 4. 用X1,X4,X5預測,得SSregSSA,AB = 2518.98。
第二節 多因子變異數分析(14) • 5. 用X2,X3,X4,X5預測,得SSregSSB,AB = 8754.5。 • 6. • SSB = SSA,B,AB – SSA,AB = 9064.58 - 2518.98 = 6545.6 • SSA = SSA,B,AB – SSB,AB = 9064.58 – 8754.5 = 310.08 • SS AB = SSA,B,AB – SSA,B = 9064.58 – 7109.89 = 1954.69 • SSB + SSA + SSAB + SSe = 310.08 + 6545.60 +1954.69 + 4130.67 = 12941.04 < SST = 13195.25。所流失的SS就是圖1(b)中的2, 3, 4, 6這四個部份。
第二節 多因子變異數分析(15) • X2和X3代表治療方法,因此如果要使用X2當作預測變項,必然要同時使用X3。 • X4和X5代表治療方法和時間的交互作用,因此要使用X4當作預測變項,必然要同時使用X5。 • 不可以將代表同一個效果的數個虛擬變項拆開,它們必須同時當作預測變項,或者不當預測變項,也就是「同進退」。
第三節 共變數分析(1) • 「隨機分派」(random assignment)是實驗設計的基石。沒有它,就難進行因果關係的推論。 • 在非實驗設計中,幾乎無法避免干擾變項。若研究者很擔心干擾變項會影響實驗的結果,就應該共變數分析。 • 透過對於干擾變項的控制,共變數分析能夠清楚說明實驗處理效果。就是說:如果各組受試者在這些干擾變項上的數值一樣的話,他們的組平均數會變為多少?是否有顯著差異?
第三節 共變數分析(2) • 共變數分析還有一個好處:容易彰顯實驗處理的效果。具體而言,就是將MSe變小,而它是F檢定的分母,因此F值就會變大,實驗效果就比較容易達到顯著水準。 • 前提是選擇了有效的共變數,如果選擇了一個無效的共變數,反而使得MSe變大,而實驗效果不易達到顯著水準。
第三節 共變數分析(3) • 以心理治療為例,原先症狀強度當作共變數U。將實驗處理改為虛擬變項,則一般線性模式為: • Yi= b0 + b1Xi1 + b2Xi2 + b3Ui + ei (17.30) • 利用複迴歸進行參數估計和計算SST,SSreg,SSe此處SSreg稱為SSA,U。SSA,U的自由度是3。 • 還要建立兩個模式: • 1. 不含共變數U的一般線性模式 • 2. 只含共變數U的一般線性模式
第三節 共變數分析(4) • 不含共變數U的一般線性模式 • Yi= b0 + b1Xi1 + b2Xi2 + ei,此處SSreg稱為SSA。 • 只含共變數U的一般線性模式 • Yi= b0 + b3Ui + ei,此處SSreg稱為SSU。 • SSU(adjusted) = SSA,U - SSA • SSA(adjusted) = SSA,U – SSU • SSU(adjusted)的自由度是1,SSA(adjusted)的自由度是J-1。
第三節 共變數分析(5) • 如果計算的F = MSU(adj)/MSe高過臨界值,就拒絕共變數無效的虛無假設,而宣稱將該共變數納入分析是有用的。如果計算的F =MSA(adj)/MSe高過臨界值,就拒絕實驗處理無效的虛無假設。
第三節 共變數分析(6) • 假設公式(17.30)的估計值為 • = b0 + b1Xi1 + b2Xi2 + b3Ui • 則對於接受行為改變法的受試者而言, • = b0 + b1 + b3Ui • 對於接受認知改變法的受試者而言, • = b0 + b2 + b3Ui • 對於接受安慰丸法的受試者而言, • = b0 – b1 – b2 + b3Ui
第三節 共變數分析(7) • 行為改變和認知改變的平均數差異為b1 – b2。 • 行為改變和安慰丸的平均數差異為2b1+b2。 • 認知改變和安慰丸的平均數差異為b1 + 2b2。
第三節 共變數分析(8) • 例子3 • 調查受試者憂鬱症狀強度,進行共變數分析。
第三節 共變數分析(9) • 產生新的虛擬變項,如表1所示。 • 利用公式(17.30)得SST = 9960,SSA,U = 9201.8,SSe = 758.2,R2 = 0.924,以及 • = -9.37 – 5.55Xi1 – 10.06Xi2 + 0.78Ui • 利用公式(17.31)得SSA = 7000。 • 利用公式(17.32)得SSU = 8119.08。 • 利用公式(17.33)和(17.34)得 • SSU(adjusted) = SSA,U - SSA = 9201.8 – 7000 = 2201.8 • SSA(adjusted) = SSA,U – SSU = 9201.8 –8119.08 = 1082.72
第三節 共變數分析(10) • MSe= 68.93,遠小於例子1中的246.67,因此F檢定比較容易顯著。 • 共變數U的檢定F值為31.94,可以拒絕虛無假設,宣稱這個共變數是有效的。實驗處理的F值為7.85,可以拒絕虛無假設。
第三節 共變數分析(11) • = -9.37 – 5.55Xi1 – 10.06Xi2 + 0.78Ui • 控制住共變數後,行為改變法的平均數減認知改變法的平均數,為b1 – b2 = -5.55 + 10.06 = 4.50。 • 行為改變法的平均數減安慰丸法的平均數,為2b1+b2 = 2 (-5.55) – 10.06 = -21.17。 • 認知改變法的平均數減安慰丸法的平均數,為b1 + 2b2 = -5.55 + 2 (-10.06) = -25.68。
第三節 共變數分析(12) • 如果認知改變法的平均數為0,行為改變法就是4.5,安慰丸法就是25.68。 • 原先的平均數是認知改變、行為改變、安慰丸分別為30、40、80。三者之間的差異非常大。 • 一旦控制住共變數之後,兩者之間的差距變為只有25.68。認知改變和行為改變的效果並沒原先想像中的那麼大。
第三節 共變數分析(13) • 迴歸線斜率同質性 • 不管共變數U的數值是多少,這三種治療方法的平均數差異都是固定不變。 • 公式(17.39)或其線性模式公式(17.30)成立的前提就是圖2(a),(b),(c)中的迴歸線的斜率必須相同,即迴歸線斜率同質性(homogeneity of regression slopes)。
第三節 共變數分析(14) • 迴歸線斜率同質性的檢定 • 令X3 = UX1,X4 = UX2。X3和X4反映出實驗處理和共變數的交互作用。然後據以建立一般線性模式為 • Yi= b0 + b1Xi1 + b2Xi2 + b3Ui + b4Xi3 + b5Xi4 +ei • 得SST,SSe,和SSreg。SSreg稱為SSA,U,AU。 • 原先共變數分析中的SSreg稱SSreg為SSA,U。 • SSAU = SSA,U,AU - SSA,U
第三節 共變數分析(15) • 如果計算的F = MSAU/MSe高過臨界值,就拒絕迴歸線斜率同質的虛無假設。
第三節 共變數分析(16) • 上述作法和以下公式是相通的: • 如果計算的F值超過自由度為f–r,n–f–1的F分佈臨界值,代表擴大模式比縮減模式來得吻合資料,也就是說迴歸線斜率並不同質。
第三節 共變數分析(17) • 例子4 • 承例子3,檢定迴歸線斜率是否同質。 • 作法 • 令X3 = UX1,X4 = U X2。 • 用X1至X4和U預測Y,得SST = 9960,SSA,U,AU = 9404.50,SSe = 555.50, = 0.9442。 • 在例子3中得SST = 9960,SSA,U = 9201.8, = 0.9239。
第三節 共變數分析(18) • SSAU = 9404.50 – 9201.8 = 202.70。
第三節 共變數分析(19) • 如果斜率不相同,到底有何壞處?如果行為改變法和認知改變法的效果如圖4所示,斜率並不相同,就無法論定行為改變法和認知改變法的效果熟佳。 • 治療方法和原先症狀強度起了交互作用,意味著對於不同症狀強度的人而言,相同的治療方法所代表的意義並不全然相同。這可能反映出治療方法已經變質!