570 likes | 722 Views
迴歸分析. 大綱. 簡單線性迴歸 (1x1Y) 多元迴歸 ( 多 x1Y) 含類別變數的迴歸 ( 某些 x 為分類變數 ). 市場價格. 供給量. 簡單線性迴歸. 主要用於檢定單一的自變數對一個依變數是否具影響力或預測力. 假設的寫法可寫成: 供給量會顯著影響市場價格。 供給量對市場價格具有預測力。 供給量對市場價格具顯著的負向影響。 供給量越大相對市場價格越低。. 簡單線性迴歸模型必須滿足下面的假設 常態性假設 變異數齊一性假設 所有的 x 值所對應 y 的分配,其平均數均落母體迴歸線上。 不同 x 下的 y 彼此獨立。
E N D
大綱 • 簡單線性迴歸 (1x1Y) • 多元迴歸 (多x1Y) • 含類別變數的迴歸(某些x為分類變數)
市場價格 供給量 簡單線性迴歸 • 主要用於檢定單一的自變數對一個依變數是否具影響力或預測力 • 假設的寫法可寫成: • 供給量會顯著影響市場價格。 • 供給量對市場價格具有預測力。 • 供給量對市場價格具顯著的負向影響。 • 供給量越大相對市場價格越低。
簡單線性迴歸模型必須滿足下面的假設 • 常態性假設 • 變異數齊一性假設 • 所有的x值所對應y的分配,其平均數均落母體迴歸線上。 • 不同x下的y彼此獨立。 • 誤差遵循常態分配彼此獨立且期望值為0。
上機:〔主要分析檔〕 假設: H1:人格特質會影響網路成癮。 H1-1:積極人格特質對網路成癮具負向影響。 H1-2:低焦慮人格特質對網路成癮具負向影響。 H1-3:高自尊人格特質對網路成癮具負向影響。 H1-4:消極人格特質對網路成癮具正向影響。 H1-5:沮喪人格特質對網路成癮具正向影響。 H1-6:他人導向人格特質對網路成癮具正向影響。
報表整理 註:***表p<0.001
問題:是否需要將積極、低焦慮、高自尊、消極、沮喪以及他人導向加總起來當作人格特質變數,即:人格特質=積極+低焦慮+高自尊+消極+沮喪+他人導向。再檢定人格特質對網路成癮是否具影響力?
樓層 地坪 房價 屋齡 停車位數 多元迴歸 • 多元迴歸主要用在探討一組自變數對一個依變數是否具影響力或預測力 假設的寫法: 樓層、地坪、屋齡與與停車位數可共同預測房價
多元迴歸的主要目的是為了強化簡單線性迴歸對依變數的預測力或解釋力多元迴歸的主要目的是為了強化簡單線性迴歸對依變數的預測力或解釋力 • 多元迴歸主要的目的在驗證一群解釋變數對依變數是否具影響力,並判定個別變數對依變數是否有影響力 • 多元迴歸的基本假設,除了必須滿足簡單線性迴歸的基本假設外,還多了一個假設:自變數與自變數間必須為獨立變數 (很難辦到)
多元迴歸方程中有任兩個自變數發生共線性的話,會發生不可預期的錯誤多元迴歸方程中有任兩個自變數發生共線性的話,會發生不可預期的錯誤 • 檢查多元共線性大致有四種方式 • 利用相關係數(目視法) • 利用允差 • 利用變異膨脹因子(VIF) • 利用特徵值
上機〔主要分析檔〕 假設:瀏覽查詢、電子郵件、聊天、下載、電腦遊戲可共同預測網路成癮
報表整理 F=24.237***, 註:*表p<0.05,**表p<0.01,***表p<0.001
含類別變數的迴歸 • 類別變數本身可作為解釋變數(IV)也可以當成控制變數 (CV) • 當解釋變數的時候,建議以一般線性模式的方式處理 • 如果當控制變數的時候使用迴歸或者一般線性模式皆可
虛擬變數的設定 • 名義量尺本身並沒有數值上的意義 • 類別變數只有「是」與「不是」兩種情況 • 對於類別變數而言,只有0與1 • 把數值區分成「是」與「不是」的過程稱為虛擬化 • 一般而言名義量尺若有k個分類,那麼必須設立k-1個虛擬變數 • 若有兩個以上的名義量尺,需設立多少個虛擬變數得看研究設計
兩個類別變數 • 情況I
類別變數當控制變數 • 控制變數 • 在驗證x、y的關係時,為了純化兩者之間的關係,把其他對依變數y有影響的自變數將它的解釋變異排除,這些被排解釋變異能力的自變數,稱為控制變數 • 控制源自於實現時排除干擾因素,在實驗室中可提供某種特定環境來排除其他因素影響,但社會科學實驗通常難以照辦。 • 社會科學的控制變數: • 將 CV依據理論引入研究模式 • 迴歸分析可將CV對依變數之影響列入考慮
上機:〔主要分析檔(含虛擬變數)〕 IV CV 研究假設: H1:網路使用行為會影響網路成癮。 H1-1:瀏覽查詢對網路成癮具顯著影響力。 H1-2:電子郵件對網路成癮具顯著影響力。 H1-3:聊天對網路成癮具顯著影響力。 H1-4:下載對網路成癮具顯著影響力。 H1-5:電腦遊戲對網路成癮具顯著影響力。
報表整理 註1:D1=1表室內活動,D2=1表社交活動,D3=1表文化知性,D4=1表戶外活動,全部0表體能活動;D5=0表國小以下,D6=0表國中,D7=0表高中,D8=0表大專(學),全部0表研究所以上;D9=1表男性,0表女性 註2:*表p<0.05,**表p<0.01,***表p<0.001
類別變數當解釋變數 • 類別變數本身也可當成解釋變數 • 如果解釋變數都是類別變數,依變數是連續變項,可採用獨立樣本T檢定與變異數分析 • 當然也可以使用迴歸分析來進行檢定 • 符合同質性的假設即可以使用迴歸進行檢定 • 但必須把類別變數虛擬化
網路使用行為 瀏覽查詢 電子郵件 聊天 下載 性別 情況I 上機:〔主要分析檔(含虛擬變數)〕 H1:不同性別在網路使用行為上有顯著差異 H1-1:不同性別在瀏覽查詢上有顯著差異。 H1-2:不同性別在電子郵件上有顯著差異。 H1-3:不同性別在聊天上有顯著差異。 H1-4:不同性別在下載上有顯著差異。
上機:〔主要分析檔(含虛擬變數)〕 情況II
情況III 上機:〔主要分析檔(含虛擬變數)〕
報表整理 註:**表p<0.01,***表p<0.001
報表整理 註1:D1=1表室內活動,D2=1表社交活動,D3=1表文化知性,D4=1表戶外活動,全部0表體能活動;D5=0表國小以下,D6=0表國中,D7=0表高中,D8=0表大專(學),全部0表研究所以上;D9=1表男性,0表女性 註2:*表p<0.05,**表p<0.01,***表p<0.001
類別變數當調節(干擾)變數 • 當自變數與依變數間的關係,若在不同的文獻結論中有顯著正向或顯著負向影響兩種論點時,表示在這兩個變數間可能存在第三個變數干擾兩者間的關係 • 干擾變數會影響x與y的方向或者強度 • 干擾變數也有人稱為調節變數,兩者是同一個英文單字,只是翻譯上的不同 • 調節變數本身也是解釋變數
上機:〔主要分析檔〕 H1:性別對網路使用行為與網路成癮間具調節作用。 H1-1:性別對瀏覽查詢與網路成癮間具調節作用。 H1-2:性別對電子郵件與網路成癮間具調節作用。 H1-3:性別對聊天與網路成癮間具調節作用。 H1-4:性別對下載與網路成癮間具調節作用。
報表整理 註:*表p<0.05,**表p<0.01,***表p<0.001
干擾變數的檢定 • 干擾變數就是調節變數,檢定是否具有干擾,在統計上相當於檢定兩變數是否存在交互作用。 • 干擾變數在檢定時若不考慮干擾變數的類型,可分成含有控制變數與沒有控制變數兩類
不含控制變數的干擾變數檢定 • 使用一般線性模式或雙因子變異數分析進行檢定 • 使用一般線性模式進行檢定
使用迴歸分析或一般線性模式進行檢定 • 建議把連續變項區分成高、低兩組類別
上機:直接交乘,檔案〔主要分析檔〕 研究假設: H1:家庭幸福對網路使用行為與網路成癮間具調節效果。 H1-1:家庭幸福對瀏覽查詢與網路成癮間具調節效果。 H1-2:家庭幸福對電子郵件與網路成癮間具調節效果。 H1-3:家庭幸福對聊天與網路成癮間具調節效果。 H1-4:家庭幸福對下載與網路成癮間具調節效果。 H1-5:家庭幸福對電腦遊戲與網路成癮間具調節效果。
報表整理 註:*表p<0.05,**表p<0.01,***表p<0.001
上機:高低分組 假設:內控人格特質對網路使用行為與網路成癮間的影響力具顯著的調節效果,且高內控人格特質會加強網路使用對網路成癮的影響效果。
含控制變數的干擾變數檢定 研究假設: H1:家庭幸福對網路使用行為與網路成癮間具調節效果。 H1-1:家庭幸福對瀏覽查詢與網路成癮間具調節效果。 H1-2:家庭幸福對電子郵件與網路成癮間具調節效果。 H1-3:家庭幸福對聊天與網路成癮間具調節效果。 H1-4:家庭幸福對下載與網路成癮間具調節效果。 H1-5:家庭幸福對電腦遊戲與網路成癮間具調節效果。
報表整理 註1:D1=1表室內活動,D2=1表社交活動,D3=1表文化知性,D4=1表戶外活動,全部0表體能活動;D5=0表國小以下,D6=0表國中,D7=0表高中,D8=0表大專(學),全部0表研究所以上;D9=1表男性,0表女性 註2:*表p<0.05,**表p<0.01,***表p<0.001
層級式迴歸 • 統計學上稱為部分項的檢定 • 目的 • 檢查對原有迴歸模型,增加數個自變數,或者減少數個自變數,此增加的自變數或減少的自變數,是否為有效的解釋變數
沒有控制變數的層級式迴歸 • 上機
含控制變數的層級式迴歸 • 名義量尺的控制變數必須虛擬化,連續變項的控制變數則直接置入即可 上機
報表整理 註1:D1=1表室內活動,D2=1表社交活動,D3=1表文化知性,D4=1表戶外活動,全部0表體能活動;D5=0表國小以下,D6=0表國中,D7=0表高中,D8=0表大專(學),全部0表研究所以上;D9=1表男性,0表女性 註2:*表p<0.05,**表p<0.01,***表p<0.001
以層級式迴歸進行調節檢定 情況I:不含控制變數