270 likes | 665 Views
第四章 相關分析 (correlation analysis). 4-1 相關分析 4-2 Pearson 積差相關係數 4-3 相關係數 4-4 點二系列相關 4-5 Spearman 等級相關 4-6 淨相關 4-7 部份相關. 4-1 相關分析.
E N D
第四章 相關分析 (correlation analysis) • 4-1 相關分析 • 4-2Pearson 積差相關係數 • 4-3相關係數 • 4-4 點二系列相關 • 4-5Spearman 等級相關 • 4-6 淨相關 • 4-7 部份相關
4-1 相關分析 • 相關分析探討的是兩個變數之間的關聯程度 (degree of association), 若是兩個變數是名目變數, 請使用X2卡方檢定, 這裏使用的是區間, 比率或順序的計量變數,在統計上, 使用的是兩個變數關連程度的統計量, 例如, 常用的Pearson 相關分析的Pearson相關係數, 就是用來表示兩個變數之間的關連程度 • 相關係數(correlation coefficient) 是本章最重要的判讀依據, 有大小和方向兩種特性, 我們分別介紹如下: • 相關係數的大小(magnitude):表示兩個變數之間, 相關程度的強弱, 相關係 • 數的絶對值愈大, 代表相關程度愈強, 相反的, 相關係數的絶對值愈小, 代表 • 相關程度愈弱, 若是相關係數的值為0, 代表零相關, 也就是没有相關。 • 相關係數的方向(direction):表示兩個變數之間, 是正相關, 還是負相關, 相 • 關係數是正值, 代表兩個變數中的一個變數增加時, 另一個變數也會增加, • 相關係數是負值, 代表兩個變數中的一個變數增加時, 另一個變數就會減少, • 反之亦然。 • 一般常用的相關分析有Pearson積差相關係數, 相關係數, 點二系列相關, Spearman等級相關, 淨相關, 和部份相關, (複相關大多都使用迴歸,請參考迴歸分析), 相關的內容我們分別介紹如後。
4-2 Pearson積差相關係數 • Pearson積差相關係數(Product-Moment Correlation Coefficient) 是適用於2個變數都是連續變數, 可以是interval scale (區間變數)或ratio scale(比率變數), 相關係數的計算如下:
rXY的圖示 y x y x • rXY樣本的相關係數是一次方的函數, 可以用散佈圖來查看。 • rXY為正相關的圖如下: rXY為負相關的圖如下:
rXY值的判別 • 在判定rXY值時, 一般常用三級制, 絶對值大於等於0.8時, 為高度相關, 大於等於0.4時, 為中度相關, 小於0.4時, 為低度相關 • 研究假設如下: • 虛無假設 H0: = 0, 兩個變數之間無相關 • 對立假設 H1: 0, 兩個變數之間有相關 • 範例: • Trust有用性(使用資安產品可以加速工作時間)及Risk易用性(資安產品很容易使用)之間是否有相關存在。(題項:Trust、Risk) • 假設:
操作步驟如下: • 開啟範例 correlation.sav, 出現圖如下: • 1. 開啟範例 correlation.sav • 2. 按 Analyze Correlate Bivariate • 3. 在 Bivariate Correlations 視窗,選取 信任 Trust和風險 Risk 變數 • 4. 選取 信任 Trust和風險 Risk 變數,按 〉,選取 Pearson (預設) • 5. 按 OK,出現報表結果,如下圖:
報表分析如下: • Correlations • Correlations • ** Correlation is significant at the 0.01 level (2-tailed). • 說明:p-value= .001 < .05,因此拒絕 ,表示 Trust 及 Risk 間具有顯著相關,相關係數為0.278,屬低度相關。
4-3 相關係數 • 相關係數(Phi correlation coefficient) 適用於二個變數都是二分名義變數 (nominal-dichotomous variable), 也就是都是二分類的變數。 • 例如:性別, 民主和共產國家…等等。 • 相關係數值為卡方X2的另一種轉換值, 由於X2容易受到, 樣本數大小的影響, 於是將X2轉換成0 ~1之間, 0代表無相關, 1化表高度相關, 值的計算方式如下: • = • 範例: • 學歷與職位間有無關係,題項:grade(學歷)、position (職位) • 說明: • H0無關係 ,H1有關係
操作步驟如下: • 1. 開啟範例 correlation.sav, 出現圖如下: • 2. 按 Descriptive Statistics Crosstabs • 3. 在 Crosstabs 視窗,選 grade (學歷)到 Row(s) ,選 position (職位)到 Column(s) • 4. 按 Statistics,選 Chi-square,Phi and Cramer’s V • 5. 按 Continue, 回到 Crosstabs 視窗 • 6. 按 OK,出現報表結果,如下圖 :
報表分析如下: • Crosstabs • Case Processing Summary • 學歷 * 職位 Crosstabulation • Count
Chi-Square Tests • a 15 cells (75.0%) have expected count less than 5. The minimum expected count is .03. • Symmetric Measures • a Not assuming the null hypothesis. • b Using the asymptotic standard error assuming the null hypothesis. • 說明:p-vlaue= .000< .05,故學歷與職位間有顯著相關。
4-4 點二系列相關 • 點二系列相關(Point-biserial Correlation) 適用於一個變數為二分名義變數, 另一個為連續變數 (區間變數或比率變數), 點二系列的相關係數計算如下: • 注意:在SPSS軟體中, 没有處理點二系列相關係數的選項, 由於計算點二系列的相關係數值會與Pearson相關係數值一樣, 所以, 在處理點二系列相關問題時, 都會採用Pearson相關係數的步驟來計算。
4-5 Spearman等級相關 • Spearman等級相關係數 (Rank Order Correlation Coefficient) 適用於兩個變數皆為順序尺度, 其目的是在算出兩組等級之間一致的程度, 例如, 可以用在兩個人對於N台筆記型電腦進行印象分數等級的評定或則是1個人對於N台筆記型電腦進行前後二次印象分數等級的評定。 • Spearman等級相關係數的計算如下: • 範例: • 某單位顧問對於廠商同樣的產品,前後加以評分給等第,我們想知道前後加以評分給等第之間是否有相關存在,題項:Score1(分數1)、Score2(分數2) • 說明:
操作步驟如下: • 1. 開啟範例 correlation.sav • 2. 按 Analyze Correlate Bivariate • 3. 在Bivariate Correlations 視窗,將 score1 (分數1)和 score2 (分數2)選入 • variables,選取 Spearman • 4. 按OK,出現報表結果
輸出報表結果如下: • Nonparametric Correlations • Correlations • ** Correlation is significant at the 0.01 level (2-tailed). • 說明:p-value= .000< .05,拒絕H0,表示前後加以評分給等第之間的結果相近,相關係數達 0.766 ,屬於高度正相關。
4-6 淨相關 • 淨相關(Partial Correlation)又被稱為偏相關, 在前面Pearson相關係數討論中, 我們是直接探討二個變數之間的相關程度, 但是, 如果這二個變數同時與第三個變數有關係時, 也就是說, 這二個變數可能會受到第三個變數的干擾, 這時, 我們想了解原先二個變數的相關是否是由第三個變數所造成的影響, 就可以將第三個變數的影響效果控制住, 也就是計算與第三個變數有相關部份排除後, 原先二個變數的純淨相關 • 淨相關係數的展示式:例如有X1, X2兩變數, 第三變數為X3 • X1和 X2相關係數 = r12 • X1和 X3相關係數 = r13 • X2和 X3相關係數 = r23 • X1和 X2相關係數並排除r13和 r23時的淨相關係數= r12.3 • r12.3=
研究假設: • 虛無假設H0:r= 0 兩者無淨相關 • 對立假設H1:r 0 兩者有淨相關 • 範例: • 易用性與傾向使用均與有用性成正相關,計算易用性與傾向使用的淨相關。(題項:PU、PEOU、ITU) • 說明: • H0無關係,H1有關係
操作步驟如下: • 1. 開啟範例 correlation.sav • 2. 按 Analyze Correlate Partial • 3. 在 Partial Correlations 視窗,將 PEOU (易用性)和 • ITU(傾向使用)選入 variables,將 PU(有用性)選入 • Controlling for • 4. 按 Options, 選取 Means and standard deviation 和 • Zero-order correlations • 5. 按 Continue,回到 Partial Correlations 視窗 • 6. 按OK,出現報表結果
輸出報表結果如下: • Partial Corr • Descriptive Statistics
Correlations • a Cells contain zero-order (Pearson) correlations.
說明: • 1. = .394,p-value=.000<.05,因此拒絕H0 :r=0,表示 • 未排除 PU前,PEOU與ITU具顯著相關。 • 2. =.251,p-value=.002<.05,因此拒絕H0 :r=0 ,表示 • 排除PU後,PEOU與ITU具顯著相關。 • 結論: • PU(易用性)和PEOU(傾向使用) 兩者有淨相關值為 =.251 。
4-7 部份相關 • 部份相關(part correlation) 又被稱為半淨相關 (semipartial correlation ), 原因是部份相關在處理時, 是處理淨相關的部份, 淨相關是X1和 X2變數, 排除第三變數 X3的影響後, 所得到X1和 X2的淨相關, 而部份相關則是在處理排除效果時, 僅處理第三變數X3與X1或 X2其中一個變數相關, 得到的結果稱為部份相關 • 部份相關的表示式: • r 1(2.3)= • r (2.3):X2中排除X3的影響力 • r 12:X1和 X2的相關係數 • r 13:X1和X3的相關係數 • r 23:X2和X3的相關係數 • 注意:請比較淨相關和部份相關的表示式, 會發覺只有分母部份不相同, 這意味著, 淨相關和部份相關的值不會一樣, 一般淨相關的絶對值會大於部份相關的絶對值。 • 範例:易用性與傾向使用均與有用性成正相關,計算易用性與傾向使用的淨相關。(題項:PU、PEOU、ITU) • 說明:H0無關係 ,H1有關係
操作步驟如下: • 1. 開啟範例 correlation.sav • 2. 按 Analyze Regression Linear • 3. 在 Linear Regression 視窗,將 ITU(傾向使用)選入 • Dependent,將PU(有用性)和 PEOU (易用性) 選入 • independent • 4. 按 Statistics,選取 Estimates,Model fit 和 Part and • partial correlations • 5. 按Continue,回到 Linear Regression 視窗 • 6. 按OK,出現報表結果
報表分析結果如下: • Regression • Variables Entered/Removed(b) • a All requested variables entered. • b Dependent Variable: 傾向使用 • Model Summary • a Predictors: (Constant), 易用性, 有用性
ANOVA(b) • a Predictors: (Constant), 易用性, 有用性 • b Dependent Variable: 傾向使用 • Coefficients(a) • a Dependent Variable: 傾向使用 • 說明:由上表知,有用性與傾向使用的淨相關為.398,部份相關為.366。易用性與傾向使用的淨相關為.251,部份相關為.219。