第四章相關分析 (correlation analysis)

第四章相關分析 (correlation analysis) • 4-1　相關分析 • 4-2Pearson 積差相關係數 • 4-3相關係數 • 4-4　點二系列相關 • 4-5Spearman 等級相關 • 4-6　淨相關 • 4-7　部份相關

4-1 相關分析 • 　　相關分析探討的是兩個變數之間的關聯程度 (degree of association), 若是兩個變數是名目變數, 請使用X2卡方檢定, 這裏使用的是區間, 比率或順序的計量變數,在統計上, 使用的是兩個變數關連程度的統計量, 例如, 常用的Pearson 相關分析的Pearson相關係數, 就是用來表示兩個變數之間的關連程度 • 　　相關係數(correlation coefficient) 是本章最重要的判讀依據, 有大小和方向兩種特性, 我們分別介紹如下： • 相關係數的大小(magnitude)：表示兩個變數之間, 相關程度的強弱, 相關係 • 　數的絶對值愈大, 代表相關程度愈強, 相反的, 相關係數的絶對值愈小, 代表 • 　相關程度愈弱, 若是相關係數的值為0, 代表零相關, 也就是没有相關。 • 相關係數的方向(direction)：表示兩個變數之間, 是正相關, 還是負相關, 相 • 　關係數是正值, 代表兩個變數中的一個變數增加時, 另一個變數也會增加, • 　相關係數是負值, 代表兩個變數中的一個變數增加時, 另一個變數就會減少, • 　反之亦然。 • 　　一般常用的相關分析有Pearson積差相關係數, 相關係數, 點二系列相關, Spearman等級相關, 淨相關, 和部份相關, (複相關大多都使用迴歸，請參考迴歸分析), 相關的內容我們分別介紹如後。

4-2 Pearson積差相關係數 • Pearson積差相關係數(Product-Moment Correlation Coefficient) 是適用於2個變數都是連續變數, 可以是interval scale (區間變數)或ratio scale(比率變數), 相關係數的計算如下：

rXY的圖示 y         x y         x • rXY樣本的相關係數是一次方的函數, 可以用散佈圖來查看。 • rXY為正相關的圖如下：　　　　 rXY為負相關的圖如下：

rXY值的判別 • 　　在判定rXY值時, 一般常用三級制, 絶對值大於等於0.8時, 為高度相關, 大於等於0.4時, 為中度相關, 小於0.4時, 為低度相關 • 研究假設如下： • 虛無假設 H0：　= 0, 兩個變數之間無相關 • 對立假設 H1：　　0, 兩個變數之間有相關 • 範例： • Trust有用性(使用資安產品可以加速工作時間)及Risk易用性(資安產品很容易使用)之間是否有相關存在。(題項：Trust、Risk) • 假設：

操作步驟如下： • 開啟範例 correlation.sav, 出現圖如下： • 1. 開啟範例 correlation.sav • 2. 按 Analyze  Correlate  Bivariate • 3. 在 Bivariate Correlations 視窗，選取信任 Trust和風險 Risk 變數 • 4. 選取信任 Trust和風險 Risk 變數，按〉，選取 Pearson (預設) • 5. 按 OK，出現報表結果，如下圖：

報表分析如下： • Correlations • Correlations • ** Correlation is significant at the 0.01 level (2-tailed). • 說明：p-value= .001 < .05，因此拒絕　　　　　，表示 Trust 及 Risk 間具有顯著相關，相關係數為0.278，屬低度相關。

4-3 　相關係數 • 　　　相關係數(Phi correlation coefficient) 適用於二個變數都是二分名義變數 (nominal-dichotomous variable), 也就是都是二分類的變數。 • 例如：性別, 民主和共產國家…等等。 • 　　　相關係數值為卡方X2的另一種轉換值, 由於X2容易受到, 樣本數大小的影響, 於是將X2轉換成0 ~1之間, 0代表無相關, 1化表高度相關, 值的計算方式如下： • = • 範例： • 學歷與職位間有無關係，題項：grade(學歷)、position (職位) • 說明： • H0無關係，H1有關係

操作步驟如下： • 1. 開啟範例 correlation.sav, 出現圖如下： • 2. 按 Descriptive Statistics  Crosstabs • 3. 在 Crosstabs 視窗，選 grade (學歷)到 Row(s) ，選 position (職位)到 Column(s) • 4. 按 Statistics，選 Chi-square，Phi and Cramer’s V • 5. 按 Continue，回到 Crosstabs 視窗 • 6. 按 OK，出現報表結果，如下圖：

報表分析如下： • Crosstabs • Case Processing Summary • 學歷 * 職位 Crosstabulation • Count

Chi-Square Tests • a 15 cells (75.0%) have expected count less than 5. The minimum expected count is .03. • Symmetric Measures • a Not assuming the null hypothesis. • b Using the asymptotic standard error assuming the null hypothesis. • 說明：p-vlaue= .000< .05，故學歷與職位間有顯著相關。

4-4 點二系列相關 • 　　點二系列相關(Point-biserial Correlation) 適用於一個變數為二分名義變數, 另一個為連續變數 (區間變數或比率變數), 點二系列的相關係數計算如下： • 注意：在SPSS軟體中, 没有處理點二系列相關係數的選項, 由於計算點二系列的相關係數值會與Pearson相關係數值一樣, 所以, 在處理點二系列相關問題時, 都會採用Pearson相關係數的步驟來計算。

4-5 Spearman等級相關 • Spearman等級相關係數 (Rank Order Correlation Coefficient) 適用於兩個變數皆為順序尺度, 其目的是在算出兩組等級之間一致的程度, 例如, 可以用在兩個人對於N台筆記型電腦進行印象分數等級的評定或則是1個人對於N台筆記型電腦進行前後二次印象分數等級的評定。 • Spearman等級相關係數的計算如下： • 範例： • 　　某單位顧問對於廠商同樣的產品，前後加以評分給等第，我們想知道前後加以評分給等第之間是否有相關存在，題項：Score1(分數1)、Score2(分數2) • 說明：

操作步驟如下： • 1. 開啟範例 correlation.sav • 2. 按 Analyze  Correlate  Bivariate • 3. 在Bivariate Correlations 視窗，將 score1 (分數1)和 score2 (分數2)選入 • variables，選取 Spearman • 4. 按OK，出現報表結果

輸出報表結果如下： • Nonparametric Correlations • Correlations • ** Correlation is significant at the 0.01 level (2-tailed). • 說明：p-value= .000< .05，拒絕H0，表示前後加以評分給等第之間的結果相近，相關係數達 0.766 ，屬於高度正相關。

4-6 淨相關 • 　　淨相關(Partial Correlation)又被稱為偏相關, 在前面Pearson相關係數討論中, 我們是直接探討二個變數之間的相關程度, 但是, 如果這二個變數同時與第三個變數有關係時, 也就是說, 這二個變數可能會受到第三個變數的干擾, 這時, 我們想了解原先二個變數的相關是否是由第三個變數所造成的影響, 就可以將第三個變數的影響效果控制住, 也就是計算與第三個變數有相關部份排除後, 原先二個變數的純淨相關 • 淨相關係數的展示式：例如有X1, X2兩變數, 第三變數為X3 • X1和 X2相關係數 = r12 • X1和 X3相關係數 = r13 • X2和 X3相關係數 = r23 • X1和 X2相關係數並排除r13和 r23時的淨相關係數= r12.3 • r12.3=

研究假設： • 虛無假設H0：r= 0 兩者無淨相關 • 對立假設H1：r 0 兩者有淨相關 • 範例： • 　　易用性與傾向使用均與有用性成正相關，計算易用性與傾向使用的淨相關。(題項：PU、PEOU、ITU) • 說明： • H0無關係，H1有關係

操作步驟如下： • 1. 開啟範例 correlation.sav • 2. 按 Analyze  Correlate  Partial • 3. 在 Partial Correlations 視窗，將 PEOU (易用性)和 • ITU(傾向使用)選入 variables，將 PU(有用性)選入　 • Controlling for • 4. 按 Options，選取 Means and standard deviation 和 • Zero-order correlations • 5. 按 Continue，回到 Partial Correlations 視窗 • 6. 按OK，出現報表結果

輸出報表結果如下： • Partial Corr • Descriptive Statistics

Correlations • a Cells contain zero-order (Pearson) correlations.

說明： • 1. = .394，p-value=.000<.05，因此拒絕H0 :r=0，表示　 • 　未排除 PU前，PEOU與ITU具顯著相關。 • 2. =.251，p-value=.002<.05，因此拒絕H0 :r=0 ，表示 • 　排除PU後，PEOU與ITU具顯著相關。 • 結論： • PU(易用性)和PEOU(傾向使用) 兩者有淨相關值為　　　　　　 =.251 。

4-7 部份相關 • 　　部份相關(part correlation) 又被稱為半淨相關 (semipartial correlation ), 原因是部份相關在處理時, 是處理淨相關的部份, 淨相關是X1和 X2變數, 排除第三變數 X3的影響後, 所得到X1和 X2的淨相關, 而部份相關則是在處理排除效果時, 僅處理第三變數X3與X1或 X2其中一個變數相關, 得到的結果稱為部份相關 • 部份相關的表示式： • r 1(2.3)= • r (2.3)：X2中排除X3的影響力 • r 12：X1和 X2的相關係數 • r 13：X1和X3的相關係數 • r 23：X2和X3的相關係數 • 注意：請比較淨相關和部份相關的表示式, 會發覺只有分母部份不相同, 這意味著, 淨相關和部份相關的值不會一樣, 一般淨相關的絶對值會大於部份相關的絶對值。 • 範例：易用性與傾向使用均與有用性成正相關，計算易用性與傾向使用的淨相關。(題項：PU、PEOU、ITU) • 說明：H0無關係，H1有關係

操作步驟如下： • 1. 開啟範例 correlation.sav • 2. 按 Analyze  Regression  Linear • 3. 在 Linear Regression 視窗，將 ITU(傾向使用)選入 • Dependent，將PU(有用性)和 PEOU (易用性) 選入 • independent • 4. 按 Statistics，選取 Estimates，Model fit 和 Part and • partial correlations • 5. 按Continue，回到 Linear Regression 視窗 • 6. 按OK，出現報表結果

報表分析結果如下： • Regression • Variables Entered/Removed(b) • a All requested variables entered. • b Dependent Variable: 傾向使用 • Model Summary • a Predictors: (Constant), 易用性, 有用性

ANOVA(b) • a Predictors: (Constant), 易用性, 有用性 • b Dependent Variable: 傾向使用 • Coefficients(a) • a Dependent Variable: 傾向使用 • 說明：由上表知，有用性與傾向使用的淨相關為.398，部份相關為.366。易用性與傾向使用的淨相關為.251，部份相關為.219。

第四章相關分析 (correlation analysis)