1 / 11

STATISTICA 的 典型相關分析

STATISTICA 的 典型相關分析. 南台科技大學企管系 呂金河. 典型 ( 正準 ) 相關分析. 目的: 1. 求兩組變數 {X 1 , X 2 , …, X p } 與 {Y 1 , Y 2 , …, Y q } 之間的相關,尋找 X 變數的線性組合 W i 與 Y 變數的線性組合 V i , W i , V i 分別為 X, Y 的第 i 個典型變數 (canonical variate) ,使得 (1) W 1 , V 1 為 X, Y 變數的所有線性組合中,相關係數最大者

rae-fields
Download Presentation

STATISTICA 的 典型相關分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISTICA的典型相關分析 南台科技大學企管系 呂金河

  2. 典型(正準)相關分析 • 目的: • 1.求兩組變數{X1, X2, …, Xp}與{Y1, Y2, …, Yq}之間的相關,尋找X變數的線性組合Wi與Y變數的線性組合Vi,Wi, Vi分別為X, Y的第i個典型變數(canonical variate),使得 • (1) W1, V1為X, Y變數的所有線性組合中,相關係數最大者 • (2) W2, V2與W1, V1互為獨立,且W2, V2為滿足此條件的線性組合中,相關係數最大者。 • (3) Wi, Vi與前所有個典型變數Wj, Vj互為獨立,且為滿足此條件的線性組合中,相關係數最大者。 • 2.典型變數最多min(p, q)對,但相關係數可能只有m < min(p, q)個顯著,應決定需要至少多少個典型相關,才能適當描述兩組變數X, Y的關聯。

  3. 例如:(1)健康部門想知道住家品質,如房屋型態,冷暖氣條件,自來水的提供,廚房及衛浴設備,與微小和嚴重疾病發生數,無力工作天數間的關連大小。例如:(1)健康部門想知道住家品質,如房屋型態,冷暖氣條件,自來水的提供,廚房及衛浴設備,與微小和嚴重疾病發生數,無力工作天數間的關連大小。 (2)研究人員想知道個人的生活型態及飲食習慣是否對其健康有影響,健康情況可用一些相關變數如高血壓,體重,焦慮,緊張水準等量測。 (3)行銷經理想知道購買的產品型態與消費者生活型態及個性是否有關連。 • 二組變數若能分出其中一組為自變數或預測變數(predictor),另一組為因變數或準則變數(criterion),則典型相關可以看出自變數是否影響因變數。

  4. 方法: • 1. 的特徵向量a,得典型變數 的特徵向量b,得典型變數 。兩者特徵值ρ2相等,即為典型相關係數ρ,向量a,b為典型權重,大於0.3 者具有解釋能力。 • 2. 用Wilk ‘s Lambda(Λ)檢定是否所有 ,即 作總檢定。用Likelihood ratio(概似比)檢定,檢定是否第m + j個之後的ρ為0 (註 ),以決定應保留幾組典型變數( 則不保留)

  5. 3.計算W與X的相關係數稱為W的典型負荷,得典型結構矩陣,用以解釋W的意義 (命名)。V的命名,亦由V與Y的典型負荷量 (值者) 決定 • 4.計算W與Y的相關係數,及V與X的相關係數,進一步說明彼此的相關大小與方向 • 5. 計算自我相關係數(A.C.),為典型負荷值的平方的平均值,用以表示典型變數所解釋的共有變異量的比例,即自我解釋的能力。 • 6. 計算重疊指數(Index of Redundancy)R.I.,此為自我相關係數乘以典型相關係數的乘積。 如同複迴歸的R2(判定係數),R.I.是衡量典型相關中一組變數被另一組變數解釋的變異百分比。R.I.<0.05者表示解釋力不足,該典型變數不予考慮。 • 7. 若X, Y能分出X為自變數,Y為因變數,則可用的複歸估計式,直接看Xi與Yj的關係情況。 • 8. 典型相關分析的結果常圖示,如下例

  6. W1:自我相關=52.5% V1:自我相關=48.3% R.I.=47.33% R.I.=51.45% W2:自我相關=50.80% V2:自我相關=45.8% R.I.=41.22% R.I.=45.72%

  7. STATISTICA操作 • 點選多變量探索技巧 正準分析 在快速欄 按變數選擇全部變數確定  在輸入檔案 選原始資料確定 在快速欄 按正準分析所需變數選擇第一變數表列,第二變數表列要分析的變數確定 確定 在正準因子欄 按摘要:正準分析結果,特徵值,特徵值圖,卡方檢定在因子結構欄 按不同子集樣本間的相關,因子結構與複聯係數在正準得點欄 按左及右集合之正準加權,儲存正準得點

  8. 舉例 • 資料來源:statistica所提供的資料:factor.sta瞭解在工作中的滿意度與其他方面滿意度的關係變數work_1至work_3與另外7個變數的關係

  9. 特徵值,特徵值圖 • 卡方檢定

  10. 因子結構與複聯係數

  11. Hobby 1 0.249966 Hobby 2 Work 1 0.796461 0.221890 0.884705 Home 1 0.952643 v1 w1 -0.1564751 Work 2 -0.4479001 Home 2 -0.06612585 Work 3 Home 3 0.6155559 Miscel 1 0.2908593 Miscel 2 路徑圖 • A.C=.7694 A.C.=.4168 • R.I.=.6022 R.I.=.3262 0.875390

More Related