40 likes | 104 Views
Data Mining. 目的: 以資料探勘的方法探討什麼因素造成職棒球員薪資的多寡。 數據: 我們以美國職棒大聯盟球員在1986年和生 涯的表現來分析他們在1987年的薪資。. 參考資料. 資料出處 : 原始數據下載自 Statlib http://lib.stat.cmu.edu/data-expo/1988.html D. Hoaglin and P. Velleman, (1995)
E N D
Data Mining • 目的: 以資料探勘的方法探討什麼因素造成職棒球員薪資的多寡。 • 數據: 我們以美國職棒大聯盟球員在1986年和生 涯的表現來分析他們在1987年的薪資。
參考資料 • 資料出處: 原始數據下載自 Statlib http://lib.stat.cmu.edu/data-expo/1988.html • D. Hoaglin and P. Velleman, (1995) “A Critical Look at Some Analyses of Major League Baseball Salaries”, The American Statistician, 49,277-285.
各組的分工 • 第一組:吳俊瑩、陳進賢 • 系統化之數據整理 • 第二組:王笙美、歐怡玲 • 線性迴歸(Linear Regression)模式的分析 • 第三組:鄭嘉仁、蘇信嘉 • 群聚方法(Clustering Analysis)的分析 • 第四組:陳明豐 • 分類樹 (Classification Tree)的分析
R的簡介 • 各組使用的軟體是R 版本1.8.1. • R是個功能強大的統計語言及計算繪圖介 面。 • R是由早期的S語言所發展的,但非常大的不同是,R是GNU的免費軟體。 • 除了不遜於SAS及Splus的統計程式庫外,R 有非常多的在統計計算、圖形及生物資訊上的支援(如Omega, gRaphical及 Bioconductor Projects)