1 / 4

Data Mining

Data Mining. 目的: 以資料探勘的方法探討什麼因素造成職棒球員薪資的多寡。 數據: 我們以美國職棒大聯盟球員在1986年和生 涯的表現來分析他們在1987年的薪資。. 參考資料. 資料出處 : 原始數據下載自 Statlib http://lib.stat.cmu.edu/data-expo/1988.html D. Hoaglin and P. Velleman, (1995)

Download Presentation

Data Mining

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Data Mining • 目的: 以資料探勘的方法探討什麼因素造成職棒球員薪資的多寡。 • 數據: 我們以美國職棒大聯盟球員在1986年和生 涯的表現來分析他們在1987年的薪資。

  2. 參考資料 • 資料出處: 原始數據下載自 Statlib http://lib.stat.cmu.edu/data-expo/1988.html • D. Hoaglin and P. Velleman, (1995) “A Critical Look at Some Analyses of Major League Baseball Salaries”, The American Statistician, 49,277-285.

  3. 各組的分工 • 第一組:吳俊瑩、陳進賢 • 系統化之數據整理 • 第二組:王笙美、歐怡玲 • 線性迴歸(Linear Regression)模式的分析 • 第三組:鄭嘉仁、蘇信嘉 • 群聚方法(Clustering Analysis)的分析 • 第四組:陳明豐 • 分類樹 (Classification Tree)的分析

  4. R的簡介 • 各組使用的軟體是R 版本1.8.1. • R是個功能強大的統計語言及計算繪圖介 面。 • R是由早期的S語言所發展的,但非常大的不同是,R是GNU的免費軟體。 • 除了不遜於SAS及Splus的統計程式庫外,R 有非常多的在統計計算、圖形及生物資訊上的支援(如Omega, gRaphical及 Bioconductor Projects)

More Related