250 likes | 378 Views
內容大綱. 研究動機與目的 世新傳播資料庫與 E-ICP 的比較 各媒體重度使用者在人口統計變數的剖析 各媒體重度使用者的關聯性分析 各媒體使用程度的類神經網路模型 C & RT 樹狀結構 ( 決策樹 ) 分析. 研究動機與目的. 如何從世新傳播資料庫挖礦 ? 寶山 ? 要挖什麼礦 ? 剖析閱聽人對各種媒體的使用行為與其間的關聯性 世新傳播資料庫與東方消費者行銷資料庫 (E-ICP) 在調查方法、樣本結構 , 以及對各種媒體的使用行為比較 剖析電視、廣播、雜誌、報紙與網路五種媒體重度使用者的特性 建構閱聽人對五種媒體使用的關聯矩陣
E N D
內容大綱 • 研究動機與目的 • 世新傳播資料庫與E-ICP的比較 • 各媒體重度使用者在人口統計變數的剖析 • 各媒體重度使用者的關聯性分析 • 各媒體使用程度的類神經網路模型 • C&RT樹狀結構(決策樹)分析
研究動機與目的 • 如何從世新傳播資料庫挖礦? 寶山? 要挖什麼礦? • 剖析閱聽人對各種媒體的使用行為與其間的關聯性 • 世新傳播資料庫與東方消費者行銷資料庫(E-ICP)在調查方法、樣本結構, 以及對各種媒體的使用行為比較 • 剖析電視、廣播、雜誌、報紙與網路五種媒體重度使用者的特性 • 建構閱聽人對五種媒體使用的關聯矩陣 • 運用資料採礦技術進行塑模, 包括建立以媒體使用程度為輸出變數的類神經網路模型來剖析各解釋變數的相對重要性與解釋能力, 以及利用C&RT樹狀結構模型來建立各媒體重度使用者的規則集
各媒體重度使用者在人口統計變數與對其他媒體使用情形的剖析各媒體重度使用者在人口統計變數與對其他媒體使用情形的剖析
各媒體重度使用者在人口統計變數與對其他媒體使用情形的剖析各媒體重度使用者在人口統計變數與對其他媒體使用情形的剖析
閱報等級類神經網路模型之輸入變數相對重要性 (估計準確度:55%)
閱讀雜誌等級類神經網路模型之輸入變數相對重要性 (估計準確度:51%)
收聽廣播等級類神經網路模型之輸入變數相對重要性 (估計準確度:67%)
收看電視等級類神經網路模型之輸出變數相對重要性 (估計準確度:41%)
使用網路等級類神經網路模型之輸出變數相對重要性 (估計準確度:63%)
報紙使用等級C&RT樹狀結構分析 樹狀圖 • 全體樣本的閱報等級36.5%為重度使用者 • 已婚、國中以上、55-64歲70%為重度使用者
雜誌使用等級C&RT樹狀結構分析 樹狀圖 • 全體樣本的閱讀雜誌等級18.4%為重度使用者 • 高中(職)以上、男性、收入20,000元以下或50,000~ • 60,000元35.4%為重度使用者
廣播使用等級C&RT樹狀結構分析 樹狀圖 • 全體樣本收聽廣播等級20%為重度使用者 • 雜誌的非使用者、原住民或大陸各省、15~24歲、 • 35~54歲72.7%為重度使用者
電視使用等級C&RT樹狀結構分析 樹狀圖 • 全體樣本收看電視等級33.8%為重度使用者 • 北部地區、25~64歲、沒收入或收入20,001~40,000元 • 58.1%為重度使用者
網路使用等級C&RT樹狀結構分析 樹狀圖 • 全體樣本使用網路等級22.8%為重度使用者 • 15~34歲、大學以上66.7%為重度使用者
結論與後續研究 • 寶山 • 礦工 • 挖礦
Google網頁蒐尋結果 • 資料採礦:36,800個網站 • 資料挖礦:10,900個網站 • 資料探勘:3,970個網站 • DATAMING:4,200,000個網站