330 likes | 571 Views
第 9 章. 基本的資料探勘、線上分析處理、資訊呈現. 資料探勘 ( 續 ). 企業常將顧客分類,進行資料探勘,以便行銷策略可更有效的針對特定群體。典型的例子是以 RFM 區分顧客,意即最近購買時間、頻率、金額等,這些資料庫取自顧客,可進行量化分析。. 資料探勘. 倉儲資料儲存室是企業的資源,須完成三個基本功能: 從倉儲資料儲存室中取得資料 資料轉換成資訊 資訊呈現給 CRM 系統的使用者. 資料探勘 ( 續 ). 資料探勘是從倉儲中取得資料,有些資料探勘軟體也可作資料轉換與呈現, OLAP( 線上分析處理 ) 系統是針對資料倉儲使用者設計的軟體
E N D
第 9 章 基本的資料探勘、線上分析處理、資訊呈現
資料探勘(續) • 企業常將顧客分類,進行資料探勘,以便行銷策略可更有效的針對特定群體。典型的例子是以RFM區分顧客,意即最近購買時間、頻率、金額等,這些資料庫取自顧客,可進行量化分析。
資料探勘 • 倉儲資料儲存室是企業的資源,須完成三個基本功能: • 從倉儲資料儲存室中取得資料 • 資料轉換成資訊 • 資訊呈現給CRM系統的使用者
資料探勘(續) • 資料探勘是從倉儲中取得資料,有些資料探勘軟體也可作資料轉換與呈現,OLAP(線上分析處理)系統是針對資料倉儲使用者設計的軟體 • 資料探勘並非只是從資料倉儲直接取得資料,而是從之前未知的資料中取得資訊。 • 資料探勘(data mining)可界定為蒐集資料市集之過程,可使使用者了解以前未知的資料型態、關係、趨勢等。將其運用於CRM,則是從顧客資料中,更了解顧客及其行為。
決策支援 • 資料倉儲系統並非只是交易處理系統,而是要用於決策制定。 • 將電腦運用於決策支援系統(DSS)的理念可追溯至Gorry與Morton兩位麻省理工學院教授於1971年發表於史隆管理評論(Sloan Management Review)的文章,該理念可相對於管理資訊系統(MIS- Management Information System),但MIS偏向企業整體資訊之發掘,但運用的結果是,管理者不一定知道所需的資訊,而資訊專業人員也不一定懂管理。 • Gorry與Morton將MIS觀念與決策支援系統(DSS- Decision Support System)觀念結合,以便針對問題加以解決。
假設驗證與知識發現 • 資料探勘之使用過程稱為假設驗證(hypothesis verification),使用者可用CRM系統支持或拒絕其假設。 • 資料探勘也有助於知識發現(knowledge discovery),使用者透過CRM系統之使用,可確認資料中存在之特性,透過資料之發掘予以陳述。 • 假設驗證以使用者導向(user-driven)進行,知識發現則以系統導向(system-driven)之方式進行。
資料探勘功能 • 分類 • 許多公司常依顧客行為將顧客分類,以提供較佳之服務 • 分群 • 賣方喜歡依顧客相似特性,將顧客分群,企業可依此資料,對特定分群推出行銷方案。 • 資料探勘軟體可結合人口統計變數、地理、活動、心理、行為變數等資料進行分群,計算程序(algorithm)可將資料結合軟體,以得到更豐富的資訊。
資料探勘功能(續) • 連結 • 連結是用於產品之間,賣方可了解連結是否存在,及其強度,且基於相關產品而進行決策。 • 例如:早餐之製造商可藉優惠券資料獲知哪些產品被購買,零售商可將常被一起購買之產品放在一起展示,確認連結之過程稱為發現連結(associations discovery)。
資料探勘功能(續) • 型態或序列 • 賣方也會對顧客購買行為之型態或序列有興趣,有些行為會以某序列方式發生,資料探勘型態稱為發現序列型態(sequential pattern discovery),包含時間為變數,序列的強度可用量化方式加以衡量。 • 另一個發現型態或序列的方法是相似時間序列發現(similar time sequence discovery) ,不僅發現序列型態,也確認相似型態的行為。顧客依序列購物,及相似時間序列發現可用於確認其他分群也有類似的序列,資料探勘軟體系統可完成這些功能。 • 哈拉博奕公司如何應用此功能
知識發現方法 • 決策樹 • 決策樹(decision tree)是基於屬性而進行推導的過程,可用一系列的架構進行推論,通常只有一個起點,但有多個終點 • 決策樹的基礎稱為根部,分枝的盡頭則稱為樹葉,通常根部在圖表的上方或左方,邏輯過程是由上而下或由左至右。
知識發現方法(續) • 算術推導 • 算術推導(genetic algorithm)則基於最適化之觀念加以推導,圖表9.3表示廣告策略之推導,該策略目標是使銷售極大,太少廣告將喪失潛在的收入,太多也對企業不利。
知識發現方法(續) • 記憶體為基礎之推導 • 記憶體為基礎之推導(memory based reasoning)是指基於已往記憶,預測未來可能發生之事項,運用在行銷上,則是以已往產品之購買預測其品牌忠誠度。 • 資料探勘的應用中,資料紀錄可得知顧客行為,大量購買的顧客可分類為忠誠的顧客,也可用於預測未來可能的序列行為。 • RFM(最近購買時間、頻率、金額等)是記憶體為基礎之推導的例子,可預測其未來行為。
知識發現方法(續) • 神經網絡分析 • 神經網絡分析(neural networks)是基於人體腦部之基礎,配合電腦輸入、處理、輸出等架構,所形成的分析架構 • 圖表9.4A是分析中的元件要素,包含輸入、處理、輸出等,為單一方向推導 • 圖表9.4B則結合更多來源,形成網絡分析。 • 圖表9.5則以表列方式呈現四種基本的資料探勘所能達成之功能。
線上分析處理(OLAP)之基本概念 • OLAP是基於資料倉儲使用者之需求,使其達成互動效果,並進行多維度分析及獲得迅速回應。使用者可基於網路(Web)畫面進行互動利用,且可獲得包含圖形之結果。 • OLAP可用於移動平均及時間序列等之運算,OLAP也支援向下查詢、向上查詢、橫向查詢、穿越查詢 • OLAP也可將資料加以轉軸,從不同角度看資料,將於圖表9.6討論。
基本的線上分析處理架構 • OLAP的資料可取自關係性或多維度的資料庫,前者稱為ROLAP(關係性線上分析處理- Relational Online Analytical Processing),後者稱為MOLAP(多維度線上分析處理- Multidimensional Online Analytical Processing),架構列於圖表9.7 • ROLAP從關係性資料庫管理系統中取得資料,MOLAP則從多維度資料庫系統中取得資料。
關係性線上分析處理(ROLAP) • 各資料庫以關係性表格組成,採資料庫常用標準軟體,經證明可不受限於資料規模,但若受資料規模限制,則影響其分析能力。
多維度線上分析處理(MOLAP) • 多維度資料庫正在成長,IBM與微軟已發展多維度資料庫管理系統(MDBMSs) • MDBMSs適用於OLAP以完成多維度分析,但資料庫規模受限。因此須將MDDB下載至顧客工作站,MDBMSs只需管理一部分的資料庫即可。CRM系統的設計者須決定用ROLAP或MOLAP • ROLAP適用於資料庫很大,而分析為中等 • MOLAP適用於資料庫較小,而分析較複雜 • 須結合ROLAP與MOLAP的強勢,則須用HOLAP。
OLAP軟體 • OLAP軟體系統有兩個例子,一個是微軟SQL 2000伺服器,另一個是IBM DB2。 • 微軟的產品可提供多維度構面,且將量化數據加以彙總,資料可用彈性及迅速報告之方式提供。細節及彙總資料可用關係性或多維度OLAP資料庫加以儲存,或以複雜結合方式,稱為HOLAP (Hybrid Online Analytical Processing)。在HOLAP,細節資料儲存在關係性資料庫,而彙總資料儲存在多維度資料庫。 • IBM DB2則可提供假設導向之資料探勘,且迅速回應,以假設推導之邏輯加以分析。
資訊呈現 • 資訊使用者 • 初學者(novice)是指沒有受過特別的電腦訓練,需要訊息,但不須分析,主管是其中一例,他只需彙總的資訊。 • 分析人員(analyst)是指精通分析之使用,且應用統計工具,將資訊加以轉換,以供主管使用,主管的幕僚是其中一例。有權力者(power user),他們將資訊分析,且加入其他總體資訊,通常是資訊專業人員
資訊呈現(續) • 資訊傳送軟體 • 報告撰寫 • 資料庫查詢語言 • 決策支援系統 • 線上分析處理