1 / 73

第 5 章 資料倉儲的應用與管理 5.1 資料倉儲的使用者 5.2 資料倉儲應用實例 5.3 資料倉儲的執行技術管理 5.4 資料倉儲的超資料管理 5.5 資料倉儲應用中的法律問題 5.6 資料倉儲的成本與效

第 5 章 資料倉儲的應用與管理 5.1 資料倉儲的使用者 5.2 資料倉儲應用實例 5.3 資料倉儲的執行技術管理 5.4 資料倉儲的超資料管理 5.5 資料倉儲應用中的法律問題 5.6 資料倉儲的成本與效益分析 習題. 5.1 資料倉儲的使用者 5.1.1 資料倉儲的使用者-資訊的使用者與知識的採掘者. 常常需要對倉儲中的龐大資料進行採掘,而採掘的內容可能是: 企業所面對的客戶群中,哪些客戶是使企業營利的客戶; 這些營利客戶應該具有哪些特徵; 這些營利客戶在採購程序中經常採購的是哪些種類的產品;

damon
Download Presentation

第 5 章 資料倉儲的應用與管理 5.1 資料倉儲的使用者 5.2 資料倉儲應用實例 5.3 資料倉儲的執行技術管理 5.4 資料倉儲的超資料管理 5.5 資料倉儲應用中的法律問題 5.6 資料倉儲的成本與效

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第5章 資料倉儲的應用與管理5.1 資料倉儲的使用者5.2 資料倉儲應用實例 5.3 資料倉儲的執行技術管理5.4 資料倉儲的超資料管理5.5 資料倉儲應用中的法律問題 5.6 資料倉儲的成本與效益分析習題

  2. 5.1 資料倉儲的使用者 5.1.1 資料倉儲的使用者-資訊的使用者與知識的採掘者 常常需要對倉儲中的龐大資料進行採掘,而採掘的內容可能是: • 企業所面對的客戶群中,哪些客戶是使企業營利的客戶; • 這些營利客戶應該具有哪些特徵; • 這些營利客戶在採購程序中經常採購的是哪些種類的產品; • 所採購的這些產品彼此之間有什麼樣的相互關係。

  3. 5.1.2 資訊使用者的資料倉儲使用方式 資料倉儲的資訊使用者經常是在策略管理階層上, 利用資料倉儲來監控企業策略的實行績效,即經由 對企業營運狀況的關鍵指標之監控,來判斷某一經 營策略是否有效,並將具體的評估結果回饋給資料 採掘者。

  4. 5.1.3 資料採掘者的資料倉儲使用方式 資料採掘者使用資料倉儲的一般程序主要有: • 狀況分析 資料採掘者所進行的機率分析的內容可能有: • 經常來採購的客戶性別比例。 • 總共有多少客戶光臨。 • 經常進行採購的客戶數量及其中的比例情況為何。

  5. 客戶的平均採購量。 • 有多少客戶超過平均採購量。 • 有多少客戶低於平均採購量等。 • 資料擷取 資料擷取工作是根據資料採掘的需要和機率分析的 結果,將需要進行分析的資料從資料倉儲中擷取出 來。

  6. 建模分析 資料採掘中的建模分析是資料採掘者使用資料倉儲 的核心工作,建模分析是開發用於描述客戶、產品 或銷售商模型的程序。

  7. 分類處理 經由建模分析,資料採掘者己從所建模型中分析出 需要的資料,之後他們便可以根據所採掘出的知識 對資料倉儲中的所有資料進行分類。

  8. 5.2 資料倉儲應用實例 管理者希望透過使用資料進行各式各樣的分析內 容,以發現有價值的資訊,來用於輔助決策。但 是,管理決策所遇到的問題是不同的,資料倉儲的 應用也各有其特色,應該根據具體的實際情況選擇 適當的資料倉儲開發方案。

  9. 5.2.1 分層式決策系統 例如,在各子公司的局部資料倉儲中存放著公司的 電器銷售資訊,各子公司可以對這些細部資料進行 分析、整合,萃取出有用的資訊以供決策之用。表 5-1所示的是設在台北某地的子公司的銷售記錄。

  10. 在每次編製好這種整體資料倉儲格式的記錄檔案之在每次編製好這種整體資料倉儲格式的記錄檔案之 後,便可以將其送入整體資料倉儲中。表5-2所示就 是整體資料倉儲中的彩色電視機銷售匯總資訊。

  11. 5.2.2 資料抽樣分析 某化學公司想在不增加投資、不購買設備的條件下 採用採掘現有生產潛力的辦法來增加產量,以提高 效益。公司用產出率來評估每次化學產品生產的效 率,其目的是想經由提高產出率來提高每爐化學產 品的產量。

  12. 5.2.3 發揮歷史資料的經濟效益 遠程銷售商為了開展郵購銷售,需要定期向外寄送 商品型錄。消費者接到型錄後,若對某種商品感興 趣,可以打電話詢問更多的資訊。

  13. 其中的一種分析報表 (如表5-4所示)從資料倉儲中擷 取了有關客戶的幾個資訊,包括: • 零售商最後一次與該客戶接觸是什麼時候? • 客戶上次購買的商品是什麼? • 該客戶喜歡哪類商品?

  14. 5.2.4 回扣分析 當航空公司想要制定某個合理的回扣比率時,就可 以方便而快捷地調出當前匯總資料和歷史匯總資料 進行比較和計算,以便公司在保證航班滿載的條件 下盡量降低成本。

  15. 5.2.5 顧客關係管理(CRM) 在顧客關係管理策略中,資料倉儲儲存的客戶之各 類資料,能提供顧客的詳細資訊,用來引導市場銷 售部門與客戶保持緊密的聯繫,使資料倉儲在顧客 關係管理中發揮重要的功能。

  16. 穩住顧客 在競爭激烈的市場上,企業所面臨的最大挑戰來自 於客戶的流失。市場競爭中的客戶流失現象是必然 發生的,問題是必須避免重要客戶的流失。所以應 該不斷地進行客戶的細分工作。

  17. 管理的收益 利用資料倉儲可以統一掌握客戶資訊,資料倉儲集 中管理了客戶的所有資料,包括購買的歷史資訊和 網路資訊,能夠提供一個統一的顧客資訊管理系 統。這樣就可以迅速並準確地預測客戶需求,提高 盈利能力。

  18. 企業的行銷策略管理 現有的客戶可能會帶來新的收益機會,利用交叉銷 售或提升銷售可以使企業獲得銷售額的成長。通 常,企業的業務處理資料是一種特定的資訊來源, 一般僅適用於本企業。

  19. 改變競爭的利基 從資料倉儲中的歷史資料中收集關於客戶的知識, 並經由對實際執行結果的快速回饋來加強這些客戶 知識。

  20. 5.3 資料倉儲的執行技術管理 5.3.1 資料載入的一些問題 • 資料準備區 由於資料倉儲的資料擷取、清理、載入需要較長的 工作時間,因此常常設定一個作為資料準備區的臨 時資料庫,專門用於資料擷取、清理和載入的操 作。

  21. 資料載入方式的選擇 資料載入的方式一般考慮用整批處理。因為資料的 載入活動使用到的系統資源較多,需要資料來源和 資料倉儲的處理器、記憶體和外部儲存設備。

  22. 大批數量資料載入的處理 有的資料源禁止單純的大容量資料載入,這就需要 採用一些特殊的技術來處理大量資料的載入。 大量資料的載入往往會導致資料的更新,而對資料 倉儲的更新,實際上是不允許的,因為資料的更新 將導致資料倉儲中歷史資料的遺失。

  23. 5.3.2 故障回復管理 在故障回復管理中可以採用這樣一些步驟 • 停止包括作業系統 (OS) 在內的伺服器。 • 更新安裝和配置作業系統。 • 更新標定驅動器。 • 重新安裝和配置關係資料庫系統、監控程序和中間元件。 • 對資料進行更新載入和重新索引。

  24. 5.3.3 查詢控制與安全管理 控制對資料倉儲的查詢是一個重要的問題,同時任 務也是相當複雜的,主要由以下多種因素造成: • 資料倉儲應用的公開性與安全之間的矛盾 資料倉儲主要用於企業公開搜集的資料,但是,資 料倉儲的安全性控制則要求限制資料執行的公開 化。這就形成了明顯的矛盾。

  25. 使用者的不同查詢請求 在資料倉儲的操作中,使用者按照不同的彙總程度 查詢資料倉儲內的資料。 • 知識發現程序對安全的影響 大多數使用者經由“知識發現程序”來使用資料倉 儲。由於使用者需要進行深入的探索,安全控制就 與這一程序間產生了矛盾。

  26. 有些隱憂的危害較大,一些不懷好意的使用者可能有些隱憂的危害較大,一些不懷好意的使用者可能 會使大量的資源處於停頓狀態,從而使資料倉儲無 法使用。管理無法控制的查詢、建置臨時報表、將 資源範圍用於使用者側面描述等都能指出這些隱 患。

  27. 5.3.4 資料增加的管理 • 彙總技術 大量使用彙總技術可以明顯地減少資料量。 • 對細剖資料的控制。 控制細剖的程度可以大大減少資料量。 • 歷史資料的限制。 限制必須儲存到資料倉儲中的歷史資料的長度。

  28. 資料使用範圍的限制 利用能夠改變收集資料環境的商業事件知識來限制 必須管理的資料範圍。 • 睡眠資料的移出 有些資料在資料倉儲中長期無人使用。這些原因都 造成了資料倉儲中有大量的睡眠資料。隨著睡眠資 料的增加,導致真正用於查詢處理的實際可用資料 的百分比不斷降低。

  29. 解決這個問題的一種辦法就是找出並移除很少被查解決這個問題的一種辦法就是找出並移除很少被查 詢的資料。將這些很少使用的資料移出資料倉儲, 減少儲存量,便可以提高查詢處理的效率。也可以 採用鄰線儲存系統的二級儲存模式。

  30. 5.4 資料倉儲的超資料管理5.4.1 超資料的儲存、管理與維護 • 超資料的儲存 • 使用商業或資料倉儲資訊目錄。 資訊目錄可以儲存和管理超資料,用於資料倉儲應 用程式。資料倉儲的所有內部程式都可以查詢該目 錄。

  31. 使用超資料庫/資料字典。 超資料庫或資料字典是一種一般意義上的分類方 法,通常用於儲存、分類和管理超資料。

  32. 超資料的管理 • 將超資料組織成易於了解的分類方案。能夠依靠超資料庫或資料字典的資訊,將超資料組織為易於理解的分類方案。 • 績效分析和搜尋有效範圍的能力。具備對資料倉儲的使用進行績效分析和搜尋有效範圍的能力 。

  33. 將設計開發超資料與運作超資料分隔成各自獨立的功能。將設計開發超資料與運作超資料分隔成各自獨立的功能。 將設計開發超資料與運作超資料分離成各自獨立的 功能,一般用於分隔邏輯分析模型和實體資料庫模 型。 • 反應修改歷史的超資料版本資訊 版本資訊能夠反應超資料版本變化的日期以及進行 修改的操作人。

  34. 超資料的維護 在超資料儲存進入系統以後,就需要經常對超資料 進行維護,才能保證超資料的可用性。超資料的維 護方式取決於超資料產生時的收集方式、變化頻率 和超資料量。

  35. 5.4.2 超資料的使用者與使用方法 • 超資料的資料倉儲開發使用者 資料倉儲開發人員使用的超資料主要包括 • 資料源的實體結構。 • 企業資料模型和資料倉儲資料模型。 在資料倉儲開發工作中需要對資料源的超資料進行 分析,根據分析結果在資料源和資料倉儲之間建立 映射。

  36. 超資料的資料倉儲維護使用者 在資料倉儲開發好以後,資料倉儲維護人員需要對 資料倉儲進行維護,超資料在資料倉儲的維護工作 中可以發揮重要的作用。 • 維護人員用超資料能夠了解資料源的變化、資料倉儲的變化對資料倉儲的性能及應用等方面的影響。

  37. 資料倉儲維護人員還可以利用超資料保持資料倉儲的完備性和正確性。 • 資料倉儲維護人員對超資料的使用包括到所有的超資料,並且要求能夠直接對超資料進行查詢。

  38. 超資料的資料倉儲終端使用者 資料倉儲最終使用者對超資料的查詢範圍要遠小於 超資料的資料倉儲開發使用者和維護使用者,但是 對超資料查詢的要求卻要高於其他使用者。 資料倉儲終端使用者在使用超資料時,主要希望能 夠經由超資料了解資料倉儲中有什麼資料,以及這 些資料是從哪些地方來的。

  39. 超資料的使用方法 目前,超資料的使用方法主要有以下幾種: • 超資料與分析資料同時各自顯示, 是指在一台電腦上分別用兩種工具顯示超資料和分 析資料。 • 將超資料作為分析資料的協助工具。 使用者在這種超資料使用方式下,可以利用系統的 協助來了解所查詢的分析資料。

  40. 超資料的直接查詢 超資料的查詢工具可以直接地、動態地查詢超資 料,能為使用者提供最新的協助系統。 • 超資料與分析資料的互動。 超資料與分析資料執行互動以後,使用者在超資料 瀏覽器中瀏覽超資料時,就可以將所選定的表或查 詢自動地輸入查詢工具。

  41. 5.4.3 超資料管理模型 在討論超資料模型時,必須提到超資料交換規則 (MDIS)。這是一個由包括微軟在內的有上百個成員 的超資料聯盟所提出的超資料交換規則,規則涵蓋 了資料庫、檔案、關係、使用者自訂定義、專用超 資料等不同物件類型。

  42. 開發資訊模型

  43. 在開發資訊模型結構中的統一建模語言模型(UML,在開發資訊模型結構中的統一建模語言模型(UML, Unified Modeling Language Model)是其他模型的原 型,其他模型都由此衍生而來。 • UML延伸模型(UML Extension Model)為UML提供了一套彙總的延伸,為建立在UML概念水準上的固定形式提供模型。 • 資料類型模型(DTM,,Data Type Model)為描述資料類型規定了介面,其中包括執行語言和資料庫。

  44. 彙總模型(Gen,Generic Model)為多個資訊模型之間的使用,提供了一系列普遍目的或一般的介面。 • 元件描述模型(CDM,Component Description Model)為即時元件及其規格建立了介面和等級。 • 元件物件模型(COM,Component Object Model)為其本身提供了一係列延伸。

  45. 資料庫模型(DBM,Database Model)描述了企業的資料庫計劃資訊。 • SQL Server模型(Sql,SQL Server Model)用於SQL Server的資料庫模型延伸。 • DB2模型(DB2,DB2 Model)用於Db2的資料庫模型延伸。

More Related