140 likes | 302 Views
電子商務期刊論文報告. 應用關聯法則於多磁碟資料庫系統 表格配置之研究 作者 : 黃宇翔、陳鐸仁 第九卷 第四期 2007年12月 ( pp.625~652). 摘要. 資料庫系統資料處理效率在處理速度.記憶體存取速度及容量均已有相當的改善 , 如今資料處理效率的瓶頸在於資料從設備存取至記憶體之速度 以多磁碟資料庫系統之表格配置模式 , 提高資料平行處理的效率. 緒論 (1/3). 資料存取設備的存取速度相對比處理器及記憶體效能進步緩慢 以平行處理技術將資料配置到多磁碟系統中 現今有平行資料陣列 . 多磁碟 . 資料分割 分散式資料庫是另一種多磁碟系統的應用.
E N D
電子商務期刊論文報告 應用關聯法則於多磁碟資料庫系統 表格配置之研究 作者:黃宇翔、陳鐸仁 第九卷 第四期 2007年12月 (pp.625~652)
摘要 • 資料庫系統資料處理效率在處理速度.記憶體存取速度及容量均已有相當的改善,如今資料處理效率的瓶頸在於資料從設備存取至記憶體之速度 • 以多磁碟資料庫系統之表格配置模式,提高資料平行處理的效率
緒論(1/3) • 資料存取設備的存取速度相對比處理器及記憶體效能進步緩慢 • 以平行處理技術將資料配置到多磁碟系統中 • 現今有平行資料陣列.多磁碟.資料分割 • 分散式資料庫是另一種多磁碟系統的應用
緒論(2/3) • 在多磁碟及分散式系統的結構下,資料配置是根據使用交易習慣及經驗來設計,目的在降低資料傳輸時間.降低資料處理成本. • 架構伺服器平行化系統,將多磁碟附掛在同一匯流排多台伺服器系統 • 提供符合實際交易紀錄且自動計算分析結果的演算方法
緒論(3/3) • 關聯法則 • 本研究從企業資料庫管理人員角度著手,將多磁碟資料庫表格配置問題模式化 • 關聯度越高的表格組配置越分散為原則,加上考量每顆磁碟的存取速度.容量大小.表格存取頻率等限制因素,訂定總關聯度最高的目標函數
多磁碟資料庫資料配置問題(1/2) 磁碟#1 磁碟控制系統 磁碟#2 中央處理器 磁碟#i 磁碟#j 磁碟#M
多磁碟資料庫資料配置問題(2/2) 交易紀錄蒐集 關聯法則演算 資料庫表格配置 資料轉換 產生關聯法則 不同配置效率比較 資料萃取及處理 資料探勘 探勘分析運用
多磁碟資料庫表格配置模式(1/2) • 資料萃取及整理 • 資料探勘 • 分析結果及配置方法
多磁碟資料庫表格配置模式(2/2) 探 勘 分 析 運 用 架 構 圖 訂定配置原則 依信賴度大小排序執行 依配置原則進行配置 無未分析法則 尚有未分析法則 剩餘表格依查詢次數大小順序配置 配置後查詢時間與原始隨機配制比較
實作分析(1/4) • 伺服器端-Celeron 1.0G .512M RAM. 7200RPM HD 4顆;OS:Mandrake Linux V8.2;資料庫:Informix Dynamic Sever V9.3;程式介面:Informix 4GL • 運算平台- Celeron 1.0G .512M RAM. 7200RPM HD;OS:MS Windows 2000;資料庫:MS SQL Sever;程式介面:MS VB 6.0
實作分析(2/4) • 模擬系統-使用者數:5(UA.UB.UC.UD.UE) ;應用程式數:12(Q1.Q2.Q3.Q4.Q5.Q6.Q7.P1.P2.P3.P4.P5) ;應用程式總執行次數:50 ;表格數:13(R1~R13) ;資料庫:4(系統用#1.實驗資料用#2.#3.#4)
實作分析(3/4) 程式 R1 R2 R3 磁碟#1 (資料庫#1) synonymous R1 R3 R2 磁碟#2 (資料庫#2) 磁碟#3 (資料庫#3) 磁碟#4 (資料庫#4)
結論 • 系統執行模式規律性.重複性越高,越適合應用在本研究方法 • 部分資料庫無查詢的Trigger功能,僅有新增.修改.刪除的Trigger,因此上述部分仍能應用本研究的關聯分析,查詢則無法使用 • 未來考量更快速的演算方法,甚至其他研究方法如類神經網路.可反應出短時間內的表格分群關係,較即時地微調表格配置