250 likes | 350 Views
Introduction to database. 黃獻華. Outline. 資料 vs. 資訊 何謂資料庫與其特性 介紹關聯式 資料庫 系統 簡單介紹 SQL 的語法 應用方面 Data mining References. 資料 vs. 資訊. 資料. 資訊. 資料 (data) : 實際儲存且未經過處理的值 資訊 (information): 已經過處理的且對使用者有意義的值. 什麼是資料庫 (database)?. 可視為一種電子化的檔案櫃 - 儲存電腦化資料檔的處所 相關資料的收集處所.
E N D
Outline • 資料 vs. 資訊 • 何謂資料庫與其特性 • 介紹關聯式資料庫系統 • 簡單介紹SQL的語法 • 應用方面 • Data mining • References
資料 vs. 資訊 資料 資訊 • 資料(data) : 實際儲存且未經過處理的值 • 資訊(information): 已經過處理的且對使用者有意義的值
什麼是資料庫(database)? • 可視為一種電子化的檔案櫃 - 儲存電腦化資料檔的處所 • 相關資料的收集處所
資料庫系統(Database system) • 使用者(user) • 軟體(software) – database management system (DBMS) • 硬體(hardware) • 資料(data)
了解資料庫管理系統(DBMS) 處理所有對資料庫存取的軟體 資料庫 SQL commands DBMS 應用程式
資料庫特性 • 長存資料 • 實體與關係 • 性質(property) jbs住在Chapel Hill 性質 實體
為何使用資料庫 • 簡潔 (compactness) • 訊速 (speed) • 節省人力 (less drudgery) • 即時性 (currency) • 可以減少重複 • 可以避免不一致 • 資料獨立於程式之外 • 資料可以共用 • 安全性限制 你看,有多方便啊!
關聯式資料庫系統(Relational Databases) • 今日主流 • 關聯性 (relation) • 資料都是表格 • 從舊表格產生新的表格 • 橫列(columns) : attributes • 直行(rows): 實體(entities) • Superkey
Attribute Entity 橫列子集 SQL command 直行子集 關聯式例子 : wms 住在 Binghampton
資料庫語言 • 一個關聯資料庫需要以下的操作 • 查詢資料 • 改變資料:新增,刪除,更新等 • 控制資料:使用者權限,確定資料變更等 • 那就是要用SQL啦!
認識SQL語法 • 處理關聯式資料庫的標準程式語言 • Data definition language (DDL) – 資料庫管理員操作的 • Data manipulation language (DML) – 終端使用者操作的
簡單的SQL指令 • CREATE DATABASE databasename; • USE databasename; • CREATE TABLE Song (Title varchar(20) not null, Artist varchar(16) not null, Album varchar(20), Time char(5) ); • INSERT INTO Song VALUES ("Roundabout", "Yes", "Fragile", "9:35"); • SELECT * from Song; Almost similar to English language
SQL的使用方式 • 在線上直接輸入SQL指令 • 使用高階語言如C/C++, Fortran, PHP等呼叫SQL
資料庫之應用 • Oracle • Informix • Sybase • Microsoft access • Open source : PostgreSql and MySql
全球資料成長率 • 全世界資料庫的資料量每20個月就增加一倍 • 很多大公司需要管理的資料量到達terabytes(1012) • 資訊量的成長速度遠超過人類的分析能力
為何用Data Mining? • We are drowning in data, but starving for knowledge! • 在龐大的資料中,可能隱藏了很多重要的知識 • 美國的一項研究報告更是將Data Mining視為二十一世紀十大明星產業 • Times時代雜誌曾預估:“Data Mining將是21世紀最熱門之五大新興行業“
在龐大的數據庫中尋找出有價值的隱藏事件. 什麼是Data Mining?
Data Mining 的工作循環 應用的領域包括金融業、保險業、零售業、直效行銷業、通訊業、制造業以及醫療服務業等。
References • Data Management – Richard T. Watson • A first course in database systems – Jeffrey D. Ullman & Jennifer Widom • 資料庫系統概論 – C.J. Date • http://www.gss.com.tw/eis/12/datamini.htm