760 likes | 1.15k Views
Chapter 3 Data Management. เนื้อหา. ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) แหล่งข้อมูล (Data Source) การเก็บรวบรวมข้อมูลและปัญหาที่เกิดขึ้น ฐานข้อมูล (Database) ระบบจัดการฐานข้อมูล (Database Management System: DBMS) ชนิดของฐานข้อมูล
E N D
เนื้อหา • ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) • แหล่งข้อมูล (Data Source) • การเก็บรวบรวมข้อมูลและปัญหาที่เกิดขึ้น • ฐานข้อมูล (Database) • ระบบจัดการฐานข้อมูล (Database Management System: DBMS) • ชนิดของฐานข้อมูล • เทคโนโลยีฐานข้อมูล (Database Technology) • การแสดงผลข้อมูลในระบบสนับสนุนการตัดสินใจ
ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge)(1/3) • ข้อมูล (Data) คือ ข้อเท็จจริงเกี่ยวกับสิ่งต่าง ๆ ซึ่งอาจเป็นคน สัตว์ สิ่งของ หรือเหตุการณ์ต่าง ๆ ที่ยังไม่ผ่านการประมวลผล โดยที่ข้อมูลอาจอยู่ในรูปของตัวเลข ตัวอักษร ข้อความ หรือ Multimedia ก็ได้ เนื่องจากข้อมูลเป็นส่วนประกอบที่สำคัญของระบบสารสนเทศรวมทั้งระบบสนับสนุนการตัดสินใจ จึงต้องเป็นข้อเท็จจริงที่ถูกต้อง ครบถ้วน สมบูรณ์ และน่าเชื่อถือ
ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge)(2/3) • สารสนเทศ (Information) คือ ข้อมูลที่ผ่านการประมวลผล และจัดการให้มีความถูกต้อง ทันสมัย และสามารถนำไปใช้งานได้ตามที่ต้องการ Process & Transform Data Information
ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge)(3/3) Correct use of Knowledge Collection of all Information Process & Transform • องค์ความรู้ (Knowledge) คือ สารสนเทศที่ถูกคัดเลือกเพื่อใช้ในการแก้ปัญหาต่าง ๆ ตามต้องการได้อย่างมีประสิทธิภาพ โดยอาศัยประสบการณ์ในการเลือกสารสนเทศมาใช้ในการแก้ไขปัญหาได้อย่างเหมาะสม Wisdom Knowledge Information Data
แหล่งข้อมูล (Data Source) • แหล่งข้อมูลภายในองค์กร (Internal Data Source) • แหล่งข้อมูลภายนอกองค์การ (External Data Source)
การเก็บรวบรวมข้อมูลและปัญหาที่เกิดขึ้นการเก็บรวบรวมข้อมูลและปัญหาที่เกิดขึ้น • วิธีการรวบรวมข้อมูล • ปัญหาของข้อมูล • คุณภาพของข้อมูล • ข้อแนะนำเกี่ยวกับข้อมูลก่อนนำเข้าสู่ระบบสนับสนุนการตัดสินใจ
วิธีการรวบรวมข้อมูล • การศึกษาเกี่ยวกับเวลาในการปฏิบัติงานต่าง ๆ (Time Study) • การสำรวจ (Survey) • การสังเกตการณ์ (Observation) • การสัมภาษณ์ (Interview)
ปัญหาของข้อมูล • ข้อมูลมีความผิดพลาด • ข้อมูลไม่ทันต่อการใช้งาน • ข้อมูลไม่เหมาะสมกับการใช้งาน • ข้อมูลที่ต้องการไม่มีอยู่ในระบบ
คุณภาพของข้อมูล (Data Quality) • คุณภาพโดยทั่วไปของข้อมูล ความสอดคล้องของข้อมูล สามารถนำไปใช้ประโยชน์ ทันต่อความต้องการ และมีความครบถ้วนสมบูรณ์ • คุณภาพโดยธรรมชาติของข้อมูล ความถูกต้อง และความน่าเชื่อถือ • การเข้าถึงข้อมูล ความสามารถในการเข้าถึง และความปลอดภัยของข้อมูล • การนำเสนอข้อมูล การสื่อความหมาย ง่ายต่อการใช้งาน กระชับ และมีเนื้อหาที่สอดคล้องกัน
ข้อแนะนำเกี่ยวกับข้อมูลก่อนนำเข้าสู่ระบบสนับสนุนการตัดสินใจข้อแนะนำเกี่ยวกับข้อมูลก่อนนำเข้าสู่ระบบสนับสนุนการตัดสินใจ • ตรวจสอบความถูกต้อง และความสมบูรณ์ของข้อมูล • ตรวจสอบความทันสมัยของข้อมูล • ตรวจสอบปริมาณข้อมูล
ฐานข้อมูล (Database) กลุ่มของแฟ้มข้อมูลที่มีความสัมพันธ์กันและถูกนำมารวมกัน เช่น ฐานข้อมูลในบริษัทแห่งหนึ่งอาจประกอบไปด้วยแฟ้มข้อมูลหลายแฟ้ม โดยที่แต่ละแฟ้มจะมีความสัมพันธ์กัน ได้แก่ ข้อมูลพนักงาน ข้อมูลแผนกในบริษัท ข้อมูลลูกค้า ข้อมูลสินค้า ข้อมูลการขาย
ข้อดีของการใช้ระบบฐานข้อมูลข้อดีของการใช้ระบบฐานข้อมูล • ข้อมูลเป็นอิสระจากโปรแกรมที่ใช้งานข้อมูล (Data Independence) • ลดความซ้ำซ้อนของข้อมูล (Data Redundancy) • หลีกเลี่ยงความไม่สอดคล้องของข้อมูล (Data Inconsistency) • ความถูกต้องของข้อมูล (Data Integrity) • รูปแบบที่เป็นมาตรฐานเดียวกัน • ความปลอดภัยของข้อมูล (Data Security) • นำเสนอรายงานได้ง่าย (Easy Reporting) • สามารถควบคุมการเข้าถึงข้อมูลจากผู้ใช้หลายคน (Concurrency Control) • ตอบสนองความต้องการใช้งานข้อมูลได้หลายแบบ
ระบบจัดการฐานข้อมูล (Database Management System: DBMS) • ความหมายของระบบจัดการฐานข้อมูล • หน้าที่ของระบบจัดการฐานข้อมูล • ประโยชน์ของระบบจัดการฐานข้อมูล
DBMS: ความหมายของระบบจัดการฐานข้อมูล โปรแกรมที่ทำหน้าที่เป็นตัวกลางการทำงานระหว่างผู้ใช้งานฐานข้อมูลกับฐานข้อมูล เพื่ออำนวยความสะดวกผู้ใช้ ในการสร้าง ลบ ปรับปรุง สืบค้น และเรียกใช้ข้อมูล ฐานข้อมูล ผู้ดูแลฐานข้อมูล (DBA) DBMS Application ผู้ใช้ (User)
DBMS: หน้าที่ของระบบจัดการฐานข้อมูล • การจัดเตรียมมุมมองของผู้ใช้ (User View) • การสร้างและแก้ไขฐานข้อมูล • การจัดเก็บและเรียกใช้ข้อมูล • การดำเนินงานกับข้อมูลและการสร้างรายงาน
DBMS: ประโยชน์ของระบบจัดการฐานข้อมูล • ผู้ใช้สามารถใช้ข้อมูลร่วมกันได้ • ผู้ใช้มีความสะดวกและรวดเร็วในการสืบค้นข้อมูล • ลดความซ้ำซ้อนของการจัดเก็บข้อมูล • สามารถควบคุม ความถูกต้องและความสอดคล้องของข้อมูล
ชนิดของฐานข้อมูล • ฐานข้อมูลแบบลำดับชั้น (Hierarchical Database) • ฐานข้อมูลแบบเครือข่าย (Network Database) • ฐานข้อมูลเชิงสัมพันธ์ (Relational Database) • ฐานข้อมูลเชิงวัตถุ (Object-Oriented Database)
ชนิดของฐานข้อมูล : ฐานข้อมูลแบบลำดับชั้น (Hierarchical Database) คุณอุทัย เซี่ยงเจ็น คุณยายไฮ A1 A2 A3 A2 A3 B1 รหัสสินค้า ตะปู ปูน สี ปูน สี จอบ ชื่อสินค้า ปริมาณ 250 15 150 100 50 10
ชนิดของฐานข้อมูล : ฐานข้อมูลแบบเครือข่าย (Network Database) คุณอุทัย เซี่ยงเจ็น คุณยายไฮ A1 A2 A3 B1 รหัสสินค้า ตะปู ปูน สี จอบ ชื่อสินค้า ปริมาณ 250 115 200 10
ชนิดของฐานข้อมูล : ฐานข้อมูลเชิงสัมพันธ์ (Relational Database) Customer Order Product
ชนิดของฐานข้อมูล : ฐานข้อมูลเชิงวัตถุ (Object-Oriented Database) Cust_ID = 001 Cust_Name = อุทัย เซี่ยงเจ็น Cust_ID = 002 Cust_Name = มานี มีนา
เทคโนโลยีฐานข้อมูล (Database Technology) • คลังข้อมูล (Data Warehouse) • การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (Online Analytical Processing: OLAP) • เหมืองข้อมูล (Data Mining)
เทคโนโลยีฐานข้อมูล : คลังข้อมูล (Data Warehouse) • ความหมายของคลังข้อมูล • คุณลักษณะของคลังข้อมูล • ข้อดี / ข้อเสีย ของคลังข้อมูล • สถาปัตยกรรมของคลังข้อมูล • การวิเคราะห์ข้อมูลในคลังข้อมูล
คลังข้อมูล (Data Warehouse): ความหมายของคลังข้อมูล หลักการการหรือวิธีการเพื่อการรวมระบบสารสนเทศเพื่อการประมวลผลรายการข้อมูลที่เกิดขึ้นในแต่ละวันในแต่ละสายงาน มารวมเป็นหน่วยเดียวกัน เพื่อสนับสนุนกระบวนการตัดสินใจของผู้ตัดสินใจให้มีประสิทธิภาพมากยิ่งขึ้น
คลังข้อมูล (Data Warehouse): คุณลักษณะของคลังข้อมูล • Subject-Oriented : ข้อมูลถูกจัดเก็บตามประเด็นหลักขององค์กร เช่น ข้อมูลลูกค้า สินค้า และยอดขาย เป็นต้น • Integrated: รวบรวมและจัดรูปแบบข้อมูลให้อยู่ในรูปแบบเดียวกัน และสร้างความสอดคล้องให้กับข้อมูลก่อนที่จะนำเสนอแก่ผู้ใช้ • Time-Variant: ข้อมูลที่จัดเก็บในคลังข้อมูลส่วนใหญ่จะเป็นข้อมูลในอดีตที่ผ่านมาแล้ว 5-10 ปีทำให้เราสามารถเห็นแนวโน้มของข้อมูลได้ • Non-Volatile: ข้อมูลที่จัดเก็บภายในคลังข้อมูล จะไม่ถูกแก้ไข แต่จะถูกเพิ่มข้อมูลใหม่ต่อท้าย โดยไม่ทำการแทนที่ข้อมูลเดิม
ข้อดี ให้ผลการตอบแทนจากการลงทุนสูง องค์กรเกิดความได้เปรียบคู่แข่งขัน เพิ่มประสิทธิภาพในการตัดสินใจของผู้ตัดสินใจ ข้อเสีย ขั้นตอนการกลั่นกรองและโหลดข้อมูลเข้าสู่คลังข้อมูลใช้เวลานาน และต้องอาศัยผู้ที่มีความชำนาญ แนวโน้มความต้องการข้อมูลมีมากขึ้นเรื่อย ๆ ใช้เวลานานในการพัฒนาคลังข้อมูล ระบบคลังข้อมูลมีความซับซ้อนสูง คลังข้อมูล (Data Warehouse): ข้อดี / ข้อเสีย ของคลังข้อมูล
คลังข้อมูล (Data Warehouse): สถาปัตยกรรมของคลังข้อมูล (1/2) Data Provisioning Area Data Staging Area Data Warehouse Database Data Data Data Data Data Acquisition System Metadata Metadata Metadata Terminal Metadata Metadata Repository
คลังข้อมูล (Data Warehouse): สถาปัตยกรรมของคลังข้อมูล (2/2) • Data Acquisition System : ทำหน้าที่รับข้อมูลจากภายใน/นอกองค์กร • Data Staging Area : ทำหน้าที่ Cleansing & Filtering ตรวจสอบความถูกต้องในเบื้องต้น • Data Warehouse Database: บันทึกข้อมูลต่าง ๆ ที่จำเป็นสำหรับองค์กร • Data Provisioning Area หรือ Data Mart: เหมือน Data Warehouse Database แต่ขอบเขตเนื้อหาข้อมูลจะแคบกว่า คือ เพื่อกลุ่มงานใดกลุ่มงานหนึ่ง • End Users Terminal : นำเสนอผลลัพธ์ออกจากหน้าจอ เช่น Simple Reporting Tools, Multi-Dimensional Tools หรือ Data Mining Tools ก็ได้ • Metadata Repository: เป็นพื้นที่สำหรับเก็บข้อมูลต่าง ๆ ที่จำเป็นสำหรับควบคุมการทำงานและควบคุมข้อมูลในคลังข้อมูล
คลังข้อมูล (Data Warehouse):การวิเคราะห์ข้อมูลในคลังข้อมูล (1/2) ความยุ่งยากมีน้อย ใช้ปริมาณข้อมูลน้อย ใช้เวลาในการประมวลผลหรือเตรียมข้อมูลน้อย ความยุ่งยากมีมาก ใช้ปริมาณข้อมูลมาก ใช้เวลาในการประมวลผลหรือเตรียมข้อมูลมาก Query and Report Multidimensional Data Analysis Data Mining มีเครื่องมือช่วยในการสร้างมากมาย มีเครื่องมือช่วยในการสร้างน้อย
คลังข้อมูล (Data Warehouse): การวิเคราะห์ข้อมูลในคลังข้อมูล (2/2) ผล แหล่งข้อมูลเพื่อ การปฏิบัติงาน Report Generator รายงาน ข้อมูล การใช้งาน ข้อมูล Data Mining Tools ผล Data Warehouse ข้อมูล การใช้งาน ผู้ใช้งาน แหล่งข้อมูลเพื่อ การวิเคราะห์ OLAP Generator ผล ข้อมูล คลังข้อมูล ช่วงเวลาที่องค์กรไม่ได้ปฏิบัติงาน ช่วงเวลาที่องค์กรปฏิบัติงาน
เทคโนโลยีฐานข้อมูล : OLAP • ความหมายของ OLAP • Multidimensional Database • การดำเนินการกับ OLAP • ประโยชน์ของ OLAP
OLAP: ความหมายของ OLAP กระบวนการประมวลผลข้อมูลทางคอมพิวเตอร์ ที่ช่วยให้ผู้ใช้สามารถวิเคราะห์ในมิติต่าง ๆ (Multidimensional Data Analysis) ของข้อมูลได้ง่ายขึ้น เช่น ผู้ใช้ต้องการเปรียบเทียบข้อมูลยอดการขายบะหมี่กึ่งสำเร็จรูปในเดือนมีนาคม เทียบกับเดือนกันยายน และเทียบกับสินค้าอื่น ๆ ในช่วงเวลาเดียวกัน
OLAP: Multidimensional Database(1/4) ฐานข้อมูลที่ใช้ในการจัดการและจัดเก็บข้อมูลให้สามารถ แสดงผลข้อมูลในมิติต่าง ๆ ได้ ซึ่งเป็นการพัฒนาต่อมาจากฐานข้อมูลเชิงสัมพันธ์ให้มีความสามารถมากยิ่งขึ้น เพื่อรองรับการประมวลผลเชิงวิเคราะห์
OLAP: Multidimensional Database(2/4) จังหวัด ไตรมาส
กทม. มือถือ 750,000 800,000 825,000 680,000 บัตรเติมเงิน 550,000 600,000 650,000 500,000 500,000 550,000 650,000 600,000 325,000 250,000 200,000 260,000 OLAP: Multidimensional Database(4/4) จังหวัด ชม. มือถือ สินค้า บัตรเติมเงิน 1 2 3 4 ไตรมาส
OLAP: การดำเนินการกับ OLAP • Roll up และ Drill Down • Roll up เป็นกระบวนการเปลี่ยนแปลงระดับความละเอียดของการพิจารณาข้อมูล จากส่วนของรายละเอียดมาก จนมาเป็นข้อมูลสรุป • Drill Down เป็นกระบวนการเปลี่ยนแปลงระดับความละเอียดของการพิจารณาข้อมูล จากข้อมูลสรุป จนมาเป็นข้อมูลในส่วนรายละเอียด • Slice and Dice • Slice เป็นการเลือกพิจารณาผลลัพธ์บางส่วนที่เราสนใจ โดยการเลือกเฉพาะค่าที่ถูกกำกับด้วยข้อมูลบางค่าของแต่ละมิติ • Dice เป็นกระบวนการพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป
การดำเนินการกับ OLAP: Roll upและ Drill Down (1/2) Region Roll up Drill Down Region-Product Type Roll up Drill Down Region-Shop-Product Type
การดำเนินการกับ OLAP: Roll up และ Drill Down (2/2) Region-Shop-Product Type Roll up Drill Down Region-Shop-Product Type-Product Type
Source Cube ABC 10,000 20,000 10,000 North 10,000 25,000 6,000 Platter Slice 8,000 10,000 23,000 10,000 500 Five Mart South ABC 10,000 20,000 10,000 Fish Meat Pork Med. Pencil North 10,000 25,000 Glossary Misc. Platter 8,000 10,000 23,000 Five Mart South Slice Fish Meat Pork ABC 10,000 20,000 10,000 Glossary North 10,000 25,000 6,000 Platter 8,000 10,000 23,000 10,000 500 Five Mart South Fish Meat Pork Med. Pencil Glossary Misc. การดำเนินการกับ OLAP: Slice (1/2)
การดำเนินการกับ OLAP: Slice (2/2) Slice:-Glossary
Shop Date Product Type Date Shop Product Type การดำเนินการกับ OLAP: Dice (1/2)
การดำเนินการกับ OLAP: Dice (2/2) Shop-Product Type Date-Product Type
OLAP: ประโยชน์ของ OLAP • ช่วยในการวิเคราะห์เปรียบเทียบข้อมูลในมุมต่าง ๆ ทำให้การตัดสินใจมีประสิทธิภาพมากขึ้น • ผู้ใช้แต่ละคนสามารถสร้างมุมมองข้อมูลของตนเองได้ เพื่อนำไปใช้ในงานเฉพาะด้าน • มีความรวดเร็วในการสอบถามข้อมูล แม้ในฐานข้อมูลขนาดใหญ่และมีความซับซ้อนมาก • ทำให้ได้รับข้อมูลมุมมองใหม่ ๆ สำหรับประกอบการตัดสินใจ
เทคโนโลยีฐานข้อมูล : เหมืองข้อมูล(Data Mining) • ความหมายของเหมืองข้อมูล • เทคนิคในการทำเหมืองข้อมูล • คุณลักษณะของเหมืองข้อมูล • ประโยชน์ของเหมืองข้อมูล • ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน
เหมืองข้อมูล (Data Mining) : ความหมายของเหมืองข้อมูล การวิเคราะห์ข้อมูล เพื่อแยกประเภท จำแนกรูปแบบและความสัมพันธ์ของข้อมูลจากฐานข้อมูลขนาดใหญ่หรือคลังข้อมูล และนำสารสนเทศที่ได้ไปใช้ในการตัดสินใจธุรกิจ ดังนั้นผู้ที่ไม่มีความเชี่ยวชาญด้านการเขียนโปรแกรมคอมพิวเตอร์ ก็สามารถค้นหาข้อมูลต่าง ๆ ได้อย่างรวดเร็ว การวิเคราะห์ข้อมูลโดยใช้เทคนิคบางประการเพื่อค้นหาข้อมูลที่ถูกซ่อนอยู่ จำแนกและเชื่อมโยงความสัมพันธ์ของข้อมูลเหล่านั้นจากคลังข้อมูล ทำให้ค้นพบรูปแบบความสัมพันธ์ที่ไม่เคยมีมาก่อนจนกลายเป็นการค้นพบองค์ความรู้ใหม่ (Knowledge Discovery) ซึ่งเป็นวัตถุประสงค์หลักของการทำเหมืองข้อมูล ซึ่งองค์ความรู้ใหม่ที่ได้อาจรวมถึงกฎ (Rules) บางอย่างเพื่อใช้เป็นแนวทางในการตัดสินใจ และประเมินผลลัพธ์การตัดสินใจได้
เหมืองข้อมูล (Data Mining) : เทคนิคในการทำเหมืองข้อมูล • Classification • Clustering • Association • Visualization
เทคนิคในการทำเหมืองข้อมูล : Classification (1/4) เป็นเทคนิคในการจำแนกกลุ่มข้อมูลด้วยคุณลักษณะต่าง ๆ ที่ได้มีการกำหนดไว้แล้ว เทคนิคประเภทนี้เหมาะกับการสร้างแบบจำลองเพื่อการพยากรณ์ค่าข้อมูล (Predictive Modeling) ในอนาคต จากการที่ได้จำแนกกลุ่มข้อมูลตัวอย่างไว้แล้ว เรียกว่า “Supervised Learning” โดยมี 2 รูปแบบคือ • Tree Induction • Neural Induction
เทคนิคในการทำเหมืองข้อมูล : Classification (2/4) • สมมติว่าต้องการพยากรณ์ว่าลูกค้าที่ปัจจุบันได้เช่าสินทรัพย์อย่างใดอย่างหนึ่งไปแล้ว จะมีโอกาสตัดสินใจซื้อสินทรัพย์ชนิดนั้นไปเป็นของตนเองหรือไม่ ?