490 likes | 657 Views
Introduction to Data Processing. Data vs. Information Data : Representations facts about various events that affect a business. Information : Data presented in its proper context. Process : Manipulation data with a program.
E N D
Introduction to Data Processing Data vs. Information Data : Representations facts about various events that affect a business. Information : Data presented in its proper context. Process : Manipulation data with a program. ข้อมูล ประกอบด้วย ความเป็นจริง (facts) และตัวเลข (figures) เช่น จำนวน ชม. การทำงานของลูกจ้าง แต่ละคน สารสนเทศ เป็นผลที่ได้จากการจัดการกระทำกับข้อมูล (Data processing) และมีความหมายที่ไม่อาจพบใน ข้อมูลที่เกิดขึ้น
Introduction to Data Processing Data Data Processing Information - Manual - Computerize - Knowledge
กล่าวโดยสรุปการประมวลผลข้อมูลไม่ว่าจะเป็น กล่าวโดยสรุปการประมวลผลข้อมูลไม่ว่าจะเป็น การประมวลผลด้วยมือแบบง่ายๆ หรือจะเป็นการประมวล ผลด้วยเครื่องจักรที่ยุ่งยากซับซ้อน จะต้องประกอบด้วย ส่วนใดส่วนหนึ่งหรือหลายส่วนของขั้นตอนต่างๆ ดังนี้ 1. การสร้างข้อมูล ( Creating ) 2. การจำแนกหมวดหมู่ของข้อมูล ( Classifying ) 3. การจัดลำดับ ( Sorting ) 4. การคำนวณ ( Calculating ) 5. การสรุป ( Summarizing )
6. การเก็บรักษาข้อมูล ( Storing ) 7. การดึงข้อมูลที่ต้องการมาใช้งาน ( Retrieving ) 8. การสร้างข้อมูลชุดใหม่ขึ้นมา ( Reproducting ) 9. การสื่อสารข้อมูล ( Data communicating )
องค์ประกอบระบบสารสนเทศองค์ประกอบระบบสารสนเทศ - Input : activity of capturing and gathering of raw data - Processing : converting and transforming data into information - Output : producing an useful information - Feedback : output that used to make adjustments or changes to input and processing activities - Computerized Information System : การใช้ คอมพิวเตอร์ในการดำเนินงานระบบสารสนเทศ
คุณลักษณะของสารสนเทศที่ดีคุณลักษณะของสารสนเทศที่ดี - ตรงตามความต้องการ (relevant) - ประหยัด (economical) - ถูกต้อง (accurate) - ง่ายต่อการใช้งาน (simple) - ทันสมัย (timely) - ยืดหยุ่น (flexible) - สมบูรณ์ (complete) - ตรวจสอบได้ (verifiable) - เชื่อถือได้ (reliable)
ชนิดของระบบการประมวลผลข้อมูล แบ่งออกเป็น 3 ชนิด คือ 1. การประมวลผลด้วยมือ ( Manual Data Processing ) 2. การประมวลผลด้วยมือแต่มีเครื่องจักรเข้ามาช่วย ( Manual with Machine Assistance Data Processing ) 3. การประมวลผลด้วยเครื่องจักรคอมพิวเตอร์ ( Electronic Data Processing ) ปัจจัยที่จะตัดสินใจว่าจะใช้เครื่องคอมพิวเตอร์ประมวลผลหรือไม่ 1. ขนาดของข้อมูลมีขนาดใหญ่มาก 2. ลักษณะของงานซ้ำๆ กัน 3. ต้องการผลที่ได้ในเวลาอันรวดเร็ว 4. งานที่ต้องใช้การคำนวณที่ยุ่งยากซับซ้อน 5. ค่าใช้จ่าย
Data Organization (การจัดระเบียบข้อมูล) ข้อมูลสำหรับการประมวลผลด้วยเครื่อง คอมพิวเตอร์ สามารถแบ่งตามลักษณะลำดับขั้นได้ เป็น 4 ระดับ ดังนี้คือ 1. ข้อมูลย่อย ( Data Item or Field ) 2. ระเบียน ( Record ) 3. แฟ้มข้อมูล ( File ) 4. ฐานข้อมูล ( Data Base )
ORGANIZING DATA IN A TRADITIONAL FILE ENVIRONMENT File Organization Terms and Concepts • Bit: Smallest unit of data; binary digit (0,1) • Byte: Group of bits that represents a single character • Field: Group of words or a complete number
ORGANIZING DATA IN A TRADITIONAL FILE ENVIRONMENT File Organization Terms and Concepts • Record:Group of related fields • File:Group of records of same type • Database:Group of related files
ORGANIZING DATA IN A TRADITIONAL FILE ENVIRONMENT Data Hierarchy in a Computer System
ORGANIZING DATA IN A TRADITIONAL FILE ENVIRONMENT File Organization Terms and Concepts • Entity: Person, place, thing, event about which information is maintained • Attribute: Description of a particular entity • Key field: Identifier field used to retrieve, update, sort a record
ORGANIZING DATA IN A TRADITIONAL FILE ENVIRONMENT Entitities and Attributes
ORGANIZING DATA IN A TRADITIONAL FILE ENVIRONMENT Traditional File Processing
ORGANIZING DATA IN A TRADITIONAL FILE ENVIRONMENT Problems with the Traditional File Environment • Data redundancy • Program-Data dependence • Lack of flexibility • Poor security • Lack of data-sharing and availability
DATA REDUNDANCY • The presence of duplicate data in multiple data files • Different functions collect the same information independently • May have different meanings in different parts of the organisation
Program Data Dependence • The tight relationship between data stored in files and the specific programs required to update and maintain those files • Every program must describe the nature • In traditional file environment any changes to data requires a change in all programs that access the data • A change in tax rates for example !!
Lack of Flexibility • Traditional File system can deliver routine scheduled reports after a significant programming efforts • An ad hoc/ unanticipated request for information, would require a lot of time • The information is somewhere in the system but too expensive to locate/retrieve • Compiling the data could take weeks
Poor Security • There is little or no control and management of data • Data could be disseminated all over the organisation without control • Who is accessing the data and making changes?
Lack of Data-sharing • Lack of control over access • Hard to get hands on information • Different pieces of information in different files and different physical locations • Since files in different locations can’t be related hard to share or access in a timely manner • Impossible for information to flow freely
Data Base ....... File File File ....... Record Record Record ....... Item Item Item
File เกิดจากการรวมกลุ่มของระเบียน (Records) ที่มีความ สัมพันธ์กัน โดยปกติระเบียนที่อยู่ในแฟ้มข้อมูลหนึ่งๆ จะมีรูปแบบ เดียวกัน (Single format) แต่อาจจะมีหลายรูปแบบ (Multiple format) ก็ได้ ซึ่งการจัดเก็บข้อมูลลงในระเบียนบนแฟ้มข้อมูลนั้น ก็เพื่อวัตถุประสงค์ร่วมกันในการใช้งานแฟ้มข้อมูลนั้นกับงานหนึ่ง งานใดหรือหลายๆงานก็ได้ ตัวอย่าง 4003001 นายกนก ธรรมเลิศ 1 A 0.00 0.00 4003002 น.ส.กรกช บัวงาม 1 B 0.00 0.00 3903001 นายขจร พุทธบูชา 2 A 38.00 76.00 3903002 น.ส.วิภา งามภักดี 2 B 38.00 85.00
ตัวอย่าง 4003002 น.ส.กรกช บัวงาม 1 B 0.00 0.00 MTH161 B 1 CHM101 C 1 LNG102 B 0 3903001 นายขจร พุทธบูชา 2 A 38.00 76.00 MTH261 A 1 MTH241 C 0 สาเหตุที่สำคัญในการสร้างแฟ้มข้อมูลมีดังนี้ 1. มีข้อมูลจำนวนมากเกินขีดจำกัดที่หน่วยความจำหลัก (Memory) จะเก็บไว้ได้ 2. การประมวลผลในขณะใดๆ ต้องการข้อมูลเพียงบาง ส่วนเท่านั้น จึงไม่ต้องเก็บข้อมูลไว้ในหน่วยความจำหลักทั้งหมด
การแยกประเภทแฟ้มข้อมูลตามฟังก์ชันที่ใช้ดำเนิน การแยกประเภทแฟ้มข้อมูลตามฟังก์ชันที่ใช้ดำเนิน การในระบบสารสนเทศ สามารถแยกได้ 5 ประเภท คือ 1. แฟ้มข้อมูลหลัก ( Master File ) 2. แฟ้มข้อมูลรายการเปลี่ยนแปลง ( Transaction File ) 3. แฟ้มข้อมูลรายงาน ( Report File ) 4. แฟ้มข้อมูลดำเนินการ ( Work File ) 5. แฟ้มข้อมูลโปรแกรม ( Program File )
การดำเนินการแฟ้มข้อมูล (File Operation) วิธีการใช้แฟ้มข้อมูลเพื่อการประมวลผลนั้น นับเป็นปัจจัย สำคัญในการกำหนดการจัดแฟ้มข้อมูล ( File Organization ) ว่า ควรจะเป็นแบบใด ซึ่งมีหลักสำคัญ 2 ประการ คือ 1. วิธีการประมวลผล 2. ลักษณะการดำเนินการแฟ้มข้อมูล วิธีการประมวลผล การประมวลผลด้วยโปรแกรมมี 2 แบบ คือ 1. แบบกลุ่ม ( Batch ) 2. แบบโต้ตอบ ( Interactive )
แฟ้มข้อมูล เงินเดือน แฟ้มข้อมูล รายการเปลี่ยนแปลง โปรแกรม Update แฟ้มข้อมูล เงินเดือน ที่ทันสมัย รายงานรายการ เปลี่ยนแปลง โปรแกรมออกรายงานเงินเดือน การประมวลผลแบบกลุ่ม รายงาน เงินเดือน
ใบสั่งซื้อ บันทึกข้อมูล โปรแกรมตัดยอดจำนวนสินค้า แฟ้มข้อมูล สินค้าคงคลัง แสดงรายการ เปลี่ยนแปลง การประมวลผลแบบโต้ตอบ
ลักษณะการดำเนินการแฟ้มข้อมูล การดำเนินการขั้นพื้นฐานแบ่งออกเป็น 4 ลักษณะ คือ 1. การสร้าง ( Creation ) 2. การปรับปรุงแก้ไข ( Updating ) 3. การดึงข้อมูล ( Retrieval ) 4. การบำรุงรักษา ( Maintenance ) - การเปลี่ยนโครงสร้างใหม่ ( Restructuring ) - การเปลี่ยนการจัดแฟ้มข้อมูลใหม่ ( Reorganization )
การจัดแฟ้มข้อมูล ( File Organization ) การจัดแฟ้มข้อมูลเป็นเทคนิคที่ใช้ในการแทนและ เก็บระเบียนในแฟ้มข้อมูล ซึ่งเทคนิคเบื้องต้นของการจัด แฟ้มข้อมูลมี 3 แบบ คือ 1. แบบเรียงลำดับ ( Sequential ) 2. แบบสุ่ม ( Random ) 3. แบบเรียงลำดับเชิงดัชนี ( Indexed Sequential )
การจัดแฟ้มข้อมูลแบบเรียงลำดับ ( Sequential File ) การจัดแฟ้มข้อมูลแบบเรียงลำดับ เป็นการจัดรวบรวม ระเบียน (Records) ตามลำดับจากน้อยไปหามากหรือจากมาก ไปหาน้อยของเขตข้อมูลย่อย(field)หนึ่งของทุกระเบียนใน แฟ้มนั้น ซึ่งจะเรียกเขตข้อมูลย่อยนี้ว่าเป็น คีย์ (Key)ของ ระเบียน การจัดแฟ้มแบบนี้เหมาะกับงานที่มีระยะเวลาในการ ประมวลผลค่อนข้างแน่นอนและต้องการข้อมูลจากแฟ้มเพื่อใช้ ในการประมวลผลแต่ละครั้งเป็นจำนวนมาก
เมื่อต้องการค้นหาข้อมูลในระเบียนที่ต้องการ เครื่อง คอมพิวเตอร์จะอ่านข้อมูลเรียงตามลำดับและเปรียบเทียบคีย์ที่ ต้องการ จนกระทั่งพบระเบียนซึ่งมีคีย์ตามที่ต้องการ การค้น หาข้อมูลในลักษณะนี้จะเสียเวลามาก โดยเฉลี่ยแล้วอ่านระเบียน ประมาณครึ่งหนึ่งของแฟ้มจึงจะพบระเบียนที่ต้องการ สำหรับการ Update ข้อมูลแฟ้มแบบนี้ จะนิยมเก็บ สะสมข้อมูลที่จะเปลี่ยนแปลงเอาไว้ก่อนทั้งนี้เพราะ การค้นหา ข้อมูลครั้งละ 1 ระเบียนต่อการประมวลผล 1 ครั้ง ทำให้เสียเวลา มากดังได้กล่าวแล้ว
Sequential File EMP_NO EMP_NAME AGE WORK_AGE SALARY 1001 นายนาบุญ บัวบูชา 35 5 15000 1003 น.ส.มาลี บุญมาก 25 2 8500 2001 นายมานะ ทำงานดี 30 3 12000 2005 นายวิษณุ งามเลิศ 26 2 8500 3001 นายสามารถ เก่งจริง 28 3 10000 3006 น.ส.วันดี พระงาม 31 3 11000 การค้นหาข้อมูล 2005
การจัดแฟ้มข้อมูลแบบสุ่ม ( Random File ) การจัดแฟ้มข้อมูลแบบสุ่ม เป็นการจัดแฟ้มข้อมูลเพื่อให้ เครื่องสามารถเข้าถึงระเบียนที่ต้องการได้โดยตรง (Direct) และไม่จำเป็นต้องผ่านระเบียนอื่นๆตามลำดับ ซึ่งเป็นผลให้ เวลาที่ใช้ในการค้นหาหรือ Update ระเบียนทำได้เร็วกว่าแบบ Sequential สื่อบันทึกข้อมูลที่ใช้จะต้องเป็นประเภทที่สามารถ เข้าถึงได้โดยตรง เช่น จานแม่เหล็ก การจัดเก็บบันทึกระเบียน จะต้องคำนวณหาที่เก็บบนสื่อโดยคำนวณจาก field ที่เป็น key ของระเบียน ซึ่งมีวิธีการคำนวณหลายแบบแตกต่างกันไป เมื่อ ได้ตำแหน่งแล้วจึงจะบันทึกระเบียนตรงตำแหน่งนั้น
การ Update แฟ้มข้อมูลแบบสุ่มจะทำได้สะดวกและรวด เร็วกว่าแบบ Sequential ทั้งนี้เพราะการ Update จะสามารถ Update ภายใต้แฟ้มข้อมูลเดิมได้ กล่าวคือเมื่อสิ้นสุดการ Update จะไม่เกิดแฟ้มข้อมูลใหม่เหมือนแบบ Sequential เมื่อ ต้องการเพิ่ม ลด หรือเปลี่ยนแปลงระเบียนสามารถทำได้ทันที เหมาะสำหรับงานที่มีระยะเวลาในการประมวลผลไม่แน่นอน ดังนั้นเมื่อเกิดการเปลี่ยนแปลงข้อมูลจะทำการ Update ทันที เพื่อให้ข้อมูลทันสมัยอยู่เสมอ
Random File EMP_NO EMP_NAME WORK_AGE SALARY 1 1001 นายนาบุญ บัวบูชา 5 15000 2 1003 น.ส.มาลี บุญมาก 2 8500 3 2001 นายมานะ ทำงานดี 3 12000 4 2005 นายวิษณุ งามเลิศ 2 8500 5 3001 นายสามารถ เก่งจริง 3 10000 6 3006 น.ส.วันดี พระงาม 3 11000 Record no. การค้นหาข้อมูล 4 2005 Hashing Algorithm
การจัดแฟ้มข้อมูลแบบเรียงลำดับเชิงดัชนีการจัดแฟ้มข้อมูลแบบเรียงลำดับเชิงดัชนี (Indexed Sequential File ) การจัดแฟ้มข้อมูลแบบนี้เป็นการจัดแฟ้มข้อมูลเพื่อให้ เครื่องสามารถเข้าถึงระเบียนที่ต้องการได้ทั้งแบบเรียงลำดับ และแบบสุ่ม สื่อบันทึกข้อมูลที่ใช้จะต้องเป็นประเภทที่ สามารถเข้าถึงได้โดยตรง เช่น จานแม่เหล็ก การจัดเก็บข้อมูล จะแบ่งเป็น 2 ส่วน คือ 1. ส่วนเก็บตารางดัชนี (Index area) เพื่อใช้ในการค้นหา ระเบียน 2. ส่วนเก็บข้อมูล แบ่งเป็น 2 ส่วน คือ 2.1 Prime data area 2.2 Overflow area
Index file Data file Record Location Record Location Key Field Key Data Record 5811 5812 5901 5902
Database Technology • DATABASE: • A collection of data organised to serve many applications efficiently by centralising the data and minimising redundant data.
Figure 7-4 THE DATABASE APPROACH TO DATA MANAGEMENT The Contemporary Database Environment
THE DATABASE APPROACH TO DATA MANAGEMENT Types of Databases • Relational DBMS • Hierarchical and Network DBMS • Object-Oriented Databases
THE DATABASE APPROACH TO DATA MANAGEMENT Relational DBMS • The most popular type of DBMS today for PCs as well as for larger companies and mainframes • Represents all data in DB as two-dimensional tables called relations • Similar to flat files but information in more than one file can easily be extracted and combined • Relates data across tables based on common data element • Examples: DB2, Oracle, MS SQL Server
THE DATABASE APPROACH TO DATA MANAGEMENT Relational Data Model
EMPLOYEE-NO EMPLOYEE-NAME SALARY DEPT-CODE DEPT-NAME DEPT-BONUS 001 Mr. ANAN BOONMA 55000 01 COMPUTER ENGINEER 3 002 Miss BOONSRI MAKMEE 10000 01 COMPUTER ENGINEER 3 003 Mr. TAWAT MEETHEP 7500 02 COMPUTER SOFTWARE 3 004 Miss MALI WONGTHAI 8500 03 ACCOUNT 2 . . .
Key EMPLOYEE EMPLOYEE-NO EMPLOYEE-NAME SALARY DEPT-NO SEQ-NO 01 001 Mr. ANAN BOONMA 55000 01 002 Miss BOONSRI MAKMEE 10000 02 001 Mr. TAWAT MEETHEP 7500 03 001 Miss MALI WONGTHAI 8500 . . DEPT-CODE DEPT-NAME DEPT-BONUS 01 COMPUTER ENGINEER 3 02 COMPUTER SOFTWARE 3 03 ACCOUNT 2 . . . Key DEPARTMENT
SALESPERSON SALESPERSON SALES CUSTOMER CUSTOMER WAREHOUSE WAREHOUSE SALES NUMBER NAME AREA NUMBER NAME NUMBER LOCATION AMOUNT 3462 Waters WEST 18765 DELTA Systems 4 Fargo 13540 3462 Waters WEST 18830 A.Levy and Sons 3 Bismarck 10600 3462 Waters WEST 19242 Ranier Company 3 Bismarck 9700 3593 Dryne EAST 18841 R. W. Flood Inc. 2 Superior 11560 3593 Dryne EAST 18899 Seward Systems 2 Superior 2590 3593 Dryne EAST 19565 Stodola’s Inc. 1 Plymouth 8800 . . . .
SALESPERSON SALES SALESPERSON SALESPERSON SALES NUMBER NAME AREA 3462 Waters WEST 3593 Dryne EAST etc. SALESPERSON CUSTOMER SALES NUMBER NUMBER AMOUNT 3462 18765 13540 3462 18830 10600 3462 19242 9700 3593 18841 11560 3593 18899 2590 3593 19565 8800 etc. WAREHOUSE CUSTOMER CUSTOMER CUSTOMER WAREHOUSE NUMBER NAME NUMBER 18765 Delta Systems 4 18830 A. Levy and Sons 3 19242 Ranier Company 3 18841 R. W. Flood Inc. 2 18899 Seward Systems 2 19565 Stodola’s Inc. 1 etc. WAREHOUSE WAREHOUSE NUMBER LOCATION 4 Fargo 3 Bismarck 2 Superior 1 Plymouth etc. The complete database