การจัดการข้อมูลในคอมพิวเตอร์

การจัดการข้อมูลในคอมพิวเตอร์การจัดการข้อมูลในคอมพิวเตอร์ รหัสแทนข้อมูล การแปลงฐานเลข

ประเภทของข้อมูล ข้อมูลปฐมภูมิ (Primary Data)หมายถึง ข้อมูลที่ได้จากการเก็บรวบรวมหรือบันทึกจากแหล่งข้อมูลโดยตรง เช่น จากการสังเกต การสอบถาม การสัมภาษณ์ การสำรวจ และการจดบันทึก เป็นต้น ซึ่งผู้ต้องการใช้ข้อมูลทำการเก็บรวบรวมเอง ข้อมูลทุติยภูมิ (Secondary Data) หมายถึง ข้อมูลที่ได้จากข้อมูล หรือสารสนเทศที่มีการเก็บรวบรวมข้อมูลไว้แล้ว ผู้ใช้ข้อมูลไม่จำเป็นต้องออกจดบันทึกหรือรวบรวมข้อมูลเอง เช่น สถิติจำนวนผู้ป่วยในโรงพยาบาล สถิติจำนวนผู้ไปใช้สิทธิในการเลือกตั้ง และสถิติอื่นๆ ที่รวบรวมข้อมูลโดยหน่วยงานของรัฐบาลและมีการพิมพ์เผยแพร่

การจัดการข้อมูลในเครื่องการจัดการข้อมูลในเครื่อง • ข้อมูลที่ป้อนเข้าสู่เครื่องคอมพิวเตอร์ที่เป็นตัวเลข ตัวอักษร หรือสัญลักษณ์พิเศษอื่นๆ จะถูกแปลงให้อยู่ในรูปแบบที่คอมพิวเตอร์สามารถเข้าใจได้ กล่าวคือ ข้อมูลที่จัดเก็บจะมีลักษณะเป็นสัญญาณดิจิตอล (สัญญาณไฟฟ้า) ซึ่งลักษณะการแทนข้อมูลต่างๆของคอมพิวเตอร์จะใช้รหัสของเลขฐานสอง (Binary Number) ประกอบด้วยเลข 2 ตัวคือ 0 และ 1 (0 แทนสัญญาณปิด และ1 แทนสัญญาณเปิด) โดยจะนำตัวเลข 0 และ 1 มาประกอบกันเป็นชุดเพื่อใช้แทนตัวอักษร ตัวเลขและสัญลักษณ์ต่างๆ

รหัสแทนข้อมูล • ระบบคอมพิวเตอร์เป็นระบบที่ใช้สัญญาณทางไฟฟ้าในการทำงาน ทำให้มีสองสถานะ คือ เปิด (ON)และ ปิด(OFF)จึงต้องหาวิธีในการแทนที่สถานะสองสถานะนี้ นั่นคือการใช้ เลขฐานสอง (BinaryNumber System)ซึ่งประกอบขึ้นจากเลข 0 และเลข 1 มาแทนความหมายของข้อมูลต่าง ๆ หากพิจารณาเลขฐานสองเพียงหนึ่งหลัก จะเห็นว่าสามารถแทนข้อมูลได้ 2 ชนิดเท่านั้น นั่นคือ0 และ1ในขณะที่เลขฐานสองสองหลักจะสามารถแทนข้อมูลได้ 4 ชนิดคือ 00,01,10 และ 11 ดังนั้น หากต้องการใช้เลขฐานสองในการแทนข้อมูลจำนวนมาก เช่น นำมาแทนตัวอักษรต่างๆทั้งในภาษไทยและภาอังกฤษ ก็จะต้องใช้เลขฐานสองจำนวนหลายหลัก

รหัสแทนข้อมูล รูปที่ 1 รูปแบบการแสดงข้อมูลคอมพิวเตอร์

ตัวเลข 0 และ 1 ของระบบเลขฐานสองแต่ละตัวจะมีหน่วยเรียกว่าบิต (bit) ซึ่งมาจากคำว่า Blnary digit การนำตัวเลข 0 และ 1 เขียนเป็นชุดเพื่อ แทนอักขระต่างๆ โดยทั่วไปจะประกอบด้วยเลข 0 หรือ 1 จำนวน 8 บิตเรียงกัน เป็นหน่วยที่ใหญ่ขึ้น เรียกว่า ไบต์ (byte) แต่ละไบต์จะสามารถแทนอักษร ตัวเลขหรือสัญลักษณ์ได้ 1 ตัว รูปที่ 2 รูปแบบสัญญาณของตัวอักษร A ปิด เปิด ปิด ปิด ปิด ปิด ปิด เปิด 0 1 0 0 0 0 0 1

บิต ไบต์ เวิร์ด  เลข 0 และ 1 ในระบบเลขฐานสองแต่ละตัว เรียกว่า บิต (bit) ย่อมาจากคำว่า Binary Digit บิตเป็นหน่วยที่เล็กที่สุดในการเก็บข้อมูลด้วยคอมพิวเตอร์แต่เนื่องจากบิตเพียงบิตเดียวไม่สามารถเก็บข้อมูลตัวเลข ตัวอักษร และสัญลักษณ์พิเศษต่าง ๆ ได้ครบ ดังนั้นจึงต้องรวมบิตหลายบิตเป็นกลุ่มเรียกว่า ไบต์ (byte) แต่ละไบต์จะใช้แทนอักขระหนึ่งตัว โดยปกติแล้วจะใช้แปดบิตรวมกันเป็นหนึ่งไบต์

ชนิดของรหัสแทนข้อมูล • ชนิดของรหัสแทนข้อมูลรหัส EBCDIC(Extended Binary Code Decimal Interchange Code) • รหัสเอบซีดิค พัฒนาโดยบริษัท ไอบีเอ็ม (IBM) ใช้แทนข้อมูลที่แตกต่างกันได้ทั้งหมด 2 ยกกำลัง 8 หรือ 256 ชนิด การเก็บข้อมูลโดยใช้รหัสเอบซีดิคจะแบ่งรหัสออกเป็นสองส่วนคือ โซนบิต (Zone bits) ซึ่งอยู่ทางด้านซ้ายมีจำนวน 4 บิต และนิวเมอริกบิต (Numeric bits) ในอีก 4 บิตที่เหลือ

รหัส ASCII (American Standard Code for Information Interchange) • รหัสแอสกี เป็นรหัสที่นิยมใช้กันมากจนสามารถนับได้ว่าเป็นรหัสมาตรฐานที่ใช้ในการ สื่อสารข้อมูล (Data Communications) ซึ่งจำเป็นจะต้องใช้รหัสการแทนข้อมูลเป็นระบบเดียวกัน เพื่อให้สามารถรับ-ส่งข้อมูลได้ในความหมายเดียวกัน รหัสแอสกีจะใช้เลขฐานสอง 8 หลักแทนข้อมูลหนึ่งตัวเช่นเดียวกับรหัสเอบซีดิค นั่นคือ 1 ไบต์มีความยาวเท่ากับ 8 บิต รวมทั้งมีการแบ่งรหัสออกเป็นสองส่วนคือ โซนบิตและนิวเมอริก โปรแกรมประยุกต์บางโปรแกรมได้มีการเปลี่ยนแลงการแทนข้อมูลด้วยรหัส ASCII ให้ต่างไปจากมาตรฐาน โดยรหัสข้อมูลบางตัวจะถูกเปลี่ยนวัตถุประสงค์ของการใช้งาน เช่น นำไปแทนการจัดรูปแบบตัวอักษร (formatting) ให้เป็นตัวหนาหรือตัวเอียง เป็นต้น เพราะมีการกำหนดรหัสแทนข้อมูลไม่ตรงกัน

รหัส Unicode • รหัส Unicode • เป็นรหัสแบบใหม่ล่าสุด ถูกสร้างขึ้นมาเนื่องจากรหัสขนาด 8 บิตซึ่งมีรูปแบบเพียง 256 รูปแบบ ไม่สามารถแทนภาษาเขียนแบบต่างๆในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ เช่น ภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว Unicode จะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่งเพียงพอสำหรับอักษรและสัญลักษณ์กราฟิกโดยทั่วไป รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่างๆ ในปัจจุบันระบบ Unicode มีใช้ในระบบปฏิบัติการ Windows NT ระบบปฏิบัติการ UNIX บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ Unicode ในภาษา JAVA ด้วย

การแทนข้อมูลในหน่วยความจำการแทนข้อมูลในหน่วยความจำ หน่วยความจำหลักของคอมพิวเตอร์เป็นที่เก็บข้อมูลและคำสั่งในขณะประมวลผล การเก็บข้อมูลในหน่วยความจำเป็นการเก็บรหัสตัวเลขฐานสองข้อมูลที่ใช้ในการประมวลผลทั้งตัวเลขหรือตัวอักษรจะได้รับการแทนเป็นตัวเลขฐานสอง แล้วเก็บไว้ในหน่วยความจำ เช่น ข้อความว่า BANGKOK เก็บในคอมพิวเตอร์จะแทนเป็นรหัสเรียงกันไป ดังนี้

Bangkok รูปที่ 2.7 แสดงตัวอย่างการแทนข้อความในหน่วยความจำ

หน่วยความจำของไมโครคอมพิวเตอร์ที่ใช้กันอยู่ในขณะนี้ มีขนาด ความกว้าง 8 บิต และเก็บข้อมูลเรียงกันไป โดยมีการกำหนดตำแหน่งซึ่งเรียกว่า เลขที่อยู่ (addressเพื่อให้ข้อมูลที่เก็บมีความถูกต้อง การเขียนหรืออ่านทุกครั้งตรวจสอบความถูกต้องของข้อมูล วิธีที่ง่ายและนิยมใช้กัน คือการเพิ่มอีก 1 บิต เรียกว่า บิตพาริตี (parity bit) บิตพาริตีที่เพิ่มเติมเข้าไปจะทำให้ข้อมูลทั้งหมดในส่วนนั้นมีเลข 1 เป็นจำนวนคู่ หรือจำนวนคี่ เช่น ในไมโครคอมพิวเตอร์เพิ่มอีก 1 บิต เพื่อทำให้เลขหนึ่งเป็นจำนวนคู่ เรียกว่าพาริตีคู่ (even parity) บิตพาริตีที่เติมสำหรับข้อมูลตัวอักษร A และ E เป็นดังนี้ A 01000001 0 <-- บิตพาริตี E 01000101 1 <-- บิตพาริตี

ข้อมูล A มีเลข 1 สองตัว ซึ่งเป็นจำนวนคู่อยู่แล้ว ดังนั้นจึงใส่บิตพาริตีเป็นเลข 0ข้อมูล E มีเลข 1 เป็นจำนวนคี่ จึงใส่บิตพาริตีเป็น 1 เพื่อให้มีเลข 1 เป็นจำนวนคู่ ข้อความ BANGKOK เมื่อเก็บในหน่วยความจำหลักของไมโครคอมพิวเตอร์ที่มีบิตพาริตีด้วยจะเป็นดังรูปที่ 2.7 รูปที่ 2.8 แสดงตัวอย่างการแทนข้อความในหน่วยความจำแบบมีบิตพาริตี

การแทนคำสั่งในหน่วยความจำการแทนคำสั่งในหน่วยความจำ หน่วยควบคุมของคอมพิวเตอร์ที่อยู่ในซีพียู ทำการอ่านคำสั่งจากหน่วยความจำ มาแปลความหมายและกระทำตาม คำสั่งคอมพิวเตอร์พื้นฐานที่สุดเรียกว่า ภาษาเครื่อง (machine language)ภาษาเครื่องมีลักษณะเป็นรหัส ที่ใช้ตัวเลขฐานสอง ตัวเลขฐานสองเหล่านี้แทนชุดรหัสคำสั่ง คอมพิวเตอร์ เครื่องหนึ่งมีคำสั่งที่ใช้ได้หลายร้อยคำสั่ง แต่ละคำสั่งจะมีความหมายเฉพาะ เช่น คำสั่งนำข้อมูลที่มีค่าเป็น 3 จากหน่วยความจำตำแหน่งที่ 8000 มาบวกกับข้อมูลที่มีค่าเป็น 5 ในตำแหน่งที่ 8001 ผลลัพธ์ที่ได้ให้เก็บ ไว้ในหน่วยความจำตำแหน่งที่ 8002 เมื่อเขียนคำสั่งเป็นภาษาเครื่องจะ มีลักษณะเป็นตัวเลขฐานสองเรียงต่อกันเป็นจำนวนมาก ซึ่งเข้าใจได้ยาก จึงมักใช้ตัวอักษรแทนรหัสภาษาเครื่องเหล่านี้ ดังตัวอย่าง

รูปที่ 2.9 แสดงตัวอย่างการแทนคำสั่งภาษาเครื่อง

รหัสภาษาเครื่องเมื่อเก็บอยู่ในหน่วยความจำของคอมพิวเตอร์จะมีลักษณะเรียงต่อกันไป สมมติให้ส่วนของโปรแกรมเก็บใน หน่วยความจำตำแหน่งเริ่มจาก 1000 และข้อมูลเก็บ ไว้ที่ตำแหน่งเริ่มจาก 8000 ดังรูปที่ 2.10

รูปที่ 2.10 การเก็บข้อมูลและคำสั่งลงในหน่วยความจำด้วยรหัสเลขฐานสอง

ภาษาสั่งการพื้นฐานที่ใช้รหัสตัวเลขฐานสองนี้เรียกว่า ภาษาเครื่อง คอมพิวเตอร์ที่ใช้ซีพียูต่างตระกูลกันจะมีภาษาเครื่องที่ต่างกัน เช่น เครื่องที่ใช้ซีพียูเพนเทียมกับซีพียูที่ใช้ในเครื่องแมคอินทอช มีรหัสคำสั่งต่างกัน javascript:if(confirm('http://www.rajsima.ac.th/teacher/c0249/l02/l02.htm \n\nThis file was not retrieved by Teleport Pro, because it is addressed on a domain or path outside the boundaries set for its Starting Address. \n\nDo you want to open it from the server?'))window. location='http://www.rajsima.ac.th/teacher/c0249/l02/l02.htm - top'

2.6 การแปลงฐานเลข2.6.1 การแปลงเลขฐานสิบเป็นฐาน 2 และฐาน 8จงเปลี่ยน 47 ฐาน 10 ให้เป็นเลขฐาน 2วิธีทำ 2 )472 )23 เศษ 12 )11 เศษ 12 )5 เศษ 12 )2 เศษ 12 )1 เศษ 00 เศษ 1คำตอบคือ (101111)2 = 47 จงเปลี่ยน 103 ฐาน 10 ให้เป็นเลขฐาน 8วิธีทำ 8 )1038 )12 เศษ 78 )1 เศษ 40 เศษ 1คำตอบคือ (147)8 = 103

2.6.2 การแปลงเลขฐานอื่น ๆ มาเป็นเลขฐานสิบจงเปลี่ยน (147)8 ให้เป็นเลขฐาน 10วิธีทำ (147)8 = (1 x 82) + (4 x 81) + (7 x 80)= 64 + 32 + 7= 103 จงเปลี่ยน (101111)2 ให้เป็นเลขฐาน 10วิธีทำ (101111)2 = (1 x 25) + (0 x 24) + (1 x 23) + (1 x 22) + (1 x 21) + (1 x 20) = 32 + 0 + 8 + 4 + 2 + 1 = 47

การจัดการข้อมูลในคอมพิวเตอร์

การจัดการข้อมูลในคอมพิวเตอร์

Presentation Transcript

Data Collection of Primary Central Nervous System (CNS) Tumors

Chapter 2: Data Preprocessing

Data Mining

Data Mining

Data Mining

Chapter 5 Data Storage Technology

PRIMARY CENSUS ABSTRACT

Welcome to Shuqun Primary School Primary 1 Orientation 2013

Welcome to Shuqun Primary School Primary 1 Orientation 2013

Secondary data collection

BIG DATA

DATA ANALYSIS

Data Mining: Concepts and Techniques — Chapter 2 —

Data Preprocessing

Data Mining with DB

Data Collection/Data Capture

Secondary Storage Management

Data Mining: Concepts and Techniques

TESTING…

Chapter 2: Data Preprocessing

Publishing biodiversity data through IPT2

Cs257 Summary