ชนิดของรหัสแทนข้อมูล
ในทางทฤษฎีแล้วผู้ใช้สามารถกำหนดรหัสแทนอักขระใด ๆได้เองจากกลุ่มของเลขฐานสอง 8 บิต แต่ในความเป็นจริงนั้นทำไม่ได้เพราะหากทำเช่นนั้นอาจเกิดปัญหาระหว่างเครื่องสองเครื่องที่ใช้รหัสต่างกันเปรียบเทียบได้กับคนสองคนคุยกันคนละภาษาดังนั้นจึงควรมีการกำหนดรหัสแทนข้อมูลที่เป็นสากล เพื่อให้เครื่องคอมพิวเตอร์ต่าง ๆสามารถสื่อสารกันได้ รหัสแทนข้อมูลที่นิยมใช้กันในปัจจุบัน คือ
รหัส EBCDIC (Extended Binary Code Decimal Interchange Code)
รหัสเอบซีโคดพัฒนาโดยบริษัทไอบีเอ็มใช้แทนข้อมูลที่แตกต่างกันได้ทั้งหมด 2 หรือ 256 ชนิดการเก็บข้อมูลโดยใช้รหัสเอบซีดิกจะแบ่งรหัสออกเป็นสองส่วน คือโซนบิต (Zone bits)ซึ่งอยู่ทางด้านซ้ายมีจำนวน 4 บิตและนิวเมอริกบิต (Numeric bits)ในอีก 4 บิตที่เหลือ
รหัส ASCII (American Standard Code for Information Interchange)
รหัสแอสกี เป็นรหัสที่นิยมใช้กันมากจนสามมารถนับได้ว่าเป็นรหัสมาตรฐานที่ใช้ในการสื่อสารข้อมูล ( Data Communications) ซึ่งจำเป็นต้องใช้รหัสการแทนข้อมูลเป็นระบบเดียวกันเพื่อให้สามารถรับ - ส่งข้อมูลได้ในความหมายเดียวกัน รหัสแอสกีใช้เลขฐานสอง 8 หลักแทนข้อมูลหนึ่งตัวเช่นเดียวกับรหัสเอบซีดิค นั่นคือ 1 ไบต์มีความยาวเท่ากับ 8 บิต รวมทั้งมีการแบ่งรหัสออกเป็นสองส่วน คือโซนบิตและนิวเมอริกบิตเช่นเดียวกัน
อักขระ
|
รหัสEBCDIC
|
รหัสASCII
|
อักขระ
|
รหัสEBCDIC
|
รหัสASCII
|
A
|
11000001
|
01000001
|
0
|
11110000
|
00110000
|
B
|
11000010
|
01000010
|
1
|
11110001
|
0011001
|
C
|
11000101
|
01000011
|
2
|
11110010
|
00110010
|
:
|
:
|
:
|
3
|
11110011
|
00110011
|
X
|
11100111
|
01011000
|
:
|
:
|
:
|
Y
|
11101000
|
01011001
|
:
|
:
|
:
|
Z
|
11101001
|
01011010
| |||
:
|
:
|
:
| |||
:
|
:
|
:
|
แสดงตัวอย่างการแทนข้อมูลด้วรหัส EBCDIC และ ASCII
โปรแกรมประยุกต์บางโปรแกรมได้มีการเปลี่ยนแปลงการแทนข้อมูลด้วยรหัสACSII ให้ต่างไปจากมาตรฐาน โดยรหัสการจัดรูปแบบตัวอักษร (formatiing) ให้เป็นตัวหนาหรือตัวเอียง เป็นต้น ทำให้โปรแกรมอื่น ๆไม่สามารถอ่านข้อมูลที่ถูกสร้างขึ้นจากโปรแกรมประเภทนี้ได้เพราะมีการกำหนดรหัสแทนข้อมูลไม่ตรงกัน
รหัส UniCode
เป็นรหัสแบบใหม่ล่าสุดถูกสร้างขึ้นมาเนื่องจากรหัสขนาด 8 บิตซึ่งมีรูปแบบเพียง 256 รูปแบบไม่สามารถแทนภาษาเขียนแบบต่าง ๆ ในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ เช่นภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว
UniCodeจะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่งเพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไปรวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ ในปัจจุบันระบบ UniCodeมีใช้ในระบบปฏิบัติการ Window NTระบบปฏิบัติการ UNIX บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCodeในภาษา JAVA ด้วย
UniCodeจะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่งเพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไปรวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ ในปัจจุบันระบบ UniCodeมีใช้ในระบบปฏิบัติการ Window NTระบบปฏิบัติการ UNIX บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCodeในภาษา JAVA ด้วย
รหัสแทนข้อมูล
คอมพิวเตอร์ที่ใช้กันในปัจจุบันเป็นอุปกรณ์อิเลคทรอนิกส์ที่ทำงานแบบดิจิทัล เมื่อผู้ใช้ป้อนข้อมูลเข้าสู่เครื่องคอมพิวเตอร์ คอมพิวเตอร์จะทำการแปลงข้อมูลนั้นเป็นเลขฐานสอง (Binary number system) ซึ่งประกอบด้วยเลข 0 และ เลข 1 ซึ่งเรียกว่า รหัสแทนข้อมูล โดยเป็นรหัสที่ใช้แทน ข้อมูลต่าง ๆ ซึ่งอยู่ภายในเครื่องคอมพิวเตอร์ หรือสื่อบันทึกข้อมูลต่าง ๆ เพื่อให้คอมพิวเตอร์และผู้ใช้สามารถเข้าใจข้อมูลต่าง ๆ ได้
รหัสที่ใช้ในการแทนข้อมูลในปัจจุบันมี 2 กลุ่ม คือ
1. รหัสเอ็บซีดิก (EBCDIC): Extended Binary Coded Decimal Interchange Code)เครื่องคอมพิวเตอร์เมนเฟรมของไอบีเอ็มยังคงใช้รหัสนี้
2. รหัสแอสกี (ASCII): American Standard Code Information Interchange) เป็นมาตรฐานที่นิยมใช้กันมาก ในระบบคอมพิวเตอร์ เป็นรหัส 8 บิท แทนสัญลักษณ์ต่าง ๆ ได้ 256 ตัว
การวัดขนาดข้อมูลหรือหน่วยวัดความจำ
หน่วยที่ใช้วัดความจำที่เล็กที่สุด คือ ไบต์ (Byte) ซึ่งหมายถึง จำนวนตัวเลขในระบบเลขฐานสองที่ต่อเนื่องกันเป็นกลุ่มแต่ละตัวเรียกว่า บิต (bit) เช่น 01100001 = 8 บิต ก็คือ 1 ไบต์ ประกอบด้วยตัวเลข 0 หรือ เลข 1 จำนวน 8 ตัว เรียงต่อกัน
หน่วยที่ใช้วัดความจำที่เล็กที่สุด คือ ไบต์ (Byte) ซึ่งหมายถึง จำนวนตัวเลขในระบบเลขฐานสองที่ต่อเนื่องกันเป็นกลุ่มแต่ละตัวเรียกว่า บิต (bit) เช่น 01100001 = 8 บิต ก็คือ 1 ไบต์ ประกอบด้วยตัวเลข 0 หรือ เลข 1 จำนวน 8 ตัว เรียงต่อกัน
ทั้งนี้ ขนาด 1 ไบต์ หรือ 8 บิต จะสามารถใช้แทนข้อมูลที่เป็นตัวอักษร ตัวเลข และสัญลักษณ์ต่าง ๆ ได้ 1 ตัว ซึ่งจำนวน 8 บิต จะใช้แทนตัวอักษร ตัวเลข หรือสัญลักษณ์ต่าง ๆ ได้เท่ากับ 256 แบบ หรือ เท่ากับ 2
ดังนั้นเราจะวัดขนาดข้อมูลของคอมพิวเตอร์ตามหน่วยวัดข้อมูลได้ดังนี้
8 BIT (บิต) = 1 Byte (ไบต์) = 1 ตัวอักษร
1,024 B = 1 KB (กิโลไบต์) = 1,024 ตัวอักษร
1,024 KB = 1 MB (เมกะไบต์) = 1,048,576 ตัวอักษร
1,024 MB = 1 GB (กิกะไบต์) = 1,073,741,824 ตัวอักษร
1,024 GB = 1 TB (เทระไบต์) = 1,099,511,627 ตัวอักษร
ดังนั้นเราจะวัดขนาดข้อมูลของคอมพิวเตอร์ตามหน่วยวัดข้อมูลได้ดังนี้
8 BIT (บิต) = 1 Byte (ไบต์) = 1 ตัวอักษร
1,024 B = 1 KB (กิโลไบต์) = 1,024 ตัวอักษร
1,024 KB = 1 MB (เมกะไบต์) = 1,048,576 ตัวอักษร
1,024 MB = 1 GB (กิกะไบต์) = 1,073,741,824 ตัวอักษร
1,024 GB = 1 TB (เทระไบต์) = 1,099,511,627 ตัวอักษร
เนื่องจาก คอมพิวเตอร์ทำงานด้วยกระแสไฟฟ้า ดังนั้นจึงมีการแทนที่สภาวะของกระแสไฟฟ้าได้ 2 สภาวะ คือ สภาวะที่มีกระแสไฟฟ้า และสภาวะที่ไม่มีกระแสไฟฟ้า และเพื่อให้โปรแกรมเมอร์สามารถสั่งการคอมพิวเตอร์ได้ จึงได้มีการสร้างระบบตัวเลขที่นำมาแทนสภาวะของกระแสไฟฟ้า โดยตัวเลข 0 จะแทนสภาวะไม่มีกระแสไฟฟ้า และเลข 1 แทนสภาวะมีกระแสไฟฟ้าสภาวะ มีกระแสไฟฟ้า แทนด้วยตัวเลข 1สภาวะไม่มีกระแสไฟฟ้า
แทนด้วยตัวเลข 0 ระบบตัวเลขที่มีจำนวน 2 จำนวน (2 ค่า) เรียกว่าระบบเลขฐานสอง (Binary Number System) ซึ่งเป็นระบบตัวเลข ที่สามารถนำมาใช้ในการสั่งงานคอมพิวเตอร์ โดยการแทนที่สภาวะต่างๆ ของกระแสไฟฟ้า แต่ในชีวิตประจำวันของคนเราจะคุ้นเคยกับตัวเลขที่มีจำนวน 10 จำนวน คือ เลข 0 – 9 ซึ่งเรียกว่าระบบเลขฐานสิบ (Decimal Number System) ดังนั้นจึงมีความจำเป็นต้องศึกษาระบบเลขฐาน ประกอบการการศึกษาวิชาด้านคอมพิวเตอร์
ไม่มีความคิดเห็น:
แสดงความคิดเห็น