วันจันทร์ที่ 26 ตุลาคม พ.ศ. 2552

รหัสแทนข้อมูล

รหัสแทนข้อมูล คอมพิวเตอร์ทำงานด้วยหลักการทางอิเล็กทรอนิกส์ที่แทนสัญญาณทางไฟฟ้าด้วยตัวเลขศูนย์ และหนึ่งซึ่งเป็นตัวเลขในระบบฐานสอง แต่ละหลักเรียกว่า บิต และเมื่อนำตัวเลขหลายๆบิตมา เรียงกัน จะใช้สร้างรหัสแทนความหมายจำนวน หรือตัวอักษร หรือสัญลักษณ์ ทั้งภาษาไทยและ ภาษาอังกฤษได้ และเพื่อให้การสื่อสารแลกเปลี่ยนข้อความระหว่างมนุษย์กับคอมพิวเตอร์เป็น ไปในแนวเดียวกันจึงมีการกำหนดมาตรฐานรหัสตัวเลขในระบบเลขฐานสอง สำหรับแทน สัญลักษณ์เหล่านี้ รหัสมาตรฐานที่นิยมใช้กันมากมีสองกลุ่ม คือ
1. รหัสแอสกี ( ASCII)
เป็นมาตรฐานที่นิยมใช้กันมากในระบบคอมพิวเตอร์และระบบสื่อสารข้อมูล รหัสแทนข้อมูล ชนิดนี้ใช้เลขฐานสองจำนวน 8 บิต หรือเท่ากับ 1 ไบต์แทนอักขระหรือสัญลักษณ์แต่ละตัว ซึ่งหมายความว่าการแทนอักขระแต่ละตัวจะประกอบด้วยตัวเลขฐานสอง 8 บิตเรียงกัน ซึ่ง ลำดับของแต่ละบิตเป็นดังนี้











บิตที่
7
6
5
4
3
2
1
0













ตัวอย่างรหัสแทนข้อมูล เช่น





บิตที่
7
6
5
4
3
2
1
0
อักขระที่แทน


0
0
1
1
0
1
1
1
7


0
1
0
0
0
1
1
1
G


0
1
1
0
0
1
1
1
g















จากหลักการของระบบเลขฐานสอง แต่ละบิตสามารถแทนค่าได้ 2 แบบ คือ เลข 0 หรือเลข 1 ถ้าเราเขียนเลขฐานสองเรียงกัน 2 บิต ในการแทนอักขระ เราจะมีรูปแบบในการแทนอักขระ ได้ 22 หรือ 4 รูปแบบ คือ 00,01,10 และ 11 ดังนั้นในการใช้รหัสแอสกีซึ่งมี 8 บิตใน การแทนอักขระแล้ว เราจะมีรูปแบบที่ใช้แทนได้ถึง 28 หรือ 256 รูปแบบ ซึ่งเมื่อใช้แทน ตัวอักษรภาษาอังกฤษแล้วยังมีเหลืออยู่ สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม หรือ สมอ. จึงได้กำหนดรหัสภาษาไทยเพิ่มลงไปเพื่อให้ใช้งานร่วมกัน ตารางแสดงรหัสแอสกี
2. รหัสเอบซีดิก (EBCDIC)
พัฒนาโดยบริษัทไอบีเอ็ม รหัสแทนข้อมูลนี้ไม่เป็นที่นิยมใช้แล้วในปัจจุบัน การกำหนดรหัส จะใช้ 8 บิต ต่อหนึ่งอักขระ เหมือนกับรหัสแอสกี แต่แบบของรหัสที่กำหนดจะแตกต่างกัน โดยรหัสเอบซีดิกจะเรียงลำดับแต่ละบิตที่ใช้แทนอักขระดังนี้










บิตที่
0
1
2
3
4
5
6
7
รหัสแบบเอบซีดิก ก็สามารถใช้กำหนดให้กับอักษรภาษาไทย และเครื่องหมายอื่น ๆ ได้ เช่นเดียวกัน ตัวอย่างรหัสแทนข้อมูลแบบเอบซีดิก
บิตที่
0
1
2
3
4
5
6
7
อักขระที่แทน


1
1
1
1
0
1
1
1
7




1
1
0
0
0
1
1
1
G




1
0
0
0
0
1
1
1
g

3. รหัส UniCode
เป็นรหัสแบบใหม่ล่าสุด ถูกสร้างขึ้นมาเนื่องจากรหัสขนาด 8 บิตซึ่งมีรูปแบบเพียง 256 รูปแบบ ไม่สามารถแทนภาษาเขียนแบบต่าง ๆ ในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ เช่น ภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว UniCode จะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่ง เพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไป รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ ในปัจจุบันระบบ UniCode มีใช้ในระบบปฏิบัติการ Window NT ระบบปฏิบัติการ UNIX บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCode ในภาษา JAVA ด้วย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น