17 Planes in Unicode.

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
การควบคุมตำแหน่งการแสดงผล และการจัดวางข้อมูลบนจอภาพ
Advertisements

การเสนอโครงการวิทยานิพนธ์
ระบบเลขฐานสอง โดย นางสาวภาณุมาศ นักษัตรมณฑล รหัสนิสิต
ตัวแปรชุด การเขียนโปรแกรมภาษาคอมพิวเตอร์ 1
การเขียนโปรแกรมด้วยคำสั่งเบื้องต้น
เกณฑ์การให้คะแนน กลางภาค 60 คะแนน สอบกลางภาค 20 คะแนน
Chapter 1 โครงสร้างข้อมูลและอัลกอริธึมส์
โครงสร้างการควบคุมการทำงานของโปรแกรม Program control structures
Script Programming& Internet Programming
CS Assembly Language Programming
จำนวนเต็ม จำนวนเต็ม  ประกอบด้วย                   1. จำนวนเต็มบวก    ได้แก่  1 , 2 , 3 , 4, 5 , ....                   2.  จำนวนเต็มลบ      ได้แก่  -1.
ความรู้ทั่วไปเกี่ยวกับโปรแกรม Microsoft Office Access 2003
Number System[1] เลขฐาน & ASCII CODE Number System[1]
อสมการ เสถียร วิเชียรสาร ขอบคุณ.
Week 6 ประกาศค่าตัวแปร.
ภาษา SQL (Structured Query Language)
โครงสร้าง ภาษา HTML.
ASCII รหัสแอสกี (ASCII Code) หรือ American Standard Code for Information Interchange เป็นรหัสที่ มีการใช้แพร่หลายกันมากที่สุด เช่น ในไมโครคอมพิวเตอร์
ปฏิบัติการที่ 3 : การสร้างโฮมเพจอย่างง่าย
Computer&Technology Mahidol Wittayanusorn School
Number Representations
Use Case Diagram.
โครงสร้าง HTML โครงสร้างพื้นฐาน HTML คำสั่งขึ้นบรรทัดใหม่ <BR>
SCC : Suthida Chaichomchuen
การออกแบบโปรแกรมอย่างมีโครงสร้าง Structured Design
การจัดการข้อมูลด้วยคอมพิวเตอร์
ซอฟต์แวร์คอมพิวเตอร์ในการวิเคราะห์โครงสร้าง
ขั้นตอนวิธี (Algorithm)
บรรณารักษชำนาญการพิเศษ
การวัดประสิทธิภาพ.
การจำแนกตัวอักษรออกจากบรรทัดข้อความ
ภาษาที่ใช้ในการเขียนเว็บ
ระบบจำนวนเต็ม โดย นางสาวบุณฑริกา สูนานนท์
บทที่ 11 การเขียนโปรแกรมภาษาซี
ตัวแปร (variable) ตัวแปร เป็นชื่อที่เราตั้งขึ้น เพื่อให้คอมพิวเตอร์เตรียมที่ใน หน่วยความจำไว้สำหรับเก็บข้อมูลที่นำไปประมวลผล การตั้งชื่อตัวแปร ชื่อตัวแปรในภาษา.
ไวยากรณ์ของภาษาการทำโปรแกรม (1) (Syntax of programming languages)
Computer Coding & Number Systems
ชนิดของข้อมูล ตัวแปร และตัวดำเนินการ
ตอนที่ 4 ความรู้พื้นฐานทางดิจิตอล
ค31211 คณิตศาสตร์สำหรับ คอมพิวเตอร์ 1
เรื่องข้อมูลและสาระสนเทศ
HTML, PHP.
เรื่อง คอมพิวเตอร์กับการประมวลผลข้อมูล
การแจกแจงปกติ.
การแทนข้อมูล คอมพิวเตอร์เป็นอุปกรณ์อิเล็กทรอนิกส์ซึ่งใช้สัญญาณอิเล็กทรอนิกส์ในการทำงานเพื่อเก็บข้อมูล ประมวลผลและแสดงผลลัพธ์ การมองเห็นข้อมูลของคอมพิวเตอร์กับการมองเห็นข้อมูลของผู้ใช้จะไม่เหมือนกัน.
Cryptography.
เรื่อง การสร้างตาราง (Table)
Week 2 Variables.
Computer Programming for Engineers
ค21201 คณิตศาสตร์เพิ่มเติม 1
การเข้ารหัสและการถอดรหัส
ง การงานอาชีพและเทคโนโลยี 1 ครูสหรัฐ บัวทอง
การเขียนข้อเสนอโครงการ
Output of C.
หลักการเขียนโปรแกรม ( )
รหัสคอมพิวเตอร์.
การแสดงผลและการรับข้อมูล (Data Output and Input)
ง31102 เทคโนโลยีสารสนเทศ 2 ศูนย์คอมพิวเตอร์ โรงเรียนปลวกแดงพิทยาคม
Introduction to Digital System
ระบบเลขจำนวน ( Number System )
Chapter 1 : Introduction to Database System
สื่อการสอนด้วยโปรมแกรม “Microsoft Multipoint”
สาระการเรียนรู้ที่ ๙ ประโยคเปิด
ตัวแปร และชนิดข้อมูล.
โดยสว่าง ศรีสม องค์การคนพิการสากลประจำภูมิภาค เอเชีย - แปซิฟิก XHTML DOCTYPE, Language & Structure 1.
โครงสร้างข้อมูลแบบ สแตก (stack)
ซอฟต์แวร์ (software) จัดทำโดย นาย ยุทธพงศ์ คำยอง
ส่วนประกอบของคอมพิวเตอร์
16. การเขียนรายงานการวิจัย
โครงสร้างของภาษา HTML
ใบสำเนางานนำเสนอ:

17 Planes in Unicode

ประวัติความเป็นมา Unicode Consortium ได้ถูกก่อตั้งขึ้น ในเดือนมกราคม 1991 ในรัฐแคลิฟอร์เนีย ประเทศสหรัฐอเมริกา 4 ปีหลังจากความคิดใหม่เกี่ยวกับการเข้ารหัสตัวอักษรที่เรียกว่า Unicode ถูกเสนอให้พิจารณาแรกเริ่มโดยวิศวกรจาก Xerox (Joe Becker) และ Apple (Lee Collins and Mark Davis) Objective Universal (addressing the needs of world languages) Uniform (fixed-width codes for efficient access), and Unique (bit sequence has only one interpretation into character codes)

โดยมีการแบ่งออกเป็นระนาบซึ่งมีทั้งหมด 17 ระนาบ

หลักการทำงานของ Unicode แต่ละตัวอักขระที่ใช้ในภาษาต่างๆ จะมีรหัสเฉพาะของตน แต่รูปแบบของการเข้ารหัสแบบ Unicode นั้นมีได้หลายแบบ เป็นการแปลงรหัส Unicode ที่กำหนดหรือที่เรียกว่า Unicode transformation format (UTF) ใช้จำนวน 32 บิตสำหรับแต่ละอักขระ (4 bytes/character) (เรียกว่า UTF-32) ตัวอักขระที่ใช้บ่อยๆ เก็บ 16 บิต (UTF-16)

ตารางรหัส Unicode ที่เป็นภาษาไทย

การแบ่งระนาบของ Unicode Unicode นั้นจะแบ่งออกเป็นส่วนต่างๆได้หลายส่วน โดยการจัดแยกออกเป็นส่วนย่อยๆไว้ใน 17 ระนาบ รวมทั้งหมด 1,114,112 ตัวอักษร โดยแบ่งได้เป็นระยะทั้งหมดคือ 0hex ถึง 10FFFFhexและโดยปกติในการอ้างถึง Unicode จะใช้รูปแบบ “U+” ตามด้วยตัวเลขฐานสิบหกเพื่อบ่งบอกตำแหน่งของตัวอักษร

ระนาบสำหรับตัวอักษรพื้นฐาน (ระนาบที่ 0) Basic Multilingual Plane จะทำงานโดยในแต่ละชุดของอักขระจะประกอบด้วยรหัส 256 รหัสในการชี้ตำแหน่งของอักขระ Basic Multilingual Plane (BMP), เป็นระนาบที่มีอักขระบรรจุอยู่มากที่สุด โดยอักขระสมัยใหม่และอักขระพิเศษเกือบทั้งหมดจะถูกบรรจุอยู่ระนาบนี้ ใน Unicode 5.1

ระนาบเพิ่มเติมสำหรับตัวอักษร(ระนาบที่ 1) Supplementary Multilingual Plane (SMP) ในระนาบนี้ส่วนใหญ่จะใช้ในการเก็บอักขระที่เกี่ยวข้องกับประวัติศาสตร์ รวมไปถึงสัญลักษณ์ทางดนตรีและคณิตศาสตร์ ในการอ้างถึงค่าใน SMP มีด้วยกัน2 วิธี คือ โดยการค่อขยาย Unicode จาก 16 บิตไปเป็น 32 บิต และอ้างถึงโดยตรงโดยใช้ 32 บิต (UTF-32) ส่วนอีกวิธีหนึ่งคือ จะใช้ความยาวเป็นจำนวนคู่ของ 16 บิต (Surrogate Pair)

ระนาบเพิ่มเติมสำหรับอักษรภาพแสดงความหมาย (ระนาบที่ 2) Supplementary Ideographic Plane (SIP) ถูกใช้ไปแล้วประมาณ 40,000 ในการแทนคำที่ใช้แทนความคิดหรือคำพูด CJK Unified Ideographs Extension B (20000–2A6DF) CJK Compatibility Ideographs Supplement (2F800–2FA1F)

ระนาบเพิ่มเติมสำหรับตัวอักษรลำดับที่3(ระนาบที่ 3) Tertiary Ideographic Plane ใช้แทนภาษาจีนโบราณในยุคสามก๊ก (Old Hanzi Period) 00030000-000317FF Oracle Bone Script 00031800-00031FFF unassigned 00032000-00032FFF Bronze Script 00033000-00033FFF unassigned 00034000-000368FF Small Seal Script 00036900-0003FFFD unassigned

ระนาบที่ยังไม่ได้นำไปใช้งาน (ระนาบที่ 4 ถึง ระนาบที่ 13) ยังไม่มีการกำหนดค่าให้กับระนาบที่ 4 ถึง ระนาบที่ 13 รวมถึงยังไม่ได้มีการกำหนดขนาด

ระนาบสำหรับวัตถุประสงค์พิเศษ (ระนาบที่ 14) Plane 14 (E in hexadecimal), ส่วนเพิ่มเติมสำหรับวัตถุประสงค์เฉพาะ (SSP: Supplementary Special- purpose Plane) ปัจจุบันใช้แทนค่าตัวอักขระที่ไม่ใช่กราฟิกในสองกลุ่มคือ 128 ใช้แทน ค่าตัวอักขระแบบแทก (Tag Language) ที่ยังไม่สามารถแทนค่าได้ตามปกติตัวอย่างเช่นในภาษา เอกซ์เอ็มแอล(XML) และกลุ่มระเบียน 240 ใช้แทนค่าตัวอักขระที่ไม่สามารถเขียนแทนได้ในข้อความทั่วไป มีการกำหนดค่าดังนี้   000E0000-000E007F Tag characters 000E0080-000E00FF unassigned 000E0100-000E01EF Variation Selectors 000E01F0-000EFFFD unassigned

ระนาบสงวนการใช้งาน (ระนาบที่ 15 และ ระนาบที่ 16) ระนาบทั้ง 15 และ 16 นี้ถูกออกแบบโดยกรรมการชุดอื่น ที่ไม่ใช่จากหน่วยงานของไอเอสโอ หรือ คณะกรรมการของยูนิโค้ด เพื่อรองรับการทำงานของอักขระบางกลุ่มที่มีลักษณะพิเศษ เช่น เขียนจากขวาไปซ้าย เป็นต้น Title in here Title in here

Thank You!