งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

L/O/G/O www.themegallery.com 17 Planes in Unicode.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "L/O/G/O www.themegallery.com 17 Planes in Unicode."— ใบสำเนางานนำเสนอ:

1 L/O/G/O 17 Planes in Unicode

2 Unicode Consortium ได้ถูกก่อตั้งขึ้น ในเดือนมกราคม 1991 ในรัฐแคลิฟอร์เนีย ประเทศสหรัฐอเมริกา 4 ปี หลังจากความคิดใหม่เกี่ยวกับการเข้ารหัสตัวอักษรที่เรียกว่า Unicode ถูกเสนอให้พิจารณาแรกเริ่มโดยวิศวกรจาก Xerox (Joe Becker) และ Apple (Lee Collins and Mark Davis) Objective Universal (addressing the needs of world languages) Uniform (fixed-width codes for efficient access), and Unique (bit sequence has only one interpretation into character codes) ประวัติความเป็นมา

3 โดยมีการแบ่งออกเป็นระนาบซึ่งมีทั้งหมด 17 ระนาบ

4 หลักการทำงานของ Unicode แต่ละตัวอักขระที่ใช้ในภาษาต่างๆ จะมีรหัสเฉพาะของตน แต่รูปแบบของการเข้ารหัส แบบ Unicode นั้นมีได้หลายแบบ เป็นการแปลงรหัส Unicode ที่ กำหนด หรือที่ เรียกว่า Unicode transformation format (UTF) ใช้จำนวน 32 บิตสำหรับแต่ละอักขระ (4 bytes/character) ( เรียกว่า UTF-32) ตัวอักขระที่ใช้บ่อยๆ เก็บ 16 บิต (UTF-16)

5 ตารางรหัส Unicode ที่ เป็นภาษาไทย

6 การแบ่งระนาบของ Unicode Unicode นั้นจะแบ่งออกเป็นส่วนต่างๆได้หลายส่วน โดยการ จัดแยกออกเป็นส่วนย่อยๆไว้ใน 17 ระนาบ รวมทั้งหมด 1,114,112 ตัวอักษร โดยแบ่งได้เป็นระยะทั้งหมดคือ 0 hex ถึง 10FFFF hex และโดยปกติในการอ้างถึง Unicode จะใช้รูปแบบ “U+” ตามด้วยตัวเลขฐานสิบหกเพื่อบ่งบอกตำแหน่งของ ตัวอักษรUnicode

7 ระนาบสำหรับตัวอักษร พื้นฐาน ( ระนาบที่ 0) Basic Multilingual Plane จะทำงานโดยในแต่ละชุดของอักขระ จะประกอบด้วยรหัส 256 รหัสในการชี้ตำแหน่งของอักขระ Basic Multilingual Plane (BMP), เป็นระนาบที่มีอักขระบรรจุอยู่มาก ที่สุด โดยอักขระสมัยใหม่และอักขระพิเศษเกือบทั้งหมดจะถูก บรรจุอยู่ระนาบนี้ ใน Unicode 5.1

8 ระนาบเพิ่มเติมสำหรับตัวอักษร ( ระนาบที่ 1) Supplementary Multilingual Plane (SMP) ในระนาบนี้ส่วนใหญ่ จะใช้ในการเก็บอักขระที่เกี่ยวข้องกับประวัติศาสตร์ รวมไปถึง สัญลักษณ์ทางดนตรีและคณิตศาสตร์ ในการอ้างถึงค่าใน SMP มี ด้วยกัน 2 วิธี คือ โดยการค่อขยาย Unicode จาก 16 บิตไปเป็น 32 บิต และอ้างถึงโดยตรงโดยใช้ 32 บิต (UTF-32) ส่วนอีกวิธีหนึ่งคือ จะใช้ความยาวเป็นจำนวนคู่ของ 16 บิต (Surrogate Pair)

9 ระนาบเพิ่มเติมสำหรับอักษรภาพแสดงความหมาย ( ระนาบที่ 2) Supplementary Ideographic Plane (SIP) ถูกใช้ไปแล้วประมาณ 40,000 ในการแทนคำที่ใช้แทนความคิดหรือคำพูด CJK Unified Ideographs Extension B (20000–2A6DF) CJK Compatibility Ideographs Supplement (2F800–2FA1F)

10 ระนาบเพิ่มเติมสำหรับตัวอักษร ลำดับที่ 3( ระนาบที่ 3) Tertiary Ideographic Plane ใช้แทนภาษาจีนโบราณในยุคสามก๊ก (Old Hanzi Period) FF Oracle Bone Script FFF unassigned FFF Bronze Script FFF unassigned FF Small Seal Script FFFD unassigned

11 ระนาบที่ยังไม่ได้นำไปใช้งาน ( ระนาบที่ 4 ถึง ระนาบที่ 13) ยังไม่มีการกำหนดค่าให้กับระนาบที่ 4 ถึง ระนาบที่ 13 รวมถึงยังไม่ได้มีการกำหนดขนาด

12 ระนาบสำหรับวัตถุประสงค์พิเศษ ( ระนาบที่ 14) Plane 14 (E in hexadecimal), ส่วนเพิ่มเติมสำหรับวัตถุประสงค์เฉพาะ (SSP: Supplementary Special-purpose Plane) ปัจจุบันใช้แทนค่าตัว อักขระที่ไม่ใช่กราฟิกในสองกลุ่มคือ 128 ใช้แทน ค่าตัวอักขระแบบแทก (Tag Language) ที่ยังไม่สามารถแทนค่าได้ตามปกติตัวอย่างเช่นในภาษา เอกซ์เอ็มแอล (XML) และกลุ่มระเบียน 240 ใช้แทนค่าตัวอักขระที่ไม่ สามารถเขียนแทนได้ในข้อความทั่วไป มีการกำหนดค่าดังนี้hexadecimal 000E E007F Tag characters 000E E00FF unassigned 000E E01EF Variation Selectors 000E01F0-000EFFFD unassigned

13 ระนาบสงวนการใช้งาน ( ระนาบที่ 15 และ ระนาบที่ 16) Title in here ระนาบทั้ง 15 และ 16 นี้ถูกออกแบบโดย กรรมการชุดอื่น ที่ไม่ใช่จากหน่วยงานของ ไอเอสโอ หรือ คณะกรรมการของยูนิโค้ด เพื่อรองรับการทำงานของอักขระบางกลุ่ม ที่มีลักษณะพิเศษ เช่น เขียนจากขวาไป ซ้าย เป็นต้น

14 L/O/G/O Thank You!


ดาวน์โหลด ppt L/O/G/O www.themegallery.com 17 Planes in Unicode.

งานนำเสนอที่คล้ายกัน


Ads by Google