Thai Handwritten Character Recognition by Artificial Neural Networks การรู้จำลายมือเขียนภาษาไทยด้วยโครงข่ายประสาทเทียม โดย นส.ณัฐธิดา ลีสม นส.กาญจนา เรืองธนานุรักษ์ อ.ที่ปรึกษา อ.โอฬาริก สุรินต๊ะ อ.รพีพร ช่ำชอง
Thai Handwritten Character Recognition หลักการและเหตุผล โลกปัจจุบันมีความก้าวหน้าทางด้านเทคโนโลยีสารสนเทศ สารสนเทศอยู่ในรูปแบบของ รูปภาพ ข้อความ เสียง สารสนเทศที่อยู่ในรูปแบบดิจิตอล ทำให้ง่ายต่อการค้นคืน และนำไปประยุกต์ให้ตรงต่อความต้องการ Thai Handwritten Character Recognition
หลักการและเหตุผล (ต่อ) อาจมีสารสนเทศบางประเภทที่เก็บอยู่ในรูปแบบของเอกสาร (Document) ทำให้ยากต่อการค้นคืน และนำไปใช้งาน ดังนั้น จึงประยุกต์ความรู้ทางด้านการประมวลผลภาพ (Image Processing) และการรู้จำตัวอักษร (Character Recognition) เพื่อแปลงเอกสารให้อยู่ในรูปแบบของเอกสารอิเล็กทรอนิกส์ เพื่อให้ง่ายต่อการนำไปใช้งาน Thai Handwritten Character Recognition
วัตถุประสงค์ของโครงงาน เพื่อพัฒนาโปรแกรมการรู้จำตัวอักษรลายมือเขียนภาษาไทย เพื่อปรับปรุงระบบการรู้จำตัวอักษรลายมือเขียนภาษาไทยด้วยโครงข่ายประสาทเทียม Thai Handwritten Character Recognition
ประโยชน์ที่คาดว่าจะได้รับ เพื่อใช้เป็นระบบต้นแบบการรู้จำตัวอักษรลายมือเขียนภาษาไทย Thai Handwritten Character Recognition
Thai Handwritten Character Recognition ขอบเขตของโครงงาน พัฒนาระบบต้นแบบการรู้จำตัวอักษรลายมือเขียนภาษาไทย สำหรับตัวอักษรภาษาไทย พยัญชนะ 44 ตัว สระ 18 ตัว วรรณยุกต์ 4 ตัว ตัวเลขอารบิก จำนวน 10 ตัว (0-9) ตัวอักษรภาษาอังกฤษ 26 ตัว (a-z) *ทดลอง Thai Handwritten Character Recognition
ขอบเขตของโครงงาน (ต่อ) พยัญชนะ ก ข ฃ ค ฅ ฆ ง จ ฉ ช ซ ฌ ญ ฎ ฏ ฐ ฑ ฒ ณ ด ต ถ ท ธ น บ ป ผ ฝ พ ฟ ภ ม ย ร ฤ ล ฦ ว ศ ษ ส ห ฬ อ ฮ สระ อั อะ อา อิ อี อึ อื อุ อู เอ โอ ใอ ไอ ๅ ๆ อ็ อ์ อํ วรรณยุกต์ อ่ อ้ อ๊ อ๋ ภาพประกอบ ตัวอักษรภาษาไทยที่ใช้ในการรู้จำ Thai Handwritten Character Recognition
ขอบเขตของโครงงาน (ต่อ) a b c d e f g h i j k l m n o p q r s t u v w x y z ภาพประกอบ ตัวอักษรภาษาอังกฤษที่ใช้ในการรู้จำ 0 1 2 3 4 5 6 7 8 9 ภาพประกอบ ตัวเลขอารบิกที่ใช้ในการรู้จำ Thai Handwritten Character Recognition
ขอบเขตของโครงงาน (ต่อ) การนำข้อมูลเข้า สามารถรับจากเครื่องสแกน หรือภาพที่สร้างจากโปรแกรม Photoshop หรือ Paint Brush โดยรับข้อมูลเข้ามาเป็นรูปภาพสี ข้อมูลที่ใช้สำหรับทดสอบเป็นลายมือเขียนภาษาไทยที่เขียนอยู่บนกระดาษสีที่มีค่าสีที่แตกต่างจากหมึกปากกา ไม่มีลายเส้น ไม่เขียนเอียง ไม่มีรูปภาพประกอบ ใช้ปากกาสีเข้ม เช่น น้ำเงิน แดง ดำ เป็นต้น และไม่มีสัญญาณรบกวน ในรูปแบบต่าง ๆ Thai Handwritten Character Recognition
ขอบเขตของโครงงาน (ต่อ) ภาพประกอบ ตัวอย่างข้อมูลที่ใช้ในการเรียนรู้ Thai Handwritten Character Recognition
ขอบเขตของโครงงาน (ต่อ) ทดลองกับเอกสารที่มีพื้นหลังแตกต่างกัน เช่นพื้นหลังเป็นสี หรือพื้นหลังมีสัญญาณรบกวน ใช้ตัวอักษรลายมือเขียน 100 ชุดต่อหนึ่งตัวอักษร ในรูปแบบไฟล์ภาพเชิงดิจิตอล ได้แก่ .jpg เพื่อใช้ในการสร้าง Model โดยลายมือเขียนตัวอักษรภาษาไทย เขียนจากบุคคลที่แตกต่างกันจำนวน 10 คนขึ้นไป สามารถแสดงผลข้อมูลในโปรแกรม Notepad Thai Handwritten Character Recognition
ขอบเขตของโครงงาน (ต่อ) Input Output ภาพประกอบ ตัวอย่างข้อมูลที่ใช้ในการรู้จำ ภาพประกอบ ตัวอย่างผลลัพธ์ที่ได้จากการรู้จำ ภาพประกอบ ตัวอย่าง Input และ Output ของโปรแกรม Thai Handwritten Character Recognition
ขอบเขตของโครงงาน (ต่อ) ภาพประกอบ Diagram ของระบบการรู้จำตัวอักษรลายมือเขียนภาษาไทย Thai Handwritten Character Recognition
Thai Handwritten Character Recognition ทฤษฏีที่เกี่ยวข้อง ลักษณะของตัวอักษรภาษาไทย การประมวลผลภาพ (Image Processing) ภาพเชิงดิจิตอล การแปลงภาพสีให้เป็นภาพสีเทา การแปลงภาพสีเทาให้เป็นภาพขาวดำ การกำจัดสัญญาณรบกวน Thai Handwritten Character Recognition
ทฤษฏีที่เกี่ยวข้อง (ต่อ) การจำแนกบรรทัดข้อความ การจำแนกตัวอักษรออกจากบรรทัดข้อความ การทำให้ตัวอักษรบาง การหาคุณลักษณะพิเศษ การรู้จำตัวอักษร การออกแบบหน้าจอโปรแกรม (GUI) Thai Handwritten Character Recognition
ลักษณะของตัวอักษรภาษาไทย ตัวอักษรภาษาไทยประกอบไปด้วย พยัญชนะ สระ วรรณยุกต์ เมื่อนำตัวอักษรมาประกอบกันจะแบ่งออกเป็น 4 ระดับ ภาพประกอบ ระดับของตัวอักษรภาษาไทย Thai Handwritten Character Recognition
การประมวลผลภาพ (Image Processing) เปรียบเสมือนการจัดการ การวิเคราะห์สารสนเทศของภาพ โดยใช้คอมพิวเตอร์ในการประมวลผล โดยวิธีในการประมวลผลขึ้นอยู่กับผลลัพธ์ที่ต้องการ ภาพประกอบ การลดสัญญาณรบกวน (Noise) จากรูปภาพ Thai Handwritten Character Recognition
ภาพเชิงดิจิตอล ภาพประกอบ รูปภาพเชิงดิจิตอล Thai Handwritten Character Recognition
Thai Handwritten Character Recognition ภาพเชิงดิจิตอล (ต่อ) ภาพสี แบ่งออกเป็น 3 รูปแบบ ภาพสี (RGB Image) ภาพสีเทา (Gray Image) ภาพขาวดำ (Binary Image) ภาพสีเทา ภาพขาวดำ Thai Handwritten Character Recognition