บทที่ 6 Context Free Grammar และการแจกแจงประโยค
การประมวลผลภาษาธรรมชาติ การประมวลผลภาษาธรรมชาติ (NLP) เพื่อให้เครื่องจักรหรือคอมพิวเตอร์สามารถรับรู้และเข้าใจภาษามนุษย์
การประมวลผลภาษาธรรมชาติ การประมวลผลภาษาธรรมชาติ จำเป็นต้องประยุกต์หลักการโครงสร้างทางภาษาศาสตร์ ในด้านต่าง ๆ ระดับเสียง (phonology) ระดับหน่วยคำ (morphology) ระดับกลุ่มคำ (syntax) ระดับความหมาย (semantics) ระดับการใช้ภาษา (pragmatics)
วากยสัมพันธ์ ภาษาธรรมชาติที่มนุษย์ใช้ มีวากยสัมพันธ์ที่ซับซ้อนมาก ไม่สามารถกำหนดกฏเกณฑ์ได้ที่แน่นอนได้ทั้งหมด การใช้ไวยากรณ์กำหนดภาษาทางการ ทำให้เราสามารถตอบคำถามพื้นฐานเกี่ยวกับภาษาได้
การจำแนกกลุ่มคำ Zelling S. Harris เป็นนักภาษาศาสตร์ เสนอกฎเกณฑ์การแทนคำไว้ว่า “การศึกษาภาษาศาสตร์จำเป็นต้องมีการจำแนกคำและกลุ่มคำเพื่อที่จะได้นำคำที่อยู่ในกลุ่มชนิดเดียวกันมาแทนที่กัน”
การจำแนกกลุ่มคำ กฎการแทนคำในกลุ่มเดียวกัน ประโยคที่เกิดจากการเรียงคำเป็น C A D สามารถดึงคำ A ออกแล้วแทนที่ด้วยคำ B ถ้าคำ A และ B ต่างเป็นสมาชิกของกลุ่มคำเดียวกัน เช่น Where did the …. go ? { child, young, boy }
การจำแนกกลุ่มคำ การจำแนกกลุ่มคำ art N V V art N Article (art) Noun (N) The monkey has eaten the banana. art N V V art N Article (art) Noun (N) Verb (V)
การจำแนกกลุ่มคำ ประโยคสามารถแปลงรูปไปมาได้ เช่น กาเปลี่ยนรูป ระหว่าง active voice กับ passive voice The dog bit the man. (active) The man was bitten by the dog. (passive)
การจำแนกกลุ่มคำ การเปลี่ยนรูประหว่างประโยคบอกเล่ากับปฎิเสธ The man was bitten by the dog. ประโยคคำถาม Was the man bitten by the dog?
การวิเคราะห์โครงสร้างประโยค โครงสร้างทางไวยากรของประโยค จะมีการเรียงลำดับของปรโยค ประโยค (S) -> นามวลี (NP) + กริยาวลี (VP) นามวลี -> คำนำหน้านาม (art) + คำนาม (N) กริยาวลี -> กริยา (V) + กรรม (NP)
การวิเคราะห์โครงสร้างประโยค จงแจกแจงประโยคด้านล่าง ออกมาเป็นโครงสร้าง ย่อยจากบนลงล่าง The boys drive the cars. The birds eat the worms. The birds drive the cars.
การจำแนกกลุ่มคำ ชนิดของคำแบ่งเป็น คำนำหน้าหน้า เช่น a , an, the คำนาม เช่น bird , worm , table - - นามวลี เช่น The bird กริยา เช่น eat, run, walk … กริยาวลี เช่น eat the warm
หลักไวยากร CFG จัดเป็นส่วนหนึ่งของไวยากรณ์โครงสร้างวลี Context-Free Grammars (CFG) หลักไวยากร CFG จัดเป็นส่วนหนึ่งของไวยากรณ์โครงสร้างวลี เป็นไวยากรณ์หลักที่ใช้อธิบายโครงสร้างของภาษา และความสัมพันธ์ระหว่างโครงสร้างต่าง ๆ ที่ประกอบในประโยคนั้น ๆ
การแจกแจงประโยค สำหรับ CFG สามารถทำได้ 2 ทาง การแจกแจงจากบนลงล่าง Context-Free Grammars (CFG) การแจกแจงประโยค สำหรับ CFG สามารถทำได้ 2 ทาง การแจกแจงจากบนลงล่าง (top-down parsing) การแจกแจงจากล่างขึ้นบน (bottom-up parsing)
การแจกแจงจากล่างขึ้นบน Context-Free Grammars (CFG) การแจกแจงจากล่างขึ้นบน The birds eat the worms. Art + birds eat the worms. Art + N + eat the worms. Art + N + V + the + worms. Art + N + V + Art + worms. Art + N + V + Art + N NP + V + Art + N NP + V + NP NP + VP S
การแจกแจงจากบนลงล่าง Context-Free Grammars (CFG) การแจกแจงจากบนลงล่าง S NP + VP NP + V + NP NP + V + Art + N Art + N + V + Art + N Art + N + V + Art + worms. Art + N + V + the worms. Art + N + eat the worms. Art + birds eat the worms. The birds eat the worms.
เว็บเพจ - แปลภาษา http://www.suparsit.com Kasem97 4bbb54
เว็บเพจ - แปลภาษา
เว็บเพจ - แปลภาษา http://translate.google.com
การแข่งขันสุดยอดซอฟต์แวร์แบ่งคำภาษาไทย http://www.hlt.nectec.or.th/best/?q=node/3