ระบบสรุปเอกสารภาษาไทย Thai-Text Summarization COE2008-23
จัดทำโดย นางสาวอารยา จึงสุวัฒนานนท์ รหัส 483040172-1 นางสาวกฤติกา สุเสนา รหัส 493041114-1 อาจารย์ที่ปรึกษาโครงงาน รศ.ดร.วนิดา (เพ็ญสุวรรณ)แก่นอากาศ อาจารย์ผู้ร่วมประเมิน อ.ดร. วสุ เชาว์พานนท์ ผศ.ดร.รุจชัย อึ้งอารุณยะวี
Outline หลักการและเหตุผล วัตถุประสงค์ของโครงการ โครงสร้างการทำงานของโปรแกรม ผลการทดสอบโปรแกรม ประโยชน์ที่ได้รับ ปัญหาและอุปสรรค สรุป 3
หลักการและเหตุผล การอ่านเอกสารจำนวนมาก อาจเป็นปัญหา สำหรับผู้ที่มีเวลาค่อนข้างจำกัดทำให้ไม่สามารถ จับใจความสำคัญของเอกสารได้อย่างครบถ้วน โครงการนี้จึงมีแนวคิดการสร้างโปรแกรม เพื่ออำนวยความสะดวกในการสรุป เอกสารภาษาไทย
วัตถุประสงค์ของโครงการ เพื่อศึกษาหลักการสรุปเอกสารภาษาไทย เพื่อสร้างโปรแกรมสรุปเอกสารภาษาไทย เพื่อเป็นแนวทางในการพัฒนาระบบสรุป เอกสารภาษาไทย
โครงสร้างการทำงานโดยรวมของโปรแกรม เอกสารต้นฉบับ ตัดคำและนับความถี่ ให้ค่าน้ำหนักประโยค สรุป เอกสารสรุป
การตัดคำและนับความถี่ ตรวจสอบคำว่ามีอยู่ ใน Word Table หรือยัง เพิ่มค่า Word count ของคำนั้น Y N เพิ่มคำลงใน Word table และกำหนด Word count =1 ส่วนการให้ค่าน้ำหนักของประโยค
การให้ค่าน้ำหนักของประโยค ทำการแยกประโยคและเก็บเนื้อหาของแต่ละประโยค นำประโยคแต่ละประโยคมาตัดคำ Y ตรวจสอบคำสันธาน N เพิ่มค่าน้ำหนักของประโยคด้วยค่าความถี่ของคำนั้นๆ เก็บค่าน้ำหนักและลำดับของแต่ละประโยค
การสรุป รับ Input เป็นค่า% ของเอกสารต้นฉบับ คำนวนจำนวนประโยค ดึงประโยคโดยเรียงตามค่าน้ำหนัก จำนวนประโยคเท่ากับค่าที่คำนวณได้ ทำการเรียงลำดับประโยคตามเนื้อหาก่อนหลัง
ผลการทดสอบโปรแกรม เอกสารต้นฉบับ
64. คนอ่านจะได้รู้ว่าในไม่ช้าว่าตายายของกะทิที่อยู่ในบ้านริมคลอง (142) ผลการให้ค่าน้ำหนักของประโยค 64. คนอ่านจะได้รู้ว่าในไม่ช้าว่าตายายของกะทิที่อยู่ในบ้านริมคลอง (142)
เอกสารสรุป
ประโยชน์ที่ได้รับ ได้ฝึกฝนการคิดและการทำงานที่เป็นแบบแผน ได้ฝึกฝนการพัฒนาโปรแกรม และการทำงานเป็นกลุ่ม สามารถสร้างโปรแกรมสรุปเอกสาร ภาษาไทยได้
ปัญหาและอุปสรรค การตัดคำ หลักภาษาไทย หลักการสรุปเอกสารภาษาไทย
สรุป
Q&A