ระบบสรุปเอกสารภาษาไทย Thai-Text Summarization COE2008-23 โดย นางสาวอารยา จึงสุวัฒนานนท์ รหัส 483040172-1 นางสาวกฤติกา สุเสนา รหัส 493041114-1 อาจารย์ที่ปรึกษาโครงงาน อ.วนิดา แก่นอากาศ อาจารย์ผู้ร่วมประเมิน อ.วสุ เชาว์พานนท์ อ.รุจชัย อึ้งอารุณยะวี
Outline หลักการทำงานของโปรแกรม ผลการทดสอบโปรแกรม แนวความคิดในการให้ค่าน้ำหนักของประโยค แนวความคิดในการดึงใจความสำคัญของเอกสาร ปัญหาและอุปสรรค
หลักการทำงานของโปรแกรม (ตัดคำและนับความถี่) นำเอกสารที่อ่านได้ มาเก็บใน Buffer Reader เรียกฟังชันก์ BreakIterator เพื่อใช้ตัดคำจากเอกสารที่อ่านได้ อ่านไฟล์เอกสาร ตรวจสอบว่าคำที่ตัดได้ จากเอกสารว่าหมดหรือยัง หมด เพิ่มค่า Word count ของคำนั้น ให้ค่าน้ำหนักประโยค ยังไม่หมด ตรวจสอบคำ ว่ามีอยู่ ใน Word Table หรือยัง มี เพิ่มคำลงใน Word table และกำหนด Word count =1 ไม่มี
ผลการทดสอบโปรแกรม Input
ผลการตัดคำ
ผลการนับค่าความถี่ของคำ
Input
ผลการนับค่าความถี่ของคำ
แนวความคิดในการให้ค่าน้ำหนักของประโยคเพื่อการสรุปเอกสาร รับค่าความถี่ของคำ เอาค่าความถี่ของคำนั้นบวกเข้าในตัวแปร score of segment หมดแล้ว ตรวจสอบว่าหมดคำ ในเอกสารหรือยัง ยังไม่หมด เรียงลำดับประโยคจากมากไปน้อยตามค่า score of segment ไม่ใช่ ตรวจสอบว่าใช่ “ ” หรือไม่ ใช่ การดึงใจความสำคัญ เลื่อน pointer ชี้ไปยังscore of segment ถัดไป
แนวความคิดการดึงใจความสำคัญของเอกสาร เรียงประโยคตามค่าน้ำหนัก รับ Input เป็นค่า%ของเอกสารต้นฉบับ Output = (Input)(จำนวนประโยคทั้งหมด)/100 แสดงประโยคเรียงตามค่าน้ำหนัก จำนวนประโยคเท่ากับค่าที่คำนวณได้
ปัญหาและอุปสรรค แผนการทำงาน การตัดคำ หลักภาษาไทย แนวความคิดในการสรุปเอกสารภาษาไทย
Q&A