ดาวน์โหลดงานนำเสนอ
งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ
1
ระบบสรุปเอกสารภาษาไทย Thai-Text Summarization
COE โดย นางสาวอารยา จึงสุวัฒนานนท์ รหัส นางสาวกฤติกา สุเสนา รหัส อาจารย์ที่ปรึกษาโครงงาน อ.วนิดา แก่นอากาศ อาจารย์ผู้ร่วมประเมิน อ.วสุ เชาว์พานนท์ อ.รุจชัย อึ้งอารุณยะวี
2
Outline หลักการทำงานของโปรแกรม ผลการทดสอบโปรแกรม
แนวความคิดในการให้ค่าน้ำหนักของประโยค แนวความคิดในการดึงใจความสำคัญของเอกสาร ปัญหาและอุปสรรค
3
หลักการทำงานของโปรแกรม (ตัดคำและนับความถี่)
นำเอกสารที่อ่านได้ มาเก็บใน Buffer Reader เรียกฟังชันก์ BreakIterator เพื่อใช้ตัดคำจากเอกสารที่อ่านได้ อ่านไฟล์เอกสาร ตรวจสอบว่าคำที่ตัดได้ จากเอกสารว่าหมดหรือยัง หมด เพิ่มค่า Word count ของคำนั้น ให้ค่าน้ำหนักประโยค ยังไม่หมด ตรวจสอบคำ ว่ามีอยู่ ใน Word Table หรือยัง มี เพิ่มคำลงใน Word table และกำหนด Word count =1 ไม่มี
4
ผลการทดสอบโปรแกรม Input
5
ผลการตัดคำ
6
ผลการนับค่าความถี่ของคำ
8
Input
9
ผลการนับค่าความถี่ของคำ
11
แนวความคิดในการให้ค่าน้ำหนักของประโยคเพื่อการสรุปเอกสาร
รับค่าความถี่ของคำ เอาค่าความถี่ของคำนั้นบวกเข้าในตัวแปร score of segment หมดแล้ว ตรวจสอบว่าหมดคำ ในเอกสารหรือยัง ยังไม่หมด เรียงลำดับประโยคจากมากไปน้อยตามค่า score of segment ไม่ใช่ ตรวจสอบว่าใช่ “ ” หรือไม่ ใช่ การดึงใจความสำคัญ เลื่อน pointer ชี้ไปยังscore of segment ถัดไป
12
แนวความคิดการดึงใจความสำคัญของเอกสาร
เรียงประโยคตามค่าน้ำหนัก รับ Input เป็นค่า%ของเอกสารต้นฉบับ Output = (Input)(จำนวนประโยคทั้งหมด)/100 แสดงประโยคเรียงตามค่าน้ำหนัก จำนวนประโยคเท่ากับค่าที่คำนวณได้
13
ปัญหาและอุปสรรค แผนการทำงาน การตัดคำ หลักภาษาไทย
แนวความคิดในการสรุปเอกสารภาษาไทย
14
Q&A
งานนำเสนอที่คล้ายกัน
© 2024 SlidePlayer.in.th Inc.
All rights reserved.