ระบบสรุปเอกสารภาษาไทย Thai-Text Summarization

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
รายวิชา ง40102 หลักการแก้ปัญหาและการโปรแกรม
Advertisements

CSI1201 การเขียนโปรแกรมเชิงโครงสร้าง Structured Programming
COE นายธีรพัฒน์ เสริตานนท์ รหัส นายปกรณ์ เตชะกิจกุล รหัส อาจารย์ที่ปรึกษา : ผศ. บุญฤทธิ์ กู้เกียรติกูล อาจารย์ร่วมประเมินโครงการ.
CRYSTAL BALL โดย บัณฑิต มูลเพีย และ วิศรุต พรศรีเมตต์
โปรแกรมแสดงประวัติการแก้ไขแฟ้มเอกสาร (Multi-Version Text Viewer / Editor) COE นาย กัณวัตม์ ไชยารัศมี รหัส นาย ชัยวัฒน์ สุขปัญญา รหัส.
การสนับสนุนภาษาไทยสำหรับโปรแกรมกรองเมล์ Thai-Enabled Spam Filtering
ที่ปรึกษาวัยรุ่นอัจฉริยะ ด้านการศึกษาต่อต่างประเทศ Intelligent Counselor on Studying Aboard โดย นางสาวช่อเพชร มหาเพชร นายธนภัทร จามพฤกษ์
นายมังคลาภิรัตน์จันทนฤกษ์ นายวสุขาวดี
การพัฒนาโปรแกรมป้องกันและกำจัดไวรัสคอมพิวเตอร์ (Anti-Virus)
ระบบสรุปเอกสารภาษาไทย Thai-Text Summarization
การพัฒนาโปรแกรมป้องกันและกำจัดไวรัสคอมพิวเตอร์
Braille Cell อักษรเบรลล์เชิงกล
นายมังคลาภิรัตน์ จันทนฤกษ์ นายวสุ ขาวดี
LOGO COE COE ผู้จัดทำโครงการ นายณัฐพงษ์ ทุมมาลา นายทินกร เหมหงษ์ การพัฒนาเกม 3 มิติ ด้วยชุดพัฒนาเกม ไมโครซอฟต์ เอ็กซ์เอ็นเอ เกมส์สตูดิโอ Developing.
Foot mouse ผู้นำเสนอโครงการ นายวรวุฒิ กีรสวัสดิ์ รหัส อาจารย์ที่ปรึกษา อ. ดร. วสุ เชาว์พานนท์ อาจารย์ผู้ร่วมประเมิน อ. ดร. กิตติ์ เธียรธโนปจัย.
Tiny ERP ผู้ดำเนินโครงการ อาจารย์ที่ปรึกษา อาจารย์ที่ปรึกษาร่วม
COE ผู้จัดทำโครงการ • นายธีรพัฒน์ เสริตานนท์ รหัส • นายปกรณ์ เตชะกิจกุล รหัส อาจารย์ที่ปรึกษาโครงการ • ผศ. บุญฤทธิ์ กู้เกียรติกูล.
Management of International Relation Information System
โดย นายชยกร พิมพานนท์ นางสาวนพวรรณ์ ไสลรัตน์
การพัฒนาระบบควบคุมเครื่องหยอดเหรียญสำหรับเพิ่มสิทธิ์ในการพิมพ์
หมายเลขโครงการ : COE ผู้พัฒนาโครงการ : นางสาวนิรมล พันสีมา รหัส
ระบบวางแผนพัฒนาการใช้ดิน
อักษรเบรลล์เชิงกล (Braille Cell)
COE อาจารย์ที่ ปรึกษา โครงการ อาจารย์ที่ ปรึกษา โครงการ อ. ดร. วสุ เชาว์พานนท์ อาจารย์ผู้ ร่วมประเมิน โครงการ อ. ดร. กิตติ์ เธียร ธโนปจัย อ.
นายมังคลาภิรัตน์ จันทนฤกษ์ นายวสุ ขาวดี
COE โปรแกรมการจัดการตารางสอนสำหรับภาควิชา
COE โปรแกรมการจัดการตารางสอนสำหรับภาควิชา
COE : ป้ายรถเมล์อัจฉริยะ Smart Bus Stop
Probabilistic Asymmetric Cryptosystem
ไวท์บอร์ดเสมือนโดยใช้เทคโนโลยีของวีโมท
แผ่นป้ายประชาสัมพันธ์อัจริยะ Smart Advertising
ระบบจัดการผู้ป่วยนอกสำหรับโรงพยาบาล
COE โปรแกรมการจัดทำตารางสอนสำหรับภาควิชา
โดย นางสาววรรณวนัช โอภาสพันธ์สิน รหัส นางสาวก้องกิดากร วรสาร รหัส
ชื่อสมบัติของการเท่ากัน
เว็บเซอร์วิสเรียกง่าย
โดย นายชญาน์ แหวนหล่อ นายธนวัฒน์ วัฒนราช
ป.6 บทที่ 1 “จำนวนนับ และการบวก การลบ การคูณ การหาร”
CRYSTAL BALL โดย บัณฑิต มูลเพีย และ วิศรุต พรศรีเมตต์
นายมังคลาภิรัตน์จันทนฤกษ์ นายวสุขาวดี
โดย นางสาวทัศนียา โสดาสร้อย รหัส นายอรรถพล ทะแพงพันธ์ รหัส
COE : Microcat. ผู้พัฒนาโครงการ นาย สราวุฒิ สมญาติ อาจารย์ที่ปรึกษา อ. บุญฤทธิ์ กู้เกียรติ กูล อาจารย์ร่วมประเมิน อ. วสุ เชาว์พานนท์ อ. ดารณี หอมดี
รายละเอียดของการทำ Logbook
Accessing Web Application Data at Any Time
Low-Speed UAV Flight Control System
6. โครงสร้างข้อมูลแบบแฟ้ม
การจัดเก็บข้อมูลตามตัวบ่งชี้ สกอ. และ สมศ.
อสมการ.
โจทย์ Array 12 มี.ค จงเขียนโปรแกรมเพื่ออ่านข้อมูลเข้าเป็นจำนวนเต็ม 10 จำนวน แล้วหาผลรวมของเลขเหล่านั้น.
เนื้อหา ประเภทของโปรแกรมภาษา ขั้นตอนการพัฒนาโปรแกรม
บทที่ 1. พื้นฐานความรู้ทั่วไป
ระบบข้อสอบออนไลน์.
2.5 ตัวแปรชุดมิติเดียวและตัวแปรชุดสองมิติ
การจำแนกบรรทัดข้อความ
ระบบจำนวนเต็ม โดย นางสาวบุณฑริกา สูนานนท์
กรณีศึกษา : งานบริหารและธุรการ คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
กรณีศึกษา มหาวิทยาลัยเนชั่น จังหวัดลำปาง
ตัวชี้วัดที่ 3 ระดับความสำเร็จของร้อยละเฉลี่ยถ่วงน้ำหนักในการบรรลุเป้าหมาย ตามแผนปฏิบัติราชการของหน่วยงาน.
CPE 491 Proposal (สอบเสนอหัวข้อเพื่อทำ Project)
การสอบถามข้อมูลด้วยฟังก์ชั่นสำหรับ
การสอบถามข้อมูลแบบซ้อนกัน
Week 12 Engineering Problem 2
ขั้นตอนการจัดทำโครงงาน
หลักการเขียนโปรแกรม ( )
การผลิตวีดิทัศน์เพื่อการศึกษา Video Production for Education รหัสวิชา:
stack #2 ผู้สอน อาจารย์ ยืนยง กันทะเนตร
หลักการเขียนโปรแกรม ( )
หน่วยรับเข้า ทำหน้าที่รับข้อมูลจากผู้ใช้เข้าสู่หน่วยความจำหลัก ปัจจุบันมีสื่อต่าง ๆ ให้เลือกใช้ได้มากมาย แบ่งเป็นประเภทต่าง ๆ 1.แป้นพิมพ์ (Keyboard) 2.เมาส์
การเรียนรู้ร่วมกันผ่านทางสื่ออิเล็คทรอนิกส์ Electronic Community Learning COE นายกิตติกัญจน์ เมฆประสาน นายจักรพงศ์ เปลี่ยนคำ
หลักการทั่วไปเกี่ยวกับการเขียนโปรแกรม
ใบสำเนางานนำเสนอ:

ระบบสรุปเอกสารภาษาไทย Thai-Text Summarization COE2008-23 โดย นางสาวอารยา จึงสุวัฒนานนท์ รหัส 483040172-1 นางสาวกฤติกา สุเสนา รหัส 493041114-1 อาจารย์ที่ปรึกษาโครงงาน อ.วนิดา แก่นอากาศ อาจารย์ผู้ร่วมประเมิน อ.วสุ เชาว์พานนท์ อ.รุจชัย อึ้งอารุณยะวี

Outline หลักการทำงานของโปรแกรม ผลการทดสอบโปรแกรม แนวความคิดในการให้ค่าน้ำหนักของประโยค แนวความคิดในการดึงใจความสำคัญของเอกสาร ปัญหาและอุปสรรค

หลักการทำงานของโปรแกรม (ตัดคำและนับความถี่) นำเอกสารที่อ่านได้ มาเก็บใน Buffer Reader เรียกฟังชันก์ BreakIterator เพื่อใช้ตัดคำจากเอกสารที่อ่านได้ อ่านไฟล์เอกสาร ตรวจสอบว่าคำที่ตัดได้ จากเอกสารว่าหมดหรือยัง หมด เพิ่มค่า Word count ของคำนั้น ให้ค่าน้ำหนักประโยค ยังไม่หมด ตรวจสอบคำ ว่ามีอยู่ ใน Word Table หรือยัง มี เพิ่มคำลงใน Word table และกำหนด Word count =1 ไม่มี

ผลการทดสอบโปรแกรม Input

ผลการตัดคำ

ผลการนับค่าความถี่ของคำ

Input

ผลการนับค่าความถี่ของคำ

แนวความคิดในการให้ค่าน้ำหนักของประโยคเพื่อการสรุปเอกสาร รับค่าความถี่ของคำ เอาค่าความถี่ของคำนั้นบวกเข้าในตัวแปร score of segment หมดแล้ว ตรวจสอบว่าหมดคำ ในเอกสารหรือยัง ยังไม่หมด เรียงลำดับประโยคจากมากไปน้อยตามค่า score of segment ไม่ใช่ ตรวจสอบว่าใช่ “ ” หรือไม่ ใช่ การดึงใจความสำคัญ เลื่อน pointer ชี้ไปยังscore of segment ถัดไป

แนวความคิดการดึงใจความสำคัญของเอกสาร เรียงประโยคตามค่าน้ำหนัก รับ Input เป็นค่า%ของเอกสารต้นฉบับ Output = (Input)(จำนวนประโยคทั้งหมด)/100 แสดงประโยคเรียงตามค่าน้ำหนัก จำนวนประโยคเท่ากับค่าที่คำนวณได้

ปัญหาและอุปสรรค แผนการทำงาน การตัดคำ หลักภาษาไทย แนวความคิดในการสรุปเอกสารภาษาไทย

Q&A