ความก้าวหน้าของการพัฒนา ระบบระบุผู้พูดภาษาไทย

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
ความคิดเห็นของประชาชนที่มีต่อ พ.ร.บ.ข้อมูลข่าวสารของราชการ พ.ศ. 2548
Advertisements

V-NET คืออะไร V-NET ย่อมาจาก Vocational National Education Test หมายถึงการทดสอบทางการศึกษาระดับชาติ ทางด้านอาชีวศึกษา เป็นการทดสอบวัดความรู้มาตรฐานทางวิชาการและวิชาชีพ.
พลังงานในกระบวนการทางความร้อน : กฎข้อที่หนึ่งของอุณหพลศาสตร์
งานวิจัย เรื่อง ผลการใช้แบบฝึกการเขียนคำที่มี รูปวรรณยุกต์กำกับ
โครงการเพิ่มช่องทางการรับชำระเงินค่าหอพัก
คำอธิบายรายวิชา ระบบธุรกิจ วัฏจักรของการพัฒนาระบบงาน ระเบียบ วิธีการและเครื่องมือในการวิเคราะห์ ผังงานระบบ ตารางและการตัดสินใจ การศึกษาความเป็นไปได้ของระบบการวิเคราะห์ความคุ้มค่าในการลงทุนในการพัฒนา.
อาจารย์ผู้ร่วมประเมิน
สถานภาพด้านวิทยาศาสตร์ และเทคโนโลยีของประเทศไทย
แนวทางการยกระดับผลสัมฤทธิ์ทางการเรียน ผลการทดสอบระดับชาติ (o – net) ปีการศึกษา 2554 โรงเรียนสรวงสุทธาวิทยา สำนักงานเขตพื้นที่การศึกษามัธยมศึกษา เขต.
รายงาน ผลการประเมินคุณภาพ ประจำปี 2553
จำนวนเต็ม จำนวนเต็ม  ประกอบด้วย                   1. จำนวนเต็มบวก    ได้แก่  1 , 2 , 3 , 4, 5 , ....                   2.  จำนวนเต็มลบ      ได้แก่  -1.
การทดสอบเลี้ยงต้นหม้อข้าวหม้อแกงลิงในดินชนิดต่างๆ
โดย ดร. ดลฤทัย ขาวดีเดช คณะมนุษยศาสตร์ มหาวิทยาลัยหอการค้าไทย
การสรรหาบุคคลภายนอก.
คนึงนิตย์ หีบแก้ว ธันยกานต์ สินปรุ พุทธชาติ เรืองศิริ
กราฟถ่วงน้ำหนัก เสนอต่อ อ.ธรรมนูญ ผุยรอด จัดทำโดย
เอกสารประกอบการประชุมผู้บริหาร มจธ.
การศึกษาและพัฒนาอาคารวัดปริมาณน้ำ ที่มีระดับต่างคงที่ (CHO)
ข้อเสนอ แนวทางการกำหนดระยะเวลาดำรงตำแหน่ง
กระบวนการคิดทางคณิตศาสตร์
ภาพรวมแผนผังเชิงกลยุทธ์ (Strategy Map)
Thai Handwritten Character Recognition by Artificial Neural Networks
Thai Handwritten Character Recognition by Artificial Neural Networks
การให้ข้าราชการพลเรือนสามัญได้รับ เงินประจำตำแหน่ง
กรณีศึกษา : งานบริหารและธุรการ คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
ปรับปรุงล่าสุด 20/01/53 สรุป ACM Digital Library โดย... จิรวัฒน์ พรหมพร แผนกสนับสนุนฝ่ายทรัพยากร อิเล็กทรอนิกส์ทางการศึกษา บริษัท บุ๊ค.
กรณีศึกษา มหาวิทยาลัยเนชั่น จังหวัดลำปาง
“ทำงานประจำให้เป็นงานวิจัย R to R”
ชี้แจงวัตถุประสงค์ เนื้อหารายวิชา และหลักเกณฑ์ในการวัดผล
การทดสอบสมมติฐาน
ความคิดเห็นของประชาชนเกี่ยวกับมาตรการ การตรึงราคา/กำหนดระดับราคาน้ำมัน
ความคิดเห็นของข้าราชการเกี่ยวกับ สวัสดิการการรักษาพยาบาล พ.ศ. 2546
สำนักงานสถิติแห่งชาติ กระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร
สรุปผลการสำรวจ ความคิดเห็นของประชาชนเกี่ยวกับ กองทุนหมู่บ้านและชุมชนเมือง พ.ศ สำนักงานสถิติแห่งชาติกระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร สิงหาคม.
1 การสัมมนาผู้ตรวจ ประเมินคุณภาพภายใน ปีการศึกษา 2552 วันพฤหัสบดีที่ 21 ตุลาคม 2553 ณ ห้องประชุม 3222 อาคารสิริคุณากร.
การวิจัยในชั้นเรียนด้านอาชีวศึกษา
เรื่อง การซ่อน - แสดงคอลัมน์ / แถว จัดทำโดย ด. ช. พงศ์วริศ ชาติชะนา ชั้น ม. 2/5 เลขที่ 37 เสนอ อาจารย์ ภานุมาศ ชาติทองแดง โรงเรียนวชิรธรรมสาธิต.
ภาษาวิทยุกระจายเสียง
iWall โดย 1. นายวีกิจ สัจจะมโนรมย์
เทคนิคการสืบค้น Google
การเลื่อนตำแหน่งสายสนับสนุน
คณะวิทยาศาสตร์และเทคโนโลยี
การพัฒนาระบบการเรียนทางไกลให้อยู่ในรูปแบบของเทคโนโลยีสารสนเทศ Application of Information Technology System into Distance Learning Presented by: Sunadda.
ขั้นตอนการจัดทำโครงงาน
เอกสารประกอบรายงานการประชุมข้าราชการ สำนักงานสรรพสามิตพื้นที่อุบลราชธานี ครั้งที่ 11/2556 เมื่อวันศุกร์ ที่ 29 พฤศจิกายน 2556 ณ ห้องประชุม หน้าห้องฝ่ายปราบปราม.
แนวคิดในการทำวิจัย.
วิธีดำเนินการพัฒนาโครงงานคอมพิวเตอร์
Search Engine จัดทำโดย น. ส. กรรณิดา เดิมบางปิด เลขที่ 1 น. ส. เกศินี ศรีอินทร์สุทธิ์ เลขที่ 4 น. ส. เบญจวรรณ แซ่อั๊ง เลขที่ 51 1.
การค้นคว้าข้อมูลจากฐานข้อมูลต่างๆ ในอินเทอร์เน็ต
WorkShop I (10 points) ค้นหาข้อมูลบน Internet ทำเป็นชิ้นงานส่งมา ทาง – เลขที่ 1-5 ความสัมพันธ์ของข้อมูลและสารสนเทศ – เลขที่ 6-10 กระบวนการผลิตสารสนเทศ.
ความหมายของวิทยาศาสตร์
ศึกษาวิจัยการดำเนินงานโครงการลดจำนวนการออกกลางคันของนักศึกษาวิทยาลัยเทคโนโลยีอุตรดิตถ์ ปีการศึกษา 2556 นายไพศาล บุญประเสริฐ วิทยาลัยเทคโนโลยีอุตรดิตถ์
สรุปผลการสำรวจ ความคิดเห็นของประชาชนเกี่ยวกับ การป้องกันและปราบปรามยาเสพติด (ก่อนและหลัง การประกาศสงครามขั้นแตกหักเพื่อเอาชนะยาเสพติด) พ.ศ สำนักงานสถิติแห่งชาติ
ผลการทดสอบทางการศึกษาระดับชาติขั้นพื้นฐาน
ชื่อผู้วิจัย: นางสาวเมธิกา ชาพิมล
การเขียนบทวิทยุกระจายเสียง. ขั้นตอนการเขียนบทรายการวิทยุ ขั้นเริ่มต้นแนวคิด (Begin with idea) จะเป็น การบอกแนวทาง ขอบเขตและการวาง แผนการผลิตในอนาคต.
ความรู้พื้นฐานเกี่ยวกับการโปรแกรมคอมพิวเตอร์
การวิเคราะห์วิทยานิพนธ์ปริญญามหาบัณฑิต สาขาวิชาสังคมศึกษา มหาวิทยาลัยขอนแก่น ในช่วงปี พ.ศ Analysis of Master’s Thesis in Social Studies.

การสื่อสารข้อมูลและเครือข่ายคอมพิวเตอร์
บท นำ ความ เป็นมา และ ความสำ คัญของ ปัญหา การเรียนการสอนที่ใช้อยู่ในปัจจุบัน มี วัตถุประสงค์ประการหนึ่ง คือมุ่งปลูกฝังให้นักเรียน ได้ใฝ่รู้ใฝ่เรียนการปลูกฝังให้นักเรียนรักการอ่านจึงมี
สังกัด วิทยาลัยเทคโนโลยีการจัดการเพชรเกษม
ระดับประกาศนียบัตรวิชาชีพชั้นปีที่ 3
การปรับให้ได้รับเงินเดือน ตามคุณวุฒิ
รายงานความก้าวหน้าการตรวจติดตามประเมิน
ผลการประเมิน คุณภาพการศึกษาขั้นพื้นฐาน ปีการศึกษา
การเปรียบเทียบผลสัมฤทธิ์ทางการเรียนวิชาคณิตศาสตร์พื้นฐาน
ชื่อเรื่อง. ผลการติดตามลักษณะการมีงานทำ ภายใน 1 ปี
Chapter 8 Classification อาจารย์อนุพงศ์ สุขประเสริฐ
ใบสำเนางานนำเสนอ:

ความก้าวหน้าของการพัฒนา ระบบระบุผู้พูดภาษาไทย Thai Language Speaker Identification System: Development Progress ชัย วุฒิวิวัฒน์ชัย, สุทัศน์ แซ่ตั้ง และวารินทร์ อัจฉริยะกุลพร คณะนักวิจัยและพัฒนาระบบระบุผู้พูดสำหรับภาษาไทย ฝ่ายกลุ่มวิจัยและพัฒนาเทคโนโลยีสารสนเทศ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

ขอบเขตของงาน Speaker Identification Text Dependent (Fixed Text) Closed Set System Office Environment Speaker Identification Speaker Verification Text Dependent (Fixed Text) Text Independent (Free Text) Closed Set System Open Set System Office Environment Telephone Environment

Speaker Identification System (SID) 16-bit Quantization 11025-Hz Sampling Rate Digital Filtering Endpoint Detection Time Normalization Preemphasis Frame Blocking Smoothing Window Feature Analysis

การทดลองขั้นต้น • ผู้พูดจำนวน 20 คน (ชาย 11 หญิง 9) • ผู้พูดจำนวน 20 คน (ชาย 11 หญิง 9) • พูดตัวเลขละ 10 ครั้ง/สัปดาห์ 5 สัปดาห์ Train: สัปดาห์ที่ 1-3, Test: สัปดาห์ที่ 4-5 • 10-order Linear Prediction Coefficient (LPC) • Artificial Neural Network (ANN): Multilayer Perceptron (MLP) & Backpropagation Algorithm Euclidean Distance & Maximum Likelihood Dynamic Time Warping (DTW) & K-Nearest Neighbor (KNN)

การทดลองเกี่ยวกับ Recognition Engine: ANN • ผู้พูดจำนวน 20 คน (ชาย 11 หญิง 9) • 15-order Linear Prediction Derived Cepstrum (LPCC) • ANN: Normal Input Feeding (1 Net/All Speakers) Window Input Feeding (1 Net/Speaker)

การทดลองเกี่ยวกับ Recognition Engine: DTW การเทียบเคียงด้วยการเติมค่า 0 ต่อท้ายเสียง ที่สั้นกว่าให้ผลดีและใช้เวลาน้อยที่สุด 84.53% 71.32% 84.29% • ผู้พูดจำนวน 50 คน (ชาย 30 หญิง 20) • 15-order LPCC เสียงอ้างอิงจำนวน 20 เสียง พอเพียง สำหรับระบบระบุผู้พูด 50 คน • ผู้พูดจำนวน 50 คน (ชาย 30 หญิง 20) • 15-order LPCC • Train : 30 เสียง 20 เสียง 10 เสียง 84.53% 84.61% 82.26%

การทดลองเกี่ยวกับ Speech Feature • ผู้พูดจำนวน 20 คน (ชาย 11 หญิง 9) • 10 & 15-order LPC & LPCC • DTW + KNN

ณ ปัจจุบัน

การทดลองอื่นๆ • ผู้พูดจำนวน 20 คน (ชาย 30 หญิง 20) • 15-order LPCC SOLA ให้ผลดีกว่า Interpolation ควรหลีกเลี่ยงการใช้ Time Normalization • ผู้พูดจำนวน 20 คน (ชาย 30 หญิง 20) • 15-order LPCC • ANN (MLP+Backpropagation) • Time Normalization : Interpolation & SOLA เสียงวรรณยุกต์ผสม ให้ผลดีที่สุด เสียงวรรณยุกต์ประเภท Dynamic (โท, จัตวา) ให้ผลดีกว่าเสียงวรรณยุกต์ประเภท Static (สามัญ, เอก, ตรี) • ผู้พูดจำนวน 9 คน (ชาย 5 หญิง 4) • 10-order LPC • ANN (MLP+Backpropagation) • คำพูดที่ใช้ : สามัญ เอเอเอเอเอ เอก เอ่เอ่เอ่เอ่เอ่ โท เอ้เอ้เอ้เอ้เอ้ ตรี เอ๊เอ๊เอ๊เอ๊เอ๊ จัตวา เอ๋เอ๋เอ๋เอ๋เอ๋ ผสม เอ๋เอ่เอ้เอ๊เอ๋

บทสรุป • ระบบระบุผู้พูดจำนวน 50 คน • ใช้กับเสียง ตัวเลข 0-9 • ระบบระบุผู้พูดจำนวน 50 คน • ใช้กับเสียง ตัวเลข 0-9 • อัตราการระบุผู้พูด 92.3% สำหรับเสียงเลข “5” • อัตราการระบุผู้พูดมากกว่า 98% สำหรับเสียงเลขต่อกัน 3 ตัว • ขาดแคลนฐานข้อมูลขนาดใหญ่ที่เป็นมาตรฐาน • DTW ซึ่งให้ผลดีที่สุดในปัจจุบัน ยังใช้เวลาในการระบุผู้พูดนานมาก • พัฒนาต่อเนื่องไปยังระบบที่ใช้กับเสียงผ่านสายโทรศัพท์

Demonstration