Speech Research and Corpora in Thailand Virach Sornlertlamvanich Information Research and Development Division National Electronics and Computer Technology.

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
“โครงการบ่มเพาะและเตรียมความพร้อมบุคลากร ป้อนสู่อุตสาหกรรมซอฟต์แวร์”
Advertisements

Chapter 5 Expert Systems
ความก้าวหน้าของการพัฒนา ระบบระบุผู้พูดภาษาไทย
เปรียบเทียบจำนวนประชากรทั้งหมดจากฐาน DBPop Original กับจำนวนประชากรทั้งหมดที่จังหวัดถือเป็นเป้าหมาย จำนวน (คน) 98.08% % จังหวัด.
การจัดการความรู้สำหรับองค์กร
รูปแบบการจัดวางสามารถปรับได้ตามความสะดวก -แบบตัวอักษรใช้ THsarabunPSK
การขุดค้นข้อมูล (Data Mining)
HTML เอกสารประกอบการบรรยายรายวิชา Browser-Based Application Development.
คำถาม กระทรวงใหม่ที่ดูแลทางด้าน IT ชื่อกระทรวงอะไร?
ศุภโชค จันทรประทิน ผู้ช่วยนักวิจัย ห้องปฎิบัติการเครือข่ายคอมพิวเตอร์
INC341 State space representation & First-order System
Image Processing & Computer Vision
A/Prof.Dr.Supot Nitsuwat
กรณีศึกษา : งานบริหารและธุรการ คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์
การพัฒนาระบบค้นคืนเอกสารอิเล็กทรอนิกส์ สำหรับงานสารบรรณ
ข้อมูล & สารสนเทศ ข้อมูล ( Data) - ข้อเท็จจริงที่ได้จากการ สังเกตุ หรือสำรวจความเป็นไปของเหตุการณ์ ของโลกเพื่อให้เกิดความเข้าใจในเหตุการณ์ นั้น สารสนเทศ.
ภาษาอังกฤษสำหรับสถานประกอบการ ENGLISH FOR THE WORKPLACE
องค์ประกอบทางด้านซอฟต์แวร์
: English-Thai Machine Translation Services on Internet
ความก้าวหน้าเทคโนโลยีของไทย
เรื่องเทคโนโลยีในชีวิตประจำวัน
การพัฒนาระบบการเรียนทางไกลให้อยู่ในรูปแบบของเทคโนโลยีสารสนเทศ Application of Information Technology System into Distance Learning Presented by: Sunadda.
Parts of Speech ( ชนิดของคำ )
ผู้ช่วยศาสตราจารย์ สุพรรณี สมบุญธรรม
ARTIFICIAL INTELLIGENCE
Programming & Algorithm
Present Continuous.
Wild animals.
Image Processing Course
These examples show that the subject is doing the verb's action.
Image Enhancement and Restoration
Korean made easy for Starters
Image Processing Course
นวัตกรรมและเทคโนโลยีการเรียนการสอน
เทคโนโลยีสารสนเทศ อาจารย์ศิริพร ศักดิ์บุญญารัตน์
Information Systems Development
Microsoft Access การใช้งานโปรแกรมระบบจัดการฐานข้อมูล
Economy Update on Energy Efficiency Activities
Introduction to Intelligent Systems
13 October 2007
Toward National Health Information System
การออกแบบอีเลิร์นนิง
บทที่ 5 แบบจำลองกระบวนการ
ชัยเมศร์ อมรพลสมบูรณ์
13 October 2007
การประเมิน ความผิดปกติทางภาษาและการพูดในเด็กออทิสติค
Generic View of Process
Introduction to Data mining
บทที่ 1 ความรู้เบื้องต้น เกี่ยวกับระบบสารสนเทศ
13 October 2007
By Dr. Khunakorn Khongchana Lecturer of English Program
Thailand Standards TMC.WFME.BME. Standards (2017)
เรียนคำศัพท์ 1 Simple Nouns
การวิเคราะห์คำค้น ในรูปแบบ Word Cloud เพื่อสนับสนุนงานบริการสารสนเทศของห้องสมุด Keywords Analysis in Word Cloud for supporting library information services.
กลุ่มพัฒนาเครือข่ายและสถานศึกษาต้นแบบ
Development Strategies
การพัฒนาระบบสารสนเทศ
การเขียนโปรแกรมคอมพิวเตอร์
Information Retrieval
(Natural Language Processing)
เรียนคำศัพท์ Vocabulary Expansion Exercise Prawet Jantharat, Ed.D.
เทคโนโลยีสารสนเทศ อาจารย์ศิริพร ศักดิ์บุญญารัตน์
Information Retrieval
01 การจัดเก็บและค้นคืนสารสนเทศ พัฒนาการ.
อ.พิณรัตน์ นุชโพธิ์ คณะวิทยาการจัดการ มหาวิทยาลัยราชภัฏพิบูลสงคราม
การพัฒนา IT ให้บูรณาการเข้ากับโครงสร้างและระบบงาน
วิศวกรรมซอฟต์แวร์ วิศวกรรมซอฟต์แวร์ (Software Engineering)
CIT2205 โปรแกรมประยุกต์ด้านการจัดการฐานข้อมูล
Introduction to Structured System Analysis and Design
การทำเหมืองข้อมูลด้วยโปรแกรม RapidMiner Studio
ใบสำเนางานนำเสนอ:

Speech Research and Corpora in Thailand Virach Sornlertlamvanich Information Research and Development Division National Electronics and Computer Technology Center (NECTEC) THAILAND Oriental COCOSDA Workshop 2000, Oct. 16, 2000, Beijing, China.

Introduction to Thai (1): Morphology สวัสดีครับ ผมชื่อวิรัช ศรเลิศล้ำวาณิช ปัจจุบันเป็นผู้อำนวยการฝ่าย วิจัยและพัฒนาสาขาสารสนเทศ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์ และคอมพิวเตอร์แห่งชาติ ผมเริ่มสนใจงานวิจัยในสาขาการ ประมวลผลภาษาธรรมชาติตั้งแต่ที่ได้มีโอกาสเข้าร่วมโครงการวิจัย และพัฒนาระบบแปลภาษาในปี 1989 Running text (a paragraph): Writing in 4 levels No. of characters (signs) 46 consonants; 18 vowels; 4 tones; 9 symbols; 10 digits No word boundary Ex: “GODISNOWHERE” 1) God is nowhere 2) God is now here 3) God is no where vowel consonant tone vowel

Introduction to Thai (2): Syntax No explicit sentence marker - space character for pausing Sentence pattern - (S) (V) (O) Ex: ฉัน เห็น เขา (I) (saw) (him) No inflection forms - tenses use adverbs and auxiliary verbs - plural or singular nouns use quantifiers, classifiers or determiners - subject-verb agreements No syntactic marker - word position

Introduction to Thai (3): Phonology A Thai syllable (sounds): / C(C) V(V) C T / initial consonant (33) vowel (24) final consonant (8) tonal level (5) Different tones convey different meanings /su:aj4/ = beautiful /su:aj0/ = terrible No liaison: A word has the same pronunciation, no matter where it is. Linking syllable pronunciation: ตุ๊กแก (gecko) = tuk4 - kae -> ตุ๊ก = tuk4 ตุ๊กตา (doll) = tuk4 - ka1 - ta0 -> ตุ๊ก = tuk4 - ka1 (grapheme to phoneme conversion)

Introduction to Thai (4): Summary Simple grammar - easy for generation - hard for analysis and recognition Sharable problems among Asian languages - word segmentation - indexing for IR - lexical acquisition - tone recognition and generation

Research on Speech (1): Recognition Tone recognition Thai Tones Object: Syllable-segmented speech - Feature: Energy, Zero-crossing, F0 Current state - Continuous speech Ongoing Syllable detection - Object: Connected speechCurrent state - Feature: Energy, Zero-crossing, Duration - Continuous speechOngoing - Method: Neural net, Analysis-by-synthesis

Isolated word-based recognition Current state- Mel-frequency cepstrum (MFC) - Neural net, Fuzzy, HMM Ongoing- Applications (digits, commands) Large vocabulary continuous speech recognition (LVCSR) Current state- Isolated phoneme recognition - Preparing basic tools for CSR Ongoing- Creating LVCSR corpus Research on Speech (2): Recognition

Text analysis Current state - Word / Phrase / Sentence segmentation by POS tagging model, Rule, Machine learning - Letter-to-sound: Rules and Pronunciation dictionary Ongoing- Letter-to-sound: PGLR parser (87-94%) Speech synthesis Current state- Demisyllable-concatenation based - LSP-based spectral smoothing - Duration adjustment - F0 contour smoothing Ongoing- Smoothing, Statistical prosody analysis Research on Speech (3): Synthesis

LSP parameter smoothing ยา /ja:/ /ja/ /a:/ Research on Speech (4): Synthesis

Speaker identification (SID) Current state- Text-dependent, Closed speaker set, - Dynamic time warping (DTW; 90-97%), Gaussian mixture model (GMM; %) Office environment speech Ongoing- Telephony environment speech Speaker verification (SV) - Ongoing Research on Speech (5): Speaker Recognition

Thai Speech Corpora (1) Current state: - A number of separated speech corpora e.g. Speech database of Thai digits 0-9 for SID Speech database of Thai polysyllabic words Ongoing: - LVCSR corpus for Speech dictation system up to 5,000 vocabulary size with Phonetically-balanced set - Prosody tagging speech corpus for statistical prosody analysis in improving synthesis system

Thai Speech Corpora (2) Basic tools required: Dictionary - Manually coding - Corpus-based extraction Word segmentation - Longest matching (92%) - Maximal matching (93%) - POS N-gram (96%) - Machine learning (97%) Sentence extraction - POS N-gram (85%) - Machine learning (89%)

Thai Speech Corpora (3) Basic tools required: Letter-to-sound - Rule-based and dictionary - PGLR parser(87%- 94%) Basic tagged corpus - ORDHID: POS tagging corpus 160 documents; 5.75 MB; 311,426 words Other tools - Automatic sentence selection for phonetically balanced set - Automatic phoneme labeling

Thai Text to Speech: Demo สวัสดีครับ ผมชื่อวิรัช ศรเลิศล้ำวาณิช ปัจจุบันเป็น ผู้อำนวยการฝ่ายวิจัยและพัฒนาสาขาสารสนเทศ ศูนย์ เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ ผม เริ่มสนใจงานวิจัยในสาขาการประมวลผลภาษาธรรมชาติ ตั้งแต่ที่ได้มีโอกาสเข้าร่วมโครงการวิจัยและพัฒนาระบบ แปลภาษาในปี 1989 Hello, I am Virach Sornlertlamvanich, the director of Information Research and Development Division, National Electronics and Computer Technology Center. I began to interest myself in the research of Natural Language Processing since having a chance in participating in the Machine Translation Research and Development project in 1989.