งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

Superior COmmunications Research and Prototyping for commercialization นายชิตชานน์ ตรีน้อย วา กลุ่มที่ 3 ส่วนประมวลผลสัญญาณ ดิจิตอลเบสแบนด์ SCORPion Research.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "Superior COmmunications Research and Prototyping for commercialization นายชิตชานน์ ตรีน้อย วา กลุ่มที่ 3 ส่วนประมวลผลสัญญาณ ดิจิตอลเบสแบนด์ SCORPion Research."— ใบสำเนางานนำเสนอ:

1 Superior COmmunications Research and Prototyping for commercialization นายชิตชานน์ ตรีน้อย วา กลุ่มที่ 3 ส่วนประมวลผลสัญญาณ ดิจิตอลเบสแบนด์ SCORPion Research Group EE Department, Kasetsart University, Thailand 3G Research Project Meeting HuaHin Grand and Plaza Hotel October 12, 2003 AMR Wideband Speech Codec (AMR – WB)

2 Superior COmmunications Research and Prototyping for commercialization ความคืบหน้า  ศึกษาระบบ AMR- WB ในภาพรวม  ศึกษาทฤษฎีพื้นฐานในด้าน Discrete- Time Signal Speech Processing  ศึกษาทฤษฎี ACELP

3 Superior COmmunications Research and Prototyping for commercialization แนวทางการนำเสนอ  ภาพรวม AMR-WB  Speech Production Model  Linear Prediction Analysis  Code-Excited Linear Prediction (CELP)  Algebraic Code-Excited Linear Prediction (ACELP)  แผนการทำงาน

4 Superior COmmunications Research and Prototyping for commercialization AMR-WB (Adaptive Multi-Rate Wideband)  AMR-WB (Adaptive Multi-Rate Wideband) เป็นระบบที่ทำการบีบอัด สัญญาณเสียงในช่วงแถบความถี่ 8 kHz สามารถเปลี่ยนอัตราการบีบอัดในช่วง ระหว่าง 6.60 – kbit/s ได้ตามสภาพ ช่องสัญญาณ และใช้ช่วงเวลาที่มีแต่ background noise ซึ่งมีมากถึง 50 % ลด อัตราการส่งข้อมูลลงเป็น 1.75 kbit/s ทำ ให้อัตราการส่งข้อมูลโดยเฉลี่ยของระบบ ลดลง โดย Algorithm ในส่วนที่ทำการบีบ อัดสัญญาณเสียงใช้ ACELP

5 Superior COmmunications Research and Prototyping for commercialization AMR-WB (Adaptive Multi-Rate Wideband) AMR-WB 14 bit Uniform PCM samples/s 320 samples/fram e 224 kbits/s 20 ms/frame 50 frames/s 1.75 ~ kbits/s

6 Superior COmmunications Research and Prototyping for commercialization Speech Production Model  AMR – WB เป็น Speech Coder ประเภท Vocoder ซึ่งการบีบอัดขึ้นกับ Source ของ สัญญาณเสียงเนื่องจาก encoder จะ พยายามหาโมเดลของ Source แล้วส่ง parameter ที่จำเป็นในการสร้างโมเดลของ Source นั้นขึ้นใหม่ที่ decoder ทำให้อัตรา การส่งข้อมูลจากการบีบอัดมีค่าต่ำ

7 Superior COmmunications Research and Prototyping for commercialization Speech Production Model  Sound Type  Voiced Sound  Unvoiced Sound  Vocal Tract Model  Boundary Loss

8 Superior COmmunications Research and Prototyping for commercialization Voiced Sound  Voiced Sound ถูกนิยามเป็นเสียงที่ได้ จากการ Modulate โดยกล่องเสียงใน ช่วงเวลาเล็กๆจะมีลักษณะเป็น periodic

9 Superior COmmunications Research and Prototyping for commercialization Voiced Sound  นิยาม Pitch Period (P) เป็นเวลา 1 คาบ สัญญาณ ถ้าให้ G(  ) เป็น Fourier Transform ของ g[n] ซึ่งเป็นรูปของ 1 คาบสัญญาณ จะ แสดงรูปสัญญาณทั้งหมด U(  ) ดังนี้  โดย G(  ) ถูกโมเดลในรูป Z transform เป็น

10 Superior COmmunications Research and Prototyping for commercialization Unvoiced Sound  Unvoiced Sound ถูกนิยามเป็นเสียงที่ได้ จากลมเสียดสีกับอวัยวะในช่องปากโดย กล่องเสียงเปิดตลอดเวลาและถูกโมเดลเป็น สัญญาณรบกวน N(  ) white Gaussian noise

11 Superior COmmunications Research and Prototyping for commercialization Vocal Tract Model  ช่องปากเป็นตัวทำหน้าที่ Spectrum shaping ของ Voiced และ Unvoiced Sound โดยถ้าให้ Transfer function ของ ช่องปากเป็น V(  ) จะได้เสียงที่ออกช่อง ปากเป็น

12 Superior COmmunications Research and Prototyping for commercialization Vocal Tract Model  เราสามารถหา V(z) ได้โดยโมเดลช่องปาก เป็น Uniform tube ที่มีเส้นผ่าศูนย์กลาง และความยาวๆต่างๆมาต่อกัน แก้สมการ คลื่น จะเขียนโมเดลในรูปของ Z transform ได้เป็น

13 Superior COmmunications Research and Prototyping for commercialization Boundary Loss  Boundary Loss เป็นค่าความสูญเสีย เนื่องจากการเปล่งเสียงถูกโมเดลโดย High pass filter R(z) ดังนี้

14 Superior COmmunications Research and Prototyping for commercialization Speech Production Model  จากทั้งหมดที่กล่าวมาเราสามารถหา Transfer function รวมของระบบ H(  ) ได้ ดังนี้  โดย Av เป็น gain ใดๆ และ input ของ Voiced Sound เป็น train ของ impulse และ ของ Unvoiced Sound เป็น white Gaussian noise

15 Superior COmmunications Research and Prototyping for commercialization Speech Production Model  ดังนั้นสรุปว่าเราสามารถหา Transfer function H(  ) ให้อยู่ในรูป all pole model ได้

16 Superior COmmunications Research and Prototyping for commercialization Linear Prediction Analysis  Linear Prediction (LP) เป็นวิธีวิเคราะห์ pole ใน all pole model โดยมีหลักอยู่ว่า สัญญาณใดๆในปัจจุบันมี correlation กับ สัญญาณในอดีต

17 Superior COmmunications Research and Prototyping for commercialization Linear Prediction Analysis  ถ้าให้ S[n] เป็นสัญญาณเสียงที่เราได้ยิน, U[n] เป็นสัญญาณ train ของ impulse หรือ noise, H(  ) เป็นโมเดลของ Speech Production ที่มีแต่ pole และมี order เป็น p เราจะได้  เขียนให้อยู่ใน Time domain ได้เป็น

18 Superior COmmunications Research and Prototyping for commercialization Linear Prediction Analysis  ดังนั้นเราสามารถประมาณ S[n] จาก  ถ้าให้ e[n] เป็น predictor error sequence ที่เกิดขึ้นจะได้

19 Superior COmmunications Research and Prototyping for commercialization Linear Prediction Analysis  ถ้าให้ A(Z) เป็น Prediction Error Filter  จะได้

20 Superior COmmunications Research and Prototyping for commercialization Linear Prediction Analysis  การหาค่า a k ดังกล่าวทำได้โดยให้ Error Minimization Criteria  กรณี U[n] เป็น impulse train ให้ จะหาค่า a k โดยการแก้สมการ

21 Superior COmmunications Research and Prototyping for commercialization Linear Prediction Analysis  กรณี U[n] เป็น White Gaussian Noise มีแนวคิดเดียวกันแต่คิดในลักษณะของ random process โดยทำให้ E(e 2 [n]) ต่ำ ที่สุด  ในทางปฎิบัติมีวิธีในการหา A(Z) หลายวิธี ได้แก่ covariance method, autocorrelation method, Levinson Recursion

22 Superior COmmunications Research and Prototyping for commercialization Code-Exited Linear Prediction (CELP)  CELP เป็น Speech Coding แบบ Analysis by Synthesis กล่าวคือ Encoder จะวิเคราะห์สัญญาณ S[n] โดย การสร้างสัญญาณขึ้นมาใหม่ S’[n] โดยให้ S’[n] = S[n] หรือให้ e w [n] น้อยที่สุด แล้ว ใช้ Parameter ที่ใช้สร้างสัญญาณ S’[n] ส่งไปยัง Decoder

23 Superior COmmunications Research and Prototyping for commercialization Code-Exited Linear Prediction (CELP) Residu al Genera tor Long Term Predict or Short Term Predict or - V[n ] U[n ] S’[n ] S[n ] Error minimiz ation Percept ual Weight e w [n ]

24 Superior COmmunications Research and Prototyping for commercialization Code-Exited Linear Prediction (CELP)  Short Term Predictor โดยสมมุติว่า สัญญาณเป็น stationary และ ช่องปาก เปลี่ยนแปลงช้ามากใน 1 เฟรม ทำการหา A(z) จากนั้นใช้ A(z) ที่หาได้สร้าง S’[n] เพื่อเปรียบเทียบกับ S[n] โดย

25 Superior COmmunications Research and Prototyping for commercialization Code-Exited Linear Prediction (CELP)  Long Term Predictor เป็นตัวตัด redundancy ของ Voice Sound ที่เป็น periodic source ออกไป และจะกระทำ ทุกๆ Subframe เนื่องจากการเปลี่ยนของ source จะเร็วกว่าการเปลี่ยนของช่องปาก โดย Transfer function จะอยู่ในรูป

26 Superior COmmunications Research and Prototyping for commercialization Code-Exited Linear Prediction (CELP)  Residual Generator ในกรณีของ CELP ส่วนนี้จะเป็น Codebook ที่ Sequence ของ V[n] จะบ่งบอกโดยใช้ Index ซึ่งจะทำการ หา Index ที่ทำให้เกิด Error Minimization  Perceptual weight จะเป็นการลดผล ของ error ที่เกิดจากความถี่ที่เกิด peak ใน สูงสุดใน 1/A(Z) เป็นผลให้ระบบหา Index ของ Codebook ที่ทำให้เกิด Error Minimization ได้เร็วขึ้น โดยยอมให้ที่ ความถี่นั้นมี Error มากขึ้นแต่เนื่องจากที่ ความถี่นั้นมีพลังงานสูง ทำให้ SNR ที่ ความถี่นั้นๆไม่ตกไปมากนัก

27 Superior COmmunications Research and Prototyping for commercialization Code-Exited Linear Prediction (CELP)  สำหรับ Decoder ของ CELP จะเป็นดังรูป ข้างล่างโดย Encoder ต้องส่ง Codebook Index, B(Z) และ A(Z) มาให้จึงจะสร้าง S’[n] ได้ Residu al Genera tor Long Term Predict or Short Term Predict or V[n ] U[n ] S’[n ] Ind ex B(Z ) A(Z )

28 Superior COmmunications Research and Prototyping for commercialization Algebraic Code Exited Linear Predictive Codec (ACELP)  ACELP ก็คือ CELP ที่ Codebook มี ลักษณะเฉพาะโดยกำหนดให้ จำนวน pulse ใน V[n] คงที่เท่ากับ 4 และแต่ละ pluse ก็ มีตำแหน่งที่จะสามารถอยู่ได้จำกัด และ Amplitude ของ pluse คงที่ ±1 ทำให้การ หา index เป็นได้รวดเร็วและอาจไม่ จำเป็นต้องเก็บ Codebook ไว้ได้

29 Superior COmmunications Research and Prototyping for commercialization Algebraic Code Exited Linear Predictive Codec (ACELP)

30 Superior COmmunications Research and Prototyping for commercialization งานในอนาคต  ทดลองทำการ Compile Code บน Nios  ทดลอง test sequence  หาเวลาที่ใช้ทั้ง process ต่อเฟรม  ทำลำดับฟังก์ชั่นที่ใช้เวลาในการ Process จากมากไปน้อย  ทำการ Optimize ด้านเวลาในด้าน encoder  ทำการ Optimize ด้านเวลาในด้าน decoder


ดาวน์โหลด ppt Superior COmmunications Research and Prototyping for commercialization นายชิตชานน์ ตรีน้อย วา กลุ่มที่ 3 ส่วนประมวลผลสัญญาณ ดิจิตอลเบสแบนด์ SCORPion Research.

งานนำเสนอที่คล้ายกัน


Ads by Google