TTS กำเมือง

o aom
NECTEC
Published in
1 min readJun 8, 2019

ตอนนี้ตัว text-to-speech (TTS) สำหรับภาษาไทยก็มีหลายตัว อาทิเช่น Google, Oddcast, xxx และก็ VAJA แต่ทั้งหมดที่ว่ามาก็เน้นไปที่ภาษาไทยกลาง ซึ่งงานนี้อยากลองภาษาถิ่นบ้าง โดยเป้าหมายเบื้องต้นก็คือทำให้เราสามารถสร้างเสียงภาษาไทยใดๆ ก็ได้ให้มีสำเนียงเหนือ (“เครดิต: น้องมีน น้องฝึกงานจากพระนครเหนือมาช่วย”)

การจะสร้าง TTS สักตัวสิ่งที่ต้องมีก็คือ ฐานข้อมูลเสียง (ก็คือเสียงพูด จำนวนเยอะๆของคนที่เราต้องการสร้างเสียงของเค้านั่นแหละ) ทีนี้โจทย์ของงานนี้เราไม่อยากอัดเสียงขึ้นมาใหม่ อยากใช้เสียงที่มีอยู่แล้ว สรุปสุดท้ายก็ใช้ข้อมูลเสียงที่เอามาจากคัมภีร์ Bible ( https://live.bible.is/bible/NODWBT/MAT)

ซึ่งถ้าต้องการสร้าง TTS โดยเทคนิค unit selection สามารถทำได้ตามตัวอย่างตามลิงค์นี้ ( https://github.com/festvox/datasets-CMU_Wilderness)แต่สำหรับเทคนิคที่เราจะลองใช้ตอนนี้ก็คือ HMM กะ DNN เดี๋ยวถ้าว่าง ๆ คงได้มีสักตอนที่จะได้สรุปวิธีการทำทั้งหมดตั้งแต่เริ่มต้น ส่วนเสียงสังเคราะห์ที่สร้างได้ตอนนี้ลองฟังเสียงที่ได้จากวิธี HMM ดูก่อน (เสียงอาจจะไม่ดี จนไม่อยากรู้วิธีการทำก็ได้ 555)

1. การอ่านคัมภีร์ไบเบิ้ล

“ใผ​ยอม​ฟัง​ก็​หื้อ​ฟัง​สิ่ง​ตี้​พระวิญญาณ​บอก​กับ​คริสตจักร​ต่าง ๆเต๊อะ แล้ว​ใผ​ตี้​มี​ชัย เฮา​จะ​หื้อ​กิ๋น​หน่วย​จาก​เก๊าไม้​แห่ง​จีวิต​เซิ่ง​อยู่​ใน​สวน​สวรรค์​ของ​พระเจ้า”

2. การเรียกคิวคนไข้ในโรงพยาบาล

“ขอเจินคุณคนไข้ นามสกุ๋นอะหยังดี ตี้ห้องฮับยาหมายเลขซาวสามครับ”

3. คำหวานหยอดแฟน ( https://www.youtube.com/watch?v=ME6FMkr4FsM)

“ความฮักเป๋นอะหยังตี้ง๊ามงาม ตั้งแต่นี้ไป๋ เปิ้นจะฮักตั๋วคนเดียว ตี่หายหน้าไป๋ บ่ใจ้บ่าฮัก แต่หมอบอกหื้อพัก ลดน้ำต๋านในหัวใจ๋”

--

--