ตอนนี้ตัว text-to-speech (TTS) สำหรับภาษาไทยก็มีหลายตัว อาทิเช่น Google, Oddcast, xxx และก็ VAJA แต่ทั้งหมดที่ว่ามาก็เน้นไปที่ภาษาไทยกลาง ซึ่งงานนี้อยากลองภาษาถิ่นบ้าง โดยเป้าหมายเบื้องต้นก็คือทำให้เราสามารถสร้างเสียงภาษาไทยใดๆ ก็ได้ให้มีสำเนียงเหนือ (“เครดิต: น้องมีน น้องฝึกงานจากพระนครเหนือมาช่วย”)
การจะสร้าง TTS สักตัวสิ่งที่ต้องมีก็คือ ฐานข้อมูลเสียง (ก็คือเสียงพูด จำนวนเยอะๆของคนที่เราต้องการสร้างเสียงของเค้านั่นแหละ) ทีนี้โจทย์ของงานนี้เราไม่อยากอัดเสียงขึ้นมาใหม่ อยากใช้เสียงที่มีอยู่แล้ว สรุปสุดท้ายก็ใช้ข้อมูลเสียงที่เอามาจากคัมภีร์ Bible ( https://live.bible.is/bible/NODWBT/MAT)
ซึ่งถ้าต้องการสร้าง TTS โดยเทคนิค unit selection สามารถทำได้ตามตัวอย่างตามลิงค์นี้ ( https://github.com/festvox/datasets-CMU_Wilderness)แต่สำหรับเทคนิคที่เราจะลองใช้ตอนนี้ก็คือ HMM กะ DNN เดี๋ยวถ้าว่าง ๆ คงได้มีสักตอนที่จะได้สรุปวิธีการทำทั้งหมดตั้งแต่เริ่มต้น ส่วนเสียงสังเคราะห์ที่สร้างได้ตอนนี้ลองฟังเสียงที่ได้จากวิธี HMM ดูก่อน (เสียงอาจจะไม่ดี จนไม่อยากรู้วิธีการทำก็ได้ 555)
1. การอ่านคัมภีร์ไบเบิ้ล
“ใผยอมฟังก็หื้อฟังสิ่งตี้พระวิญญาณบอกกับคริสตจักรต่าง ๆเต๊อะ แล้วใผตี้มีชัย เฮาจะหื้อกิ๋นหน่วยจากเก๊าไม้แห่งจีวิตเซิ่งอยู่ในสวนสวรรค์ของพระเจ้า”
2. การเรียกคิวคนไข้ในโรงพยาบาล
“ขอเจินคุณคนไข้ นามสกุ๋นอะหยังดี ตี้ห้องฮับยาหมายเลขซาวสามครับ”
3. คำหวานหยอดแฟน ( https://www.youtube.com/watch?v=ME6FMkr4FsM)
“ความฮักเป๋นอะหยังตี้ง๊ามงาม ตั้งแต่นี้ไป๋ เปิ้นจะฮักตั๋วคนเดียว ตี่หายหน้าไป๋ บ่ใจ้บ่าฮัก แต่หมอบอกหื้อพัก ลดน้ำต๋านในหัวใจ๋”