Voice AI : เสียงของคน กับการตอบสนองของ AI บทความโดย L.cognito mode

Joy Asawasripongtorn
Vulcan Coalition
Published in
Sep 10, 2022

แม้การอยากเป็นเฮอร์ไมโอนี่จะเสกให้พี่มารักแต่หนูไม่ได้ในโลกแห่งความจริง ทว่าเทคโนโลยี Voice AI ที่ตอบสนองความต้องการต่างๆ ตั้งแต่การพูดคุยแก้เหงา จนถึงการสั่งการเพื่ออำนวยความสะดวกในชีวิตประจำวัน หรือทำกิจกรรมต่าง ๆ เช่น เปิดเพลง เข้า Application ค้นหาข้อมูล ตามหาร้านอาหาร ร้านกาแฟ โทรหาเพื่อน จนถึงการสั่งสินค้าออนไลน์ กับผู้ช่วยด้านเสียงเจ้าต่างๆ ก็ทำให้บางครั้งเรารู้สึกเหมือนแม่มดที่มีเวทมนต์จริง ๆ

.

Voice AI เป็นเทคโนโลยีที่ได้รับความนิยมเพิ่มขึ้นเรื่อยๆ ในปัจจุบัน โดยมันจะคอยรับและตีความคำสั่งเสียง เพื่อโต้ตอบกับผู้ใช้งานด้วยภาษาธรรมชาติ วิธีการทำงานของนวัตกรรมนี้เริ่มจากการทำความเข้าใจเสียงของผู้พูด พร้อมกรองเสียงรบกวนรอบข้าง จากนั้นเข้าสู่กระบวนการจำแนก วิเคราะห์ข้อมูล ทั้งเชิงภาษา ความหมาย และจับคู่กับการตอบสนองที่เหมาะสมที่สุด ก่อนส่งข้อมูลนั้นไปสู่ผู้ใช้งาน และบันทึกข้อมูลไว้ใช้อ้างอิงในอนาคต

.

ตามสถิติของ Statista ระบุว่า ในบรรดาผู้ช่วยด้านเสียงของบริษัทต่าง ๆ นั้น Google Assistant ถือเป็นผู้ช่วยที่ฉลาดที่สุด โดยอัตราความแม่นยำอยู่ที่ประมาณ 98% และยังคงต้องพัฒนาต่อไปเรื่อยๆ ซึ่งความท้าทายในการพัฒนาข้อมูลทางเสียงมีหลายปัจจัย ทั้งการมีเสียงรบกวนจากสิ่งแวดล้อมรอบข้าง การพูดที่เร็วเกินไป สำเนียงและภาษาถิ่นที่ใช้ในการพูด รวมไปถึงการทำความเข้าใจบริบทในคำพูด ตลอดจนคำศัพท์ที่เกิดขึ้นใหม่อยู่ตลอดเวลา ดังนั้น เพื่อให้ AI เข้าใจเสียงของทุกคน จึงต้องเรียนรู้ลักษณะของเสียงหลายรูปแบบ ทั้งเพศ อายุ ระดับภาษา ภาษาถิ่น สำเนียงการพูด เป็นต้น

.

ประโยชน์ของการพัฒนา Voice AI จะช่วยให้บริการต่าง ๆ ดีขึ้น ทั้งการถอดเสียงเป็นคำพูดแบบ Real time การป้อนคำสั่งด้วยเสียง การเพิ่มประสิทธิภาพการบริการ การลดขนาดองค์กร หรือการจดจำตัวตนด้วยเสียง ซึ่งเป็นประโยชน์และเพิ่มประสิทธิภาพในการรักษาความปลอดภัย โดยการระบุตัวตนของผู้โทรสามารถกำหนดได้ตามระดับเสียง จังหวะ และภาษาถิ่นของเสียง ซึ่งเป็นเทคโนโลยีที่ช่วยยืนยันตัวตนในด้านการธนาคาร การประกันภัย รวมถึง E-commerce ด้วย

.

ปัจจุบันมี Startup ต่างประเทศที่ทำงานเพื่อพัฒนาด้าน Voice AI เช่น บริษัท krisp ที่ช่วยจัดการเสียงรบกวน บริษัท Voiceitt ที่ช่วยผู้ที่มีปัญหาทางการออกเสียงให้สามารถเรียนรู้และสื่อสารกับผู้อื่นที่ใช้แอปรวมถึงเชื่อมต่อกับระบบ Smart home ได้ด้วย หรือบริษัท Robin healthcare ที่จัดการเอกสารทางการแพทย์ด้วยการฟังเสียงการสนทนาแพทย์กับผู้รักษา ซึ่งจะช่วยให้แพทย์ประหยัดเวลาเพิ่มขึ้น

.

ถึงแม้ว่าทุกวันนี้ เทคโนโลยี Voice AI จะยังคงต้องการการพัฒนาและการเรียนรู้อีกมากในอนาคต แต่เชื่อว่าในวันหนึ่งนวัตกรรมนี้จะช่วยให้เราสามารถเสกสิ่งของต่าง ๆ ขึ้นมาได้เพียงแค่การเปล่งเสียง ราวกับอยู่ในโลกเวทมนตร์เลยทีเดียว

เขียนโดย : L.cognito mode

#VulcanCoalition #VoiceRecognition #VoiceAI #ระบบสั่งการด้วยเสียง

--

--

Joy Asawasripongtorn
Vulcan Coalition

Event Review Activist / Personal Finance Evangelist / Podcaster / Content Writer and Story Teller