มารู้จัก LINE AiCall กัน

Aeknarin Sirisub
LINE Developers Thailand

--

สวัสดี มิตรรักแฟนเพลง เอ้ย แฟนคลับ ทุกท่าน วันนี้กวิ้นมีเรื่องราวๆ เบาๆ ที่เกี่ยวกับ เทคโนโลยี LINE และ AI มาฝาก ส่วนจะเป็นอย่างไรนั้น ตามกวิ้นมาเลยยยย

ทุกวันนี้เราต่างก็ใช้เทคโนโลยีต่างๆ มากมายเพื่ออำนวยความสะดวกในชีวิตของเรา และ ลดการทำงานที่ไม่จำเป็น รวมไปถึงการใช้เทคโนโลยีอย่างเช่น AI เข้ามาช่วยในการทำงานเพื่อลดระยะเวลาในการทำงานหรือเพิ่มประสิทธิภาพในการทำงานให้ดียิ่งขึ้น

ปัจจุบันเราคงต้องยอมรับว่าเราต้องการคนสำหรับในการตอบคำถามผ่านทางโทรศัพท์ในหลายๆ อุตสาหกรรมอยู่ เช่น ไม่ว่าจะเป็น ร้านอาหาร,โรงแรม,ธนาคาร หรือ แม้กระทั่ง ค่ายโทรศัพท์ มือถือ ซึ่งสิ่งที่ลูกค้าจะโทรมาถามนั้นก็หนีไม่พ้นคำถามเดิมๆ อย่างเช่น ต้องการสั่งอาหาร,ต้องการจองโต๊ะอาหาร,ต้องการจองโรงแรมในช่วงวันหยุดสุดสัปดาห์ ซึ่งสิ่งที่ถูกถามนั้นก็จะมีลักษณะคล้ายๆเดิม วนอย่างนี้ทุกๆวัน

และในวันนี้ สิ่งที่กวิ้นจะมานำเสนอ นั่นก็คือ LINE AiCall ที่จะมาช่วยเราในการตอบคำถามที่ร้านอาหารต้องเจอเป็นประจำทุกวัน

ซึ่ง LINE AiCall นั้นก็คือผลิตภัณฑ์หนึ่งภายใต้ Project DUET ที่ LINE กำลังพัฒนาอยู่นั่นเอง เอ๊ะว่าไปชื่อมันก็คล้ายๆกับ DUPLEX ของ Google

จุดเริ่มต้นของ Project นี้คือ “ไม่มีใครที่ต้องการโทรไปที่ร้านอาหารเพื่อที่จะจองโต๊ะในวันนี้”

ซึ่งโดยปกติแล้วเมื่อเราต้องการจองร้านอาหารสักร้านนึงเราก็คงจะจองผ่าน Website หรือ Mobile Application หรือไม่ก็ใช้วิธีการโทรไปยังร้านเพื่อทำการจอง

ซึ่งจากการสำรวจแล้วพบว่าผู้คนกว่า 65 เปอร์เซ็นต์ยังคงใช้บริการสั่งอาหารหรือจองโต๊ะอาหารผ่านทางโทรศัพท์ และ 35 เปอร์เซ็นต์ คือใช้บริการด้านอื่นๆในการจองหรือสั่งอาหาร

เมื่อเราใช้บริการในการจองหรือสั่งอาหารผ่านทางการคุยโทรศัพท์มากถึง 65เปอร์เซ็นต์ทำให้เกิดปัญหาต่างๆจากความผิดพลาดของการสื่อสารขึ้นได้ อาทิเช่น ผู้รับสายไม่ได้ถูกเทรนมาทำให้การพูดคุยกับลูกค้าอาจเกิดข้อผิดพลาดหรือการสื่อสารที่ไม่ตรงกันได้ ถ้าในประเทศไทยเองอาจจะเจอกรณีที่เราโทรไปเจอกับลูกจ้างที่เป็นชาวต่างชาติแล้วไม่สามารพูดคุยหรือตอบสนองต่อสิ่งที่เราต้องการได้อย่างถูกต้อง

ซึ่งหลักการของ AI Speaker นั้นจะไม่เหมือนกับ AI ที่ใช้บนลำโพงอัจฉริยะ เพราะการตอบคำถามจะไม่เหมือนกัน อย่างเช่นลำโพงอัจฉริยะเราจะมีการ สั่งให้เปิดหรือปิดไฟในห้อง หรือ สั่งให้เล่นเพลง แต่ว่า AI Speaker นั้นจะต้องตอบคำถามที่มีความยาวกว่ากันมากเช่น ต้องการจองห้องอาหารริมแม่น้ำตอนบ่าย 3 โมง เป็นต้น

ทีนี้ถ้าเราจะเทียบกับ Chatbot บ้างหละ เราก็ไม่สามารถที่จะเทียบได้เช่นกัน เพราะว่า Chatbot นั้นเป็นการสนทนาบนหน้าจอจำลองและเราสามารถที่จะย้อนกลับไปอ่านบทสนทนาก่อนหน้าได้ แต่การคุยผ่านทางโทรศัพท์นั้นเราไม่สามารถที่จะย้อนกลับไปดูบทสนทนาก่อนหน้าได้ และ การสนทนาผ่านโทรศัพท์นั้นเรายังส่งได้แค่เสียงเท่านั้นซึ่ง Chatbot สามารถที่จะส่งได้ทั้ง รูป,ข้อความ และ เสียง

เมื่อมาลองวิเคราะห์การพูดคุยและการสนทนาทางสายโทรศัพท์แล้วเราจะพบว่า การพูดคุยมักจะต้องมีคำพูดขึ้นต้น และ คำพูดปิดท้ายเสมอ และยังพบอีกว่า ผู้รับสายมักจะต้องเป็นผู้พูดก่อน

และในการสนทนาแต่ละครั้งเราจำเป็นที่จะต้องคำนึงถึงช่วงของเวลาอีกด้วย เพราะว่าการสนทนามีการสลับกันพูด หรือ การเว้นช่องว่างเพื่อให้อีกฝ่ายพูด ซึ่งถ้ากำหนดช่วงเวลาไม่ดีก็อาจเกิดการพูดพร้อมกัน(Overlap) หรือ เกิดการเงียบระหว่างการสนทนาขึ้นได้(Silence)

จึงทำให้แยกการสนทนาด้วยเสียงออกเป็น 4 ระดับได้แก่ Turn,Sequence,Activity,Task

เมื่อเรามามองในบทสนทนานี้เราจะเห็นได้ว่า เกิดการพูดคุยกันทั้งหมด 8 turns ด้วยกัน และใน 8 turns นั้นก็เกิด 4 sequences ซึ่งหมายถึงการตอบกลับนั่นเอง และในบทสนาทนานี้ยังเกิดอีก 3 activities นั่นก็คือ ความต้องการจองร้านอาหาร,การระบุเวลา และ การระบุจำนวน เมื่อรวมกันแล้วจึงเกิดเป็น 1 task ก็คือการจองที่นั่งในร้าน OUTBACK STEAKHOUSE ในวันพรุ่งนี้ เวลา 1 ทุ่ม จำนวน 4 ท่าน

และเมื่อเราทำการแบ่ง activities ออกมาได้แล้วเราก็ต้องทำการนำ activities มาเชื่อมโนงกันเพื่อหาความสัมพันธ์ ของการสนทนา เพื่อที่จะประกอบกลับมาเป็นบทสนทนาที่มีความหมายได้

แต่ในการสนทนาจริงนั้นก็ยังมีเรื่องของคำถามที่เจาะลึกในรายละเอียดลงไปอีก เช่น ที่ร้านโต๊ะที่ต้องการจองติดริมแม่น้ำไหม? หรือ อาจเกิดเหตุการณ์ที่ AI ตอบไม่ตรงคำถามหรือลูกค้าอาจจะยังสงสัยอยู่จนเกิดการถามคำถามเดิมซ้ำได้

อย่างเช่นตัวอย่างของการเกิดคำถามซ้ำ(Repeat Request) และ การขอคำอธิบายเพิ่มเติม (Definition Request) ดังรูป

โดยหลักการของการใช้ AICall ก็คือ เมื่อลูกค้าโทรมา ตัว AI Speaker ก็จะส่งข้อความเสียงไปที่ ASR(Automatic Speech Recognition) และ ASR จะทำการ Request เพื่อขอข้อมูลกลับมาเป็น text ผ่าน DM/NLU(Dialog Management/Natural Language Understanding) ซึ่ง DM/NLU ก็จะตอบกลับมาเป็น text เพื่อให้ SYNTH สังเคราะห์และส่งกลับมาเป็น ข้อความเสียง

ซึ่งในบริบทของการพูดเราจะนิยมใช้ Single-turn NLU มากกว่าการใช้ Multi-turn NLU

นอกจากนี้ภายในงาน LINE DEVELOPER DAY 2019 ที่กวิ้นพึ่งจะไปมายังได้พูดถึงประเด็นทางด้าน Engineering อีกด้วย

หนึ่งในประเด็นที่น่าสนใจก็คือเรื่องของ Design และ Engineering ซึ่งปัญหานี้ก็เกิดจาก activity ที่ออกแบบมานั้นไม่สอดคล้องกับบทสนทนาจริง

เป็นอย่างไรกันบ้างครับกับเรื่องของ LINE AICall ที่กวิ้นนำมาเสนอในวันนี้หวังว่า เพื่อนๆจะชอบกันนะครับ ส่วนวันนี้กวิ้นขอตัวไปก่อน บ๊ายบาย

ตอนนี้ LINE Developer เรามีแฟนเพจแล้วนะจ๊ะอย่าลืมไปกด LIKE กันด้วยนะ

https://www.facebook.com/LINEDEVTH

ส่วนใครที่ยังไม่ได้เข้าร่วมกลุ่มกับเรา คลิ๊กที่นี่ได้เลย

https://www.facebook.com/groups/LINEDEVTH

Resources

Developer console
https://developers.line.biz/en/

Messaging API Document
https://developers.line.biz/en/docs/messaging-api/

Messaging API Reference
https://developers.line.biz/en/reference/messaging-api/

LINE DEVELOPER DAY 2019
https://linedevday.linecorp.com/jp/2019/

--

--