สรุป + รีวิว session [Line Dev Day] — Line ทำยังไงให้คนส่ง Sticker มากขึ้นกันนะ ?

Burasakorn Sabyeying
Mils’ Blog
Published in
3 min readFeb 1, 2021

𝐋𝐈𝐍𝐄 𝐃𝐄𝐕𝐄𝐋𝐎𝐏𝐄𝐑 𝐃𝐀𝐘 𝟐𝟎𝟐𝟎 ซึ่งเป็น event conference เมื่อ 25–27 พ.ย. 2020 ที่ผ่านมา
มี session หนึ่งที่น่าสนใจมากชื่อว่า Improving sticker keyboard with data analysis โดยคุณ Naho Tanigawa จากทีม Data Science

โดยเขามี Goal คือ

จะทำยังไงให้คนส่ง Sticker มากขึ้นกันนะ?

โดยที่เขา define วิธีการ approach คือ ทำยังไงก็ได้ให้ลดเวลาก่อนที่คนๆนั้นจะส่ง stickerให้ได้จาก Sticker Keyboard Project

เอ๊ะ Sticker keyboard คืออะไรนะ ?

= มันคือส่วน Preview เทาๆที่ขึ้นมาตอนกด sticker นี่เอง

โดยที่ผ่านมา Line เองก็มีการ update features 2 ส่วน

1. มี panel ให้ search sticker ได้ และมีการ search ผ่าน tag

เราจะเห็นว่ามี tab ที่ชื่อ # คอยแบ่ง sticker เป็นหมวดหมู่

ส่วนตัวแล้ว เราไม่ค่อยได้ใช้ search จาก tag เท่าไร แต่ใช้พิมพ์ในช่องแทน

ลองพิมพ์ว่า Fat ก็จะเห็น Sticker Suggest ขึ้นมา

ความเห็นส่วนตัวเลย เราว่ามันก็ทำให้หา sticker ได้เร็วขึ้นมากๆ แต่ตอนนี้ยัง search ภาษาไทยไม่ได้นะ

พิมพ์ว่าอ้วนแล้วไม่มีอะไร suggest ขึ้นเลย

2. Notify user ว่า sticker นี้จะหมดอายุนะ

ไม่มีรูปประกอบจากของจริงอ่ะ ซื้อแต่ของเสียตัง ว้า 555555

แต่ก่อนอื่นเลย But first, Data Science ! แน่นอนว่าต้อง proof ให้ได้ว่ามันเกิดอะไรขึ้นจาก Data Driven อยู่แล้ว ซึ่ง experiment ที่เกิดขึ้น เขาดันเจอ challenge 2 เรื่อง

1. User Log ยาวมากกกก

การที่ Line จะเข้าใจ behavour ของ user ได้ สิ่งแรกที่ต้องมีคือดูว่า user มี action ทำอะไรบ้างก่อนส่ง sticker ถูกไหมทุกคน
นางเลยเก็บ User Journey จ้า (แต่เขาแจ้งนะว่าไม่ได้เก็บ User personal info)

แต่ผลปรากฏว่า อ้าว Log ยาวเลยนิ เวลา user ส่ง sticker ที ก็ส่ง sticker เบิ้ลๆๆรัวๆ log เลยยาวมากก

พอจะดูแค่ data ในส่วน action ของการส่ง sticker ก็สั้นเกินไป

เขาเลยแก้ปัญหาโดยการแบ่ง User Journey เป็น session แทน
โดยแบ่ง Action แรกเป็นการ click typing ในช่องแชท และมีจบด้วย action ที่ user กดส่ง sticker

cr. official slide

เท่านี้ก็จบปัญหา ปิ๊ง!

และเขาก็เล่า Data Pipeline ให้ฟังคร่าวๆด้วยนะ
ว่าวันนึงก็มี data ส่วน User Activity Log เข้ามา 10 billion ต่อวัน (ตอนพูดเขาบอกว่า 1 billion อาจจะพูดผิด) โดยเก็บลง Hadoop
และเก็บมา analyze เพียง 1 % แบบ random
แล้วนำมา clean ต่อเป็น Session log จนเอาไปทำ Visualization ต่อเลย

Data Pipeline ที่น่าจะคร่าวๆมาก มีใช้ Airflow ด้วย

2. แล้วจะทำยังไง๊ ให้คนส่ง sticker เยอะๆ

นางก็ set KPI เลยจ้า แล้วค่อย break down ลงมา

ก็มาดูกันว่า แต่ละ user ส่ง sticker เท่าไร แล้วมาคำนวนต่อว่า

ทุกครั้งที่มีการเปิด App ครั้งนึงเนี้ย ส่งผลให้มีการส่ง sticker เพิ่มขึ้นรึเปล่า ?

จนได้สูตรออกมาว่าและเซ็ต
เวลาในการที่ user จะกดส่ง sticker = ก็เอาเวลาทั้งหมดที่ app เปิด หารด้วย เวลาที่ส่ง 1 sticker

แล้วดูว่ามันลดลงไหม

ทั้งนี้ เขาก็เล่าถึง case studies ที่เจอในการทำ analysis ครั้งนี้หลังจากที่แก้ challenge ข้างบนแล้ว แบ่งเป็น 2 ส่วน

  1. ส่วนแรก — UI of new sticker panel

Line เขามีสมมติฐานคือ User ทำอะไรซ้ำๆตอนก่อนที่จะส่ง sticker ด้วย คือจะทำอะไรแบบย้ำคิดย้ำทำ = ส่ง sticker เบิ้ลนี่เอง (double tap)
และเขาก็เจอว่ามี 26% ที่มี behavior นี้

2. ส่วนที่ 2 — Notify Coming Expired Sticker:

ในส่วน sticker ที่มีการอายุขัย expiration, Line เขาพบว่า user มีการใช้ sticker ที่มากขึ้นภายใน 10 วันก่อนที่ sticker ลายนั้นๆจะใช้ไม่ได้
ฟีเจอร์นี้ก็ทำให้คนใช้ sticker รัวๆเลย

สรุป

  • session นี้เล่าว่า Line มี update 2 features ที่เกี่ยวกับ sticker คือ ระบบ search โดย tag กับ มีการเตือนว่า sticker จะหมดอายุอีก 10 วัน
  • key สำคัญในการวิเคราะห์ว่าคนใช้ sticker เยอะขึ้น คือดูจากเวลาก่อนที่ user คนนั้นจะกด sticker ให้ลดลง
  • Line เก็บว่าเรามี activity log อะไรบ้างด้วยนะ กด click, กด ส่ง sticker เมื่อไร แต่ไม่เก็บ personal info
  • เพื่อจะดู data ว่า user ใช้ sticker ยังไง แก้ปัญหา User Activity Log ยาวมากๆด้วยการแบ่งเป็น session
  • พฤติกรรมที่น่าสนใจคือ user ชอบกด sticker ซ้ำ

ใครสนใจฟังจาก session เต็มๆก็ทางนี้เลย Improving sticker keyboard with data analysis | LINE DEVELOPER DAY 2020

--

--

Burasakorn Sabyeying
Mils’ Blog

Data engineer at CJ Express. GDE in Cloud. Women Techmakers Ambassador. Co-lead GDG Cloud Bangkok. Other channel > Mesodiar.com