หนึ่งในปัญหา Data Science ของไทย
เห็นคนพูดเรื่อง Data Science แล้วคันปาก
ปัญหาของ Data Science กับความไม่พร้อมของข้อมูลมาจากไหน
ก็คงมีหลายอย่าง แต่ผมเล่าได้แบบหนึ่งที่ชอบเจอ
ถ้าพูดถึง Data Science ใน Nutshell มันก็คือการพยายามกลั่น Insight จากข้อมูลขนาดใหญ่ ซึ่งหลักๆ แล้ว การกลั่นตรงนี้มันก็คือวงจรการ ตั้งสมมติฐาน-ทดสอบกับข้อมูล-ดูว่าเวิร์คมั้ย แล้วก็วนแบบนี้ไปเรื่อยๆ สุดท้ายไม่ว่าจะใช้ AI หรือ ML มันก็คือแบบนี้ ของ Google ที่ทำมาแข่งโกะ มันก็คือใช้ Deep Learn (ตั้งสมมติฐาน) มาแข่งกับคน (ทดสอบ) แล้วก็ดูว่าเวิร์คมั้ย สุดท้ายไม่ว่าจะใช้สถิติธรรมดาหรือ AI, Machine Learning ซับซ้อน ตัวงานมันก็วงจรแบบนี้นี่แหละ
สิ่งนึงที่ผมเจอคือ หลายๆ ครั้ง องค์กรหรือภาครัฐไม่ได้จ้างมาแล้วตั้งสมมติฐานที่ต้องการทดสอบ คือ ไม่มีโจทย์ แต่ต้องการจะมีตำแหน่งนี้ คือไม่รู้หรอกว่าต้องการอะไร แต่ สร้างผลงานให้หน่อยนะ ได้ยินว่ามันจะออกมาดีเองทีหลังถ้ามี Data Science
โอเค ไม่เป็นไร ถ้าตัว Data Science มี Competency พอ ตั้งสมมติฐานเองได้ ไม่ได้ยากเกินความสามารถของ Data Science เก่งๆ หรอกนะ ที่จะเดินไปสำรวจว่าปัจจุบันขาดอะไร รอบข้างมีปัญหาอะไร จะประยุกค์ใช้ความสามารถฉันแก้ได้อย่างไรบ้าง แล้วตั้งโจทย์เองตามปัญหารอบข้างที่มันมีอยู่
เอาล่ะ พอตั้งโจทย์เอง มันก็ต้องมีการไปทดสอบสมมติฐานกับข้อมูล ตรงนี้ก็จะไปติดข้อมูลไม่พร้อม ไม่มีข้อมูลที่ต้องการ
โอเค เหมือนเดิม ไม่เป็นไร ถ้าเก่งจริง ก็จะบอกได้ว่าข้อมูลที่ต้องการคืออะไร อันนี้คือของจริง
จุดนี้แหละที่จะติดขัดโดยที่แก้ไขอะไรไม่ได้ คือ หลายๆ ครั้ง พอรู้มั่นใจแล้วว่า ต้องการข้อมูลหน้าตาแบบนี้ ซึ่งไม่มีอยู่ก่อนหน้านี ทำไงต่อ ก็มีสองทางเลือก
1. เข้าไปคุยกับองค์กรหรือส่วนที่รับผิดชอบข้อมูล ก็ไม่ได้มีอำนาจที่จะสั่งการลงไป
2. ต่อให้ได้ขั้นเทพเลย เก่งสุดๆ ถึกสุดๆ และขยันสุดๆ หาเองก็ได้ ก็จะไปโดนข้อหาล้วงลูก คุณเป็นใครมาจากไหน มายุ่งกับข้อมูลของคนอื่นได้ไง
อันนี้คือจุดจบ แก้ไม่ได้ด้วย Compentency ความสามารถ ถึกแค่ไหน เก่งแค่ไหน ขยันแค่ไหน ก็ไม่มีทางทะลุกำแพงนี้ได้เลย
อย่าลืมว่ามาถึงขั้นนี้ นี่ผมตั้งสมมติฐานว่า Data Science แบบ Super Competence ทั้งเก่งและถึกบึกบึนสุดๆ วันแมนโชว์มาตลอดทางเลยนะ ตั้งแต่ไม่มีโจทย์ ตั้งเองก็ได้ ไม่มีข้อมูลพร้อม พยายามหาเองอีกจนรู้ว่าใครควรจะถือ ก็ยังทะลุไม่ได้เลย นี่ยังไม่นับว่าจะมีแบบนี้ซักกี่คนกันเชียวเลยนะ
ตรงนี้แหละที่ผมเจอว่าติดปัญหาแบบไปต่อไม่ได้มาหลายครั้ง สุดท้าย ตัว Data Science คนนั้นก็จะได้แต่บ่นว่า “ไม่มีข้อมูล”
และเขาก็ตั้งโจทย์ที่มันง่ายๆ บนข้อมูลที่มี แต่ไม่มี Impact และไม่แก้ปัญหาจริงใดๆ เพื่อให้ขึ้นชื่อว่า “ทำงานนะ ไม่ได้อยู่เฉยๆ”
น่าเสียดายความสามารถเนอะ
ถามว่าจะแก้ไขอย่างไรดีนะ ผมคิดว่ามีสองทาง
- คนมีอำนาจ อาจจะหัวเรือใหญ่ในองค์กร หรือผู้มีอำนาจในภาครัฐ ต้อง “ฟัน” หรือมอบอำนาจให้ Data Science ในการเข้าไปจัดการข้อมูลที่ต้องการ แต่แบบนี้จะค่อนข้างลำบากในทางปฏิบัติ เพราะผมก็เคยเจอว่า ถ้ามอบอำนาจให้ Data Science ก็จะมีการสับสนใน Priority ของงานค่อนข้างเยอะ เพราะอย่าลืมว่า คนที่เก็บข้อมูลเองก็มีงานประจำที่เขาต้องดูแล แล้ว Data Science จะไปเพิ่มงานเก็บข้อมูลให้แต่ไม่มีอำนาจในการลดงานเดิมลง แต่คนก็มีเท่าเดิม ทรัพยากร Workload ก็มีเท่าเดิม ตัวคนปฏิบัติทำไม่ได้ทั้งหมด ก็จะสับสนว่าตกลงฉันต้องเชื่อใครกันแน่ อันไหนควรให้ความสำคัญมากกว่า ส่วนถ้าผู้มีอำนาจพอที่จะทั้ง “เพิ่มงานใหม่” และ “ลดงานเก่า” เข้ามาลุยเลยจะดีมาก แต่ก็มักจะพบว่าคนที่มีอำนาจมากขนาดนั้นจะไม่มีเวลาว่างมาจี้มากนัก
- สิ่งที่ผมว่าเวิร์คกว่า คือ การตั้งให้ Data Science อยู่ในทีมเดียวกับคนเก็บข้อมูล มีการวัดผลงานเป็นทีมเดียวกัน ทีนี้ล่ะคนเก็บข้อมูลก็จะให้ความร่วมมือเต็มที่เลยทีเดียว
ก็ขอเอวังไว้ประการฉะนี้