อยากทำงานสาย Data Science เริ่มต้นอย่างไรดี?
วิธีที่ง่ายสุดๆ วิธีหนึ่งคือเริ่มต้นจาก.. ข้อมูลของตัวเราเอง 😊
“อยากทำงานสาย Data Science จะเริ่มต้นอย่างไรดี?”
น่าจะเป็นคำถามที่อยู่ในหัวของหลายๆ คน แล้วก็คิดว่าทุกคนน่าจะได้รับคำตอบประมาณว่าให้ลองไปเรียนคอร์สนี้ ลองติดตามเพจของคนนี้ดูสิ ลองไปเอาข้อมูลใน Kaggle มาเล่นดูนะ หรือว่าอ่าน Notebooks ของคนในนั้น จะได้เรียนรู้แนวทางการวิเคราะห์ ฯลฯ
คำตอบเหล่านั้นเป็นคำตอบที่ดีครับ ไม่ได้ผิดอะไรนะ ทีนี้จากการสังเกตพฤติกรรมของตัวเองและคนรอบข้างพบว่า.. การไปลงคอร์สเรียน การติดตามเพจ หรือการไปเอาข้อมูลของคนอื่นมาลองเล่นดู ค่อนข้างลงแรงในการหักห้ามใจจากสิ่งรอบตัว เช่น Netflix เยอะอยู่พอสมควร 🤣
ทีนี้ผมเลยอยากมาเสนอทางเลือกอีกทางหนึ่งในการเริ่มต้น ซึ่งเป็นทางเลือกที่ผมคิดว่าง่าย แล้วก็ลงแรงน้อยมาก และเป็นสิ่งที่เราทุกคนคุ้นเคยกันดี.. นั่นก็คือ ให้เราเริ่มต้นจาก “ข้อมูลของตัวเราเอง” ครับ 😎
ทุกวันนี้เรามีข้อมูลเกี่ยวกับตัวเรา หรือรอบข้างเราในแต่ละวันเยอะมาก แต่เราอาจจะไม่ได้ใส่ใจมันเท่าไหร่ ผมอยากให้เรากลับมาลองตั้งคำถามกับมันดูครับ ไม่จำเป็นว่ามันจะต้องเป็น The Right Question หรือเปล่า (ตรงนี้มันอาศัยการฝึกฝน + ประสบการณ์) ถ้าเราเป็นมือใหม่ ลองตั้งคำถามสักคำถามดูครับ แล้วเราค่อยตามไปเก็บข้อมูลเพื่อตอบคำถามของเรา พอได้คำตอบแล้ว ก็เก็บ Feedback จากตัวเอง และคนรอบข้างด้วยก็ได้ เสร็จแล้วก็กลับไปตั้งคำถามใหม่ ทำแบบนี้วนไป เราจะเห็นพัฒนาการของตัวเราเอง
ยังนึกไม่ออกว่าจะมีข้อมูลอะไร? อ่ะๆ มาๆ ผมเริ่มให้ดูก่อน
มีอยู่วันหนึ่ง ผมเริ่มสังเกตตัวเองว่าเป็นคนที่ดื่มกาแฟเยอะมากเลย บางวันแทบจะดื่มแทนน้ำเลยก็ว่าได้ แล้วก็สงสัยว่า เอ.. พวกร้านกาแฟต่างๆ ถ้าเค้าได้ข้อมูลผมไป หรือใครต่อใครอีกหลายคนไป เค้าจะเอาไปทำอะไรได้บ้างนะ? หรือผมเสียทรัพย์ให้กับแบรนด์ไหนมากที่สุดเนี่ย? 🤔
ผมก็เลยเริ่มเก็บข้อมูลที่ผมไปซื้อกาแฟมาดื่มครับ เก็บใส่อะไร? ต้องทำ Web Application ขึ้นมาเลยไหม.. ไม่ครับ! อย่าหาทำนะ ได้โปรด มันเวอร์ไปครับ 😅 ไปใช้เครื่องมือที่สุด Powerful และมันพิสูจน์แล้วว่ามันตอบโจทย์แทบทุกอย่างบนโลกนี้.. นั่นก็คือ..
ตามนั้นครับ ข้อมูลที่ผมเก็บก็มี วันเวลา กาแฟที่ดื่ม ราคา แบรนด์ สถานที่ ครับ ง่ายๆ แบบนี้แหละ เก็บเล่นๆ มาประมาณเกือบ 2 เดือน (บางอันราคา 0 บาท นั่นคือผมไม่ได้ซื้อเอง)
หลังจากเก็บข้อมูลมาแล้วก็ลองเอาข้อมูลมาเล่นดูครับ อาจจะลองเขียนโค้ด หรือใครอยากลองแบบไวๆ ลองก็ใช้ Tableau หรือ Power BI ก่อนก็ได้
กลับมาที่คำถามผมที่ตั้งไว้แต่แรก “พวกร้านกาแฟต่างๆ ถ้าเค้าได้ข้อมูลผมไป หรือใครต่อใครอีกหลายคนไป เค้าจะเอาไปทำอะไรได้บ้างนะ?”
- เค้าอาจจะเอาไปทำ Personalization เช่น ประเภทของกาแฟที่ผมชอบ สาขาที่ผมไปบ่อยที่สุด ช่วงเวลาที่ผมไป
- เค้าอาจจะเอาไปโมเดลทำนายยอดขายของแต่ละสาขา
- เค้าอาจจะเอาไปเสนอโปรโมชั่น (1 แถม 1 นี่ออกมาจังเลย)
- เค้าอาจจะไปดูว่าคนๆ นั้นเค้าเปลี่ยนพฤติกรรมการดื่มกาแฟหรือเปล่า เช่น เปลี่ยนเวลาซื้อกาแฟ หรือเปลี่ยนประเภทกาแฟ หรือเปลี่ยนแบรนด์! จากที่เคยซื้อบ่อยๆ ก็ค่อยๆ หายไป อะไรแบบนี้
- เค้าอาจจะเอาไปดูทำเลในการเปิดร้านใหม่ เพราะเค้ารู้แหละว่าคนๆ หนึ่งเค้าไปสาขาไหนมาบ้างก็น่าจะพอเดาออก (ตอนนี้มี Starbucks เปิดใหม่อยู่หน้าปากซอยบ้านผม.. คงบังเอิญแหละมั้ง..😫)
- และอื่นๆ อีกมากมาย
แล้วผมเสียทรัพย์ให้กับใครมากสุดล่ะ? ก็กาแฟเงือกเขียวแหละ น่าจะเสียพันกว่าบาทในแต่ละเดือน 💸
OK! การเริ่มต้นแบบการสังเกต และการใช้ข้อมูลตัวเองแบบนี้ผมมองว่าเป็นทางเลือกหนึ่งที่เริ่มต้นได้ง่ายมากๆ โดยไม่ต้องลงแรงเยอะเลย เราจะได้การฝึกฝนทั้งการเก็บข้อมูล และการตั้งคำถามด้วยไปในตัว ส่วนเรื่องการวิเคราะห์ก็เพิ่มแรงเข้าไปอีกหน่อยในการตอบคำถามที่เราตั้งไว้ ปรับเปลี่ยนคำถาม ค่อยๆ ทำวนไป พอทำได้แล้วเราก็จะสนุกไปกับมันครับ 😉
Happy Data Science 🧪