Data Science .. Big Data .. Machine Learning .. BI สายงานนี้ ทำงานอะไรกันแน่?

Vithan Minaphinant
investic
Published in
2 min readMay 24, 2017

หลายท่านอาจพบเจอประสบการณ์เลวร้ายครับ คือสงสัยว่ามันคืออะไร พอเปิดอ่าน ก็พบว่า เนื้อหาแปลจากเมืองนอกมา หรือไม่ก็ดูเป็นนักวิชาการจ๋า นำข้อมูลมา ใส่โมเดล แปลงค่าหาความสัมพันธ์ อ่านจนจบ ยัง “งง” ว่าแล้วต้องทำอะไรนอกจากเขียนโปรแกรม แปลค่าสถิติ

โดยนิยาม จริงๆแล้ว มีแผนภาพอธิบายสายงานอยู่ครับ Data Scientist คือคนที่มีครบเครื่อง ทั้งด้าน ธุรกิจ คณิตศาสตร์และโปรแกรมมิ่ง(รูปจาก Quora)

แต่ในชีวิตจริง ตามองค์กรเค้าจะ แบ่งง่ายๆแบบนี้ครับ

เริ่มจากอันที่ดูเป็นมนุษย์ทั่วไปมากที่สุดคือที่สีเขียวใบไม้ มี 2 สายงาน และบริษัทธรรมดาจะใช้แค่ 2 สายนี้ครับ

สายงาน BI Developer— การนำข้อมูลมาจัดแสดงอย่างเหมาะสม เพื่อจัดทำรายงานในรูปต่างๆให้ง่ายต่อการวิเคราะห์ เพื่อนำไปใช้ประโยชน์ต่อ ส่วนมากก็คือ Dashboard นั่นเองครับ !! ซึ่งตรงนี้อาศัยสกิล Data Visualization การแสดงผลข้อมูล มากกว่าการเขียน Code ซะอีกครับ

สายงาน Data Analyst — นักวิเคราะห์ข้อมูล ชื่อฝั่งดูเห่ยมากครับ แต่ความเหนือคือ เขาไม่ได้ นั่งเก็บข้อมูลการทดลองทีละครั้ง แต่เค้าเขียนโปรแกรมเพื่อวิเคราะห์ หรืออย่างน้อยก็ใช้ Excel และ tool อื่นๆ คล่องมากในการหาข้อมูลสถิติทั้งหลาย เขาจะแปลเรื่องยากๆให้เป็นภาษาคนนั่นเอง และมักเป็นตำแหน่งแรกเริ่มพื้นฐานของสายงานนี้ เพราะถ้าคุณไม่เข้าใจข้อมูลอะไร ก็คงไปออกแบบ หรือดึงข้อมูลที่ถูกต้องไม่ได้

ส่วนที่เหลือ ค่อนข้างจะผสมกัน ใช้ในบริษัทใหญ่ Tech Giant หรือไม่ก็เป็นบริษัทที่ยังไม่จำเป็นเลย ผมเหมารวมเลยครับ แบ่งได้แบบนี้

  1. Theorist — นักทฤษฎี ตำแหน่งนี้มีเต็มเมือง แนวๆนักวิชาการที่ชอบพูดออกสื่อ + สอนพิเศษเด็กครับ … ไม่ใช่นะครับ จริงๆแล้วหมายถึง นักวิทยาศาสตร์ นักคณิตศษสตร์ที่สร้างและศึกษา Model & Parameters ต่างๆ กล่าวคือเป็นนักวิจัยนั่นเอง เขียน paper นั่งทำงานตามมหาลัย หรือ Microsoft และ IBM พวกนี้ครับ
  2. Machine Learning Scientist — แค่ชื่อก็บ่งบอกว่าท่านอาจคุยกับคนทำงานนี้ไม่รู้เรื่อง ต้องแนวๆนักคณิตศาสตร์หัวฟู? ก็ไม่เชิงครับ เจอคนรู้เรื่องก็มีครับ คนพวกนี้จะเป็นคนที่เข้าใจโมเดล ว่าอะไรดีและเหมาะที่สุดกับที่ควรใช ้จะเป็นตรงกลางระหว่าง Theorist และ Data Miner …พวกนี้อยู่ใน Sillicon Valley และเขียน Program ใช้พวก framework เช่น Scikit-learn (สำหรับวิเคราะห์ด้านสถิติ) ….ลักษณะงานแบบที่คนธรรมดาเข้าใจได้ก็คือ หาว่าจะทำยังไงให้ Facebook Detect หน้าคน auto tag ได้ถูกต้องอะไรทำนองนี้
  3. Data Miner- คนที่สามารถเขียนโปรแกรม SQL, R, PYTHON อะไรเทือกนี้เพื่อหาคำตอบที่ต้อการจากข้อมูลที่ได้ (บางคนเซียน excel มากก็เรียก data miner) คนพวกนี้สามารถเข้าไปดึงข้อมูล ที่ซับซ้อนมากๆ และคำถามประเภทที่ว่า “มีแม่ลูกอ่อนที่ ที่กินไอศกรีม A แล้วต่อด้วยของหวาน B โดยเห็นโฆษณาผ่านช่องทาง C และมีรายได้ไม่เกิน 15000 บาทต่อเดือน กี่คน คิดเป็นกี่ % ของทั้งหมด”
  4. Script Kiddie คือคนที่เขียนโปรแกรมง่ายๆนิดหน่อย copy paste เปลี่ยนค่าได้คำตอบ ใช้ Tool สำเร็จรูปในการทำงาน เช่น Azure ML, IBM Watson, KNIME (คนไทยส่วนใหญ่มาแปะกันตรงนี้ พวกนักวิชาการ) เพื่อให้ได้คำตอบที่อยากได้
  5. Powerpoint Jockey — จริงๆเป็น แสลง สำหรับคนที่ไม่ได้เป็นสายงาน Data Scientist จริงๆ เป็นการใช้ชื่อตำแหน่งตามกระแส อย่างไรก็ตามเขาสามารถสรรหาผลลัพธ์ออกมาได้ พวก Startup ใหม่ๆ ที่ยังขาดคนมีฝีมือด้านคณิตศาสตร์และการเขียนโปรแกรม หรือบริษัทใหญ่ๆแต่โบราณ Tool ที่ใช้ก็คือ Powerpoint Excel laser-pointer และ Buzzword คำพูดที่นิยม เช่น Big Data Machine Learning

งานสายนี้ที่ไทยก็พอมีบ้างครับ แต่จะหนักไปที่ BI Developer และ Data Analyst ในสายงาน Tech Giant จากเมืองนอก หรือไปทาง Startup เลยครับ

แนะนำว่าใครสนใจ ให้ลองเรียนคอร์สสั้นๆออนไลน์ก่อนครับ เช่น

https://www.udemy.com

https://www.codeschool.com/

https://www.datacamp.com/

--

--