Introduction to Business Analytics and Data Science

Thanachart Ritbumroong
MADT and BADS @ NIDA
2 min readJan 10, 2019

เทอมที่ผ่านมาได้รับมอบหมายให้สอนรายวิชา BADS 6001 Introduction to Business Analytics and Data Science ของหลักสูตร Master of Science Program in Business Analytics and Data Science ที่ NIDA หรือ เรามีชื่อเล่นของหลักสูตรว่า BADS ครับ ดูร้ายๆ ไหมครับ

ใครสนใจก็ไปดูใน Facebook Page ของหลักสูตรได้เลยครับ (ขอฝากร้านหน่อยนะครับ ^^)

https://www.facebook.com/BusinessAnalyticsNIDA

หลักสูตรเราก็เน้นปั้นทั้ง Business Analyst และ Data Scientist ซึ่งเป็นอาชีพสุดฮอตในช่วงเวลานี้ มีความต้องการในตลาดอย่างมาก แต่กลับกลายเป็นว่าหาคนที่มีทักษะความสามารถในตลาดได้ยากมาก หลายคนถามว่าถ้าอยากเป็น Data Scientist ต้องเรียนอะไร วันนี้ขอเชียร์หลักสูตรออกนอกหน้าหน่อยว่า ก็ต้องมาเรียนหลักสูตรนี้ที่ NIDA สิครับ รับรองว่าเข้มข้นแน่นอน

วิชาที่ผมสอน ก็จะเป็นการปูเบสิคพื้นฐานว่า คนที่จะทำงานด้าน Business Analytics หรือ Data Science ควรจะต้องรู้อะไรบ้าง เลยจะมาแชร์ให้ฟังกันครับ เผื่อใครอยากจะไปศึกษาเรียนรู้ จะได้มีแนวว่าจะต้องไปอ่านอะไรยังไง

หัวข้อที่สอนในวิชาดี ก็มีประมาณนี้ครับ

  • Foundations of Business Analytics and Data Science

วิชานี้เราก็เริ่มต้นกันน่ารักๆ ด้วยคำจำกัดความกันก่อนว่า Business Analytics กับ Data Science นั้น มีที่มาที่ไปอย่างไร แล้วก็ยกเคสตัวอย่างให้เห็นว่าในธุรกิจต่างๆ เค้าเอาข้อมูลไปช่วยในการทำธุรกิจอย่างไร รวมถึงให้เห็นภาพรวมว่า Common Analytics Techniques มีอะไรบ้าง แล้วก็ไปจบถึงกระบวนการในการทำ Data Analytics ว่ามีกระบวนการขั้นตอนหรือ Methodology อย่างไร

  • Prior to Business Analytics and Data Science

จากนั้น ก็พานักศึกษาย้อนเวลาไปว่า ก่อนหน้าที่จะมาเป็น Business Analytics และ Data Science นั้น เค้าทำอะไรกัน ก็ย้อนไปปูพื้นเรื่อง Business Intelligence และ Data Warehouse ครับ เพราะตอนนี้ เข้าไปทำงานในองค์กรไหน ก็ยังพัวพันอยู่กับ BI และ Data Warehouse เป็นแน่แท้ และแน่นอน เราก็สอนลงลึกไปถึงการออกแบบพวก Measures และ Dimensions ประกอบร่างกันเป็น Star Schema และการทำ ETL รวมถึงความหมายของปัญหาในการทำ Data ซึ่งก็คือ Slowly Changing Dimension

  • Exploratory Data Analysis

ในส่วนของ EDA ก็จะเน้นให้เข้าใจว่า เมื่อเราได้ Data มานั้น ทุกครั้งก่อนจะเริ่มทำการวิเคราะห์นั้น เราต้องเข้าใจ data ชุดนั้นๆ ก่อน ในทางสถิติ ก็จะมีการใช้ Descriptive Statistics มาช่วยในการเข้าใจรูปแบบการกระจายของข้อมูล ซึ่งก็คือ การหาค่า Center, Spread, และ Position จากนั้น ก็พานักศึกษาไปเข้าใจความวุ่นวายในการประเมิน Data Quality ซึ่งเราค่อนข้างมั่นใจว่า ทุกๆ ชุดข้อมูลนั้น จะต้องมีความประหลาดหรือความผิดปกติเป็นที่แน่แท้ เราก็ต้องรู้เทคนิควิธีในการ Explore ข้อมูลและจัดการแก้ปัญหา รู้ว่า Data Imputation คืออะไร เมื่อไหร่ควรทำหรือไม่ควรทำ

  • Prediction and Forecasting

หัวข้อนี้ก็พาไปรู้จักหลักการและวิธีการของพวก Regression และให้เข้าใจความแตกต่างของการทำ Regression ด้วยเทคนิคทางสถิติ และ Machine Learning สอนถึงปัญหาที่จะเกิดขึ้นของ Regression และทางแก้ สอนไปถึงเรื่อง Regularization ทั้ง Ridge Regression และ Lasso Regression แล้วก็ลากยาวไปถึงเทคนิคการทำพวก Time Series Forecasting

  • Classification

เนื้อหาส่วนนี้ ก็จะเป็นการสร้างโมเดลเพื่อทำนายว่า ผลลัพธ์จะเป็น Class ไหน เช่น ลูกค้าที่สมัครบัตรเครดิต จะเป็นหนี้ดี หรือ หนี้เสีย ถ้าส่งคูปองไปให้ลูกค้ารายนั้นๆแล้ว เค้าจะกลับมาใช้หรือไม่ ก็จะเป็นการสอนให้รู้จักเทคนิคของ Decision Tree ครับ ว่าการสร้าง Tree ขึ้นมา มีแนวคิด วิธีการอย่างไร รวมถึงการทำ Random Forest

  • Model Performance

เมื่อทำ Classification Model เป็นแล้ว ก็ต้องมารู้จักวิธี Tune Model กันครับ โดยจะเรียนรู้ถึงการวัด Model Performance ทั้ง Accuracy, Precision, Recall, Sensitivity, F1-Score แต่ก็ยังไม่จบแค่นั้น เราก็พาไปให้เข้าใจปัญหาของ Imbalanced Dataset แล้วก็สอนถึงการสร้างกราฟ ROC คำนวณหา AUC และทำ Lift Chart (คลาสนี้ กรีดร้องกันดังมาก)

  • Similarity, Distance, Nearest Neighbor

จากพวก predictive models ที่เป็น supervised learning เราก็ตัดกลับมาที่ Unsupervised learning มาเรียนรู้วิธีการหา Similarity เข้าใจถึง Distance Function ในรูปแบบต่างๆ เรียนรู้ K-means clustering และ K-nearest neighbor เรียนรู้วิธีการทำ Customer Segmentation ไปจนถึง concept ของ multi-dimensional customer segmentation

  • Association

พอทำ Customer Segmentation กันเป็นแล้ว ก็มาเรียนรู้วิธีการทำ Recommendation Engine ซึ่งก็จะมาเรียนรู้ว่ามีเทคนิคอะไรบ้าง เมื่อไหร่ควรจะใช้พวก Market Basket เมื่อไหร่จะใช้ Collaborative Filtering ดี

  • Causal Modeling

เนื้อหาเราก็ไปต่อในส่วนของ Experiment Design มาเรียนรู้วิธีการทำ A/B Testing ตัวอย่างการเอาไปใช้ การเตรียม Experiment การทำ Control และ Manipulation Check การทดสอบผลลัพธ์ รวมถึงข้อควรระวัง

  • Prescriptive Analytics

หมดจาก Predictive Analytics เราก็ไปต่อในส่วนของ Prescriptive Analytics โดยทำความเข้าใจแนวคิดของการทำ Optimization เรียนรู้วิธีการเขียน Influence Chart มีกิจกรรมให้ทำเกี่ยวกับโจทย์ Optimization

  • Semi-structured and Unstructured data

จบเนื้อหาส่วนของ Structured Data ก็พามาทำความรู้จักเบื้องต้นกับ Unstructured Data เพื่อให้เข้าใจวิธีการจัดเก็บข้อมูลในรูปแบบของทั้ง Semi-structured และ Unstructured data พาไปรู้จัก NoSQL Database แล้วก็รู้จักเทคนิควิธีการทำพวก Text Analytics และการทำ Image Analytics สอนให้เห็นว่าทำไมคอมพิวเตอร์ถึง detect หน้าคนได้ แล้วพวก Deep Learning เข้ามาช่วยยังไง

  • Data Science and Business Strategy

เข้าสู่ช่วงท้ายของบทเรียนด้วยการขมวดให้คิดว่า จะเอาเทคนิคที่เรียนมาทั้งหมดมาวางกลยุทธ์เกี่ยวกับข้อมูลเพื่อไปสร้างมูลค่าทางธุรกิจอย่างไร ก็จะมาเข้าใจว่าข้อมูลนั้นสร้างความสามารถทางด้านการแข่งขันได้อย่างไร แล้วเราต้องวางแผนการพัฒนาความสามารถนี้อย่างไร

  • Data Architecture Design

จบลงด้วยการเข้าใจว่า การวางสถาปัตยกรรมด้านข้อมูลนั้น เป็นอย่างไร ต้องมีองค์ประกอบอะไรบ้าง ต้องมีการออกแบบและกำหนดอะไรอย่างไร

เนื้อหาวิชาที่สอน ก็มีผสมกันทั้งเนื้อหาบรรยาย (ซึ่งก็พยายามลงลึกเท่าที่จะลงไปได้ แต่ส่วนมากนักศึกษาเหมือนจะไปหาอ่านเพิ่มเติมกันเองด้วย ซึ่งน่ารักมาก) และยกตัวอย่าง ยกเคส เพื่อให้เห็นภาพว่าเค้าทำกันจริงๆ ยังไงบ้าง ตอนท้ายมีจัด Python Tutorial ในการทำ Customer Segmentation, Regression, Churn Prediction, Product Association เป็นของแถม

วิชานี้ ยังมีการสั่งงานให้นักศึกษาไปทำ Data Project หรือ Data Product กันอีก (นักศึกษาคงทำไปปาดน้ำตาไป เรียนก็หนักแล้ว งานยังหนักอีก) ไว้เดี๋ยวจะมาเล่าให้ฟังว่านักศึกษาทำหัวข้ออะไรบ้าง ก็มีหัวข้อน่าสนใจเยอะเลยครับ

--

--

Thanachart Ritbumroong
MADT and BADS @ NIDA

Lecturer at Management of Analytics and Data Science Program, National Institute of Development Administration, Thailand and Data Analytics Consultant