Data Analytic ตามที่เข้าใจ

Paranee Apiromsanee
te<h @TDG
Published in
3 min readMar 10, 2020

ในความเป็นจริงแล้วนั้น การวิเคราะห์เกิดขึ้นแทบจะตลอดการดำเนินชีวิต โดยที่ข้อมูลที่เรานำมาวิเคราะห์นั้นมีจากหลากหลายที่ แต่การตัดสินใจนั้นจะขึ้นอยู่กับวิจารณญาณ ซึ่งสั่งสมมาจากประสบการณ์ของแต่ละคนที่ได้พบเจอเหตุการณ์ต่างๆมา สิ่งที่กล่าวมาข้างต้นคือภาพขนาดเล็กของการวิเคราะห์ข้อมูล

ส่วนภาพใหญ่ ก็คงหนีไม่พ้นภาคธุรกิจและองค์กร ซึ่งจะทำให้เกิดสิ่งที่เรียกว่า Big Data เพราะอะไร? เพราะว่าบริษัทเหล่านี้มีความสามารถในการเก็บข้อมูลชนิดที่เรียกได้ว่ามหาศาล (ซึ่งของแบบนี้มันก็ขึ้นอยู่กับเม็ดเงินล่ะนะ) น่ะสิ

โดยทาง True Digital Academy นั้นมีโครงการ Data Analytic Training ให้กับพนักงานของ True Digital Group ซึ่ง จขบ.ได้มีโอกาสได้เข้าไปเรียนมาคอร์สหนึ่ง

ต้องขอเกริ่นก่อนว่า จขบ.ไม่มีประสบการณ์ด้านการวิเคราะห์ข้อมูลแต่อย่างใด ประสบการณ์เรียกได้ว่าแทบจะเป็น 0 (มีแค่อย่างเดียวที่พอจะรู้เรื่องบ้างก็ Database, SQL) ต่อจากนี้คือสิ่งที่จขบ.เข้าใจ ถ้ามีข้อผิดพลาดเพิ่มเติมประการใด โปรดชี้แนะทางสว่างให้จขบ.ด้วยจ้าา (/me กราบเบญจางฯ)

สิ่งที่บ่งบอกความเป็น big data

  1. ปริมาณของข้อมูล
  2. ข้อมูลเพิ่มอย่างต่อเนื่อง
  3. ข้อมูลที่ดีพอจะสามารถหาสาระได้
  4. ข้อมูลมีรูปแบบหลากหลาย
  5. ความถูกต้องของข้อมูล

ทั้งหมดที่กล่าวมานี้คือ 5’v of Big Data นั่นเอง

ขั้นตอนการ analyse data

  1. Frame ตั้งคำถามหรือหาปัญหาที่ต้องการคำตอบ
  2. Prepare เตรียมข้อมูล
  3. Analyze วาดภาพความสัมพันธ์ของข้อมูลที่ตรงกับจุดประสงค์
  4. Interpret สังเคราะห์ข้อมูลเพื่อหาข้อสรุป ทางแก้ไข หรือข้อคิดเห็นอื่นๆ
  5. Communicate ถ่ายทอดสิ่งที่ทำมา
Cr. True Digital Academy — ANA07

Frame

วิธีการตีกรอบให้กับปัญหาหรือความคิด

Story Map — Cr. True Digital Academy — ANA07

โดย Story Map นั้นจะช่วยให้การประมวลผลความคิดของเรานั้นไม่หลง และง่ายขึ้น

1. Setting / Time / Place เป็นเหมือน biz context ว่าปัญหาที่เกิดขึ้นนั้นเกิดที่ไหน สามารถระบุช่วงเวลาได้ไหม ข้อมูลที่เกี่ยวกับเดต้าที่จะนำมา analyze จะหาหรือเก็บข้อมูลได้จากที่ไหน และมีสถานที่อื่นๆที่เกี่ยวข้องรึเปล่า

2. Characters ผู้คนหรือแผนกที่เกี่ยวข้องกับเดต้าที่จะใช้ ความหมายของเดต้าแต่ละชิ้น (Data Dictionary) หรือ metadata รวมถึงผู้ที่ดูแลเดต้าชุดนี้ด้วย

นั่นรวมถึง Audience stakeholder(s) ก็คือลูกค้านั่นเอง ต้องรู้จักกลุ่มลูกค้าที่เราต้องการขายแนวความคิดของเรา รู้เขารู้เรา รบร้อยครั้ง ชนะร้อยครั้ง ถ้าเป็นไปได้เราควรรู้ base knowledge หรือ environment ของลูกค้าก่อนว่าเป็นบุคคลประเภทไหน ถ้าเป็นนักธุรกิจ การเอากราฟไปให้เขาดูอาจจะรักกว่า หรือถ้าเป็นเถ้าแก่ร้านโชว์ห่วยหน้าปากซอย ก็น่าจะดีกว่าถ้าคุยกับแบบง่ายๆ

3. Problem ปัญหา โอกาส ความตั้งใจ สมมติฐานที่ทำให้เกิดการ analyze ขึ้น ซึ่งจริงๆไม่จำเป็นจะต้องเป็นปัญหาเท่านั้น อาจจะเป็นสมมติฐานที่เราคิดว่าสามารถพัฒนาได้ขึ้นไปอีก เช่น ร้านโชว์ห่วยที่มีหน้าร้านเริ่มมียอดขายตกลง เราซึ่งเล็งเห็นแล้วว่า เอ้ะ ถ้าลองเปิดออนไลน์ด้วยอาจจะทำให้ยอดขายเพิ่มก็ได้นะ ตรงนี้คือความตั้งใจที่จะพัฒนา ซึ่งสิ่งที่เราจะทำต่อคือการหาเหตุผลมาเพื่อโน้มน้าวใจเจ้าของร้าน เป็นต้น ดังนั้นจุดนี้อาจจะไม่ใช่แค่ปัญหาก็ได้ แต่แค่ว่าปัญหานั้นจะทำให้เห็นผลลัพธ์ที่ชัดเจนมากกว่า (เพราะมันเป็นจุดที่ลูกค้าเขา pain สุดไง เลยมี impact เยอะ)

4. Plot / Events แพลนของสิ่งที่เราจะทำเพื่อให้การ analyze สำเร็จได้ หรือสิ่งที่เราจะทำเพื่อบรรลุแนวทางแก้ไข/พัฒนา ซึ่งรวมถึงการอธิบายให้ลูกค้าเข้าใจด้วย

เช่น

โจทย์: โรงงานหนึ่งมีปัญหาว่าผลิตของไม่ทัน

สาเหตุ: จากนั้นเราพบว่าพนักงานมักจะง่วงในเวลาทำงานช่วงบ่ายเย็นๆ

ไอเดียแก้ไข: เราเสนอว่าช่วงบ่ายเย็นๆน่าจะมีเวลาให้พนักงานได้ขยับร่างกายตามเพลงเบาๆ

plot/events เราคือ อันดับแรกเราต้องทำให้หัวหน้าอนุมัติ ถ้าผ่านแล้วจะเป็นแพลนที่เริ่มจากการเปิดเพลงอย่างเดียวก่อนซักระยะนึง ถ้าผลออกมาดี ก็อาจจะมีการเพิ่มการขยับร่างกายเข้าไป จากนั้นก็ …

สิ่งนี้คือการวางแผนการนำเอาข้อสรุปหรือข้อแก้ไขมาใช้งาน ซึ่งการเสนอให้ลูกค้าซื้อแนวคิดนี้ก็เป็นหนึ่งในสิ่งที่เราต้องทำด้วย เพราะถ้าหัวหน้าไม่อนุมัติแล้วก็จบเห่เลย

5. Resolution การสรุปว่าข้อเสนอแนะของปัญหา/การพัฒนานี้คืออะไร รวมถึงการให้เหตุผลเพื่อทำให้มีน้ำหนักมากขึ้น และรวมถึง มันจะแม่นยำกว่านี้ถ้าเราได้ข้อมูลในส่วน xx มาเพิ่มเติม ซึ่งการนำเสนอเราควรทำให้ลูกค้าเห็นภาพและเข้าใจมากที่สุด โดยอาจจะใช้ tools เข้ามาช่วยให้เข้าใจง่ายมากขึ้นก็ได้

จากขั้นตอนจะสังเกตได้ว่า จริงๆแล้วนั้นการ analyze ย่อยๆแทบจะมีอยู่ในทุกขั้นตอน แผนภาพนี้จะเป็นเหมือนกรอบใหญ่ๆกว้างๆเพื่อให้เราไม่หลงทาง ไม่ลืมว่าคิดอะไรไว้ เพื่อให้เราแยกไปโฟกัสแต่ละจุดได้ง่ายขึ้นนั่นเอง

Prepare

ปัญหาทั่วไปของ data

  1. ค่าที่เป็นไปไม่ได้ เช่น รัว 9999999 มาในช่อง salary ก็ไม่น่าใช่เนาะ
  2. ค่าที่ผิด เช่น londonn
  3. ค่าที่หายไป
  4. ค่าซ้ำ
  5. ค่าที่โดดออกไปจากเพื่อน เช่นรายรับของคนส่วนใหญ่อยู่ระหว่าง 20,000 แต่มีข้อมูลอีกนิดหน่อยมีรายรับเป็นล้าน ข้อมูลเช่นนี้จะทำให้ค่าข้อมูลบางตัวเหวี่ยงไปมา เช่นค่าเฉลี่ย

ซึ่งข้อมูลที่ไม่สมประกอบและผิดเหล่านี้ทำให้เกิดสิ่งที่เรียกว่า

Garbage In Garbage Out ใส่ขยะก็ได้ขยะ

หน้าที่ของเราคือทำให้ข้อมูลพวกนี้สมประกอบ หรือถ้าไม่สมประกอบก็ลบมันออกไป

Analyze

คือขั้นตอนการนำเอาเดต้าดิบ/เดต้าภาพรวม (Aggregated Data) มามิกซ์กันเพื่อความหมายบางอย่าง

Aggregated Data หมายถึงเดต้า (ที่ clean แล้ว) ที่ผ่านการคำนวนหรือผ่านกระบวนการบางอย่าง (condition) แล้ว เช่น avg (ค่าเฉลี่ย) min max count grouping

ตัวอย่างเช่น

จะอ่านได้ว่า ใน London ประชากรอายุ 18 มีรายได้เฉลี่ย 4,433.33 USD เป็นต้น

โดยในขั้นตอนการ Prepare และ Analyze นั้นสามารถใช้ MS-Excel หรือถ้าเดต้าอยู่ใน database อยู่แล้วก็สามารถใช้ sql เพื่อ aggregated ได้

Cr. google

Interpret

คือการประมวลผลหาสิ่งที่เรา analyzed แล้วว่ามีประโยชน์กับสมมติฐาน/โจทย์/ปัญหาของเราตรงจุดไหนบ้าง และจากข้อมูลที่ analyzed แล้วนั้นเรามีความคิดหรือข้อแนะนำเพิ่มเติมอะไรบ้าง โดยข้อมูลเหล่านี้อาจจะทำให้ลูกค้าสามารถตัดสินใจอะไรบางอย่างได้ชัดเจนมากขึ้นได้ (เพราะว่า analyzed data ของเราเป็นเหตุผลชั้นยอดที่ทำให้เขา make decision)

Communicate

คือการเลือกสื่อที่จะสื่อสารออกไปให้กลุ่มลูกค้าเข้าใจได้ง่ายที่สุด อาจจะมีการทำ visualize มาช่วยให้เห็นภาพมากขึ้นก็จะดีมาก ซึ่งส่วนใหญ่มักจะอยู่ในรูปแบบกราฟต่างๆ หรืออาจจะเป็น infographic ก็เป็นไปได้เช่นกัน

ถามว่าการ visualize คืออะไร ถ้าเอาแบบเข้าใจง่าย มันคือการทำให้ข้อมูลนั้นเลื่อนๆได้ มีความหลากหลายของช่วงข้อมูล สามารถ filter เซ็ตข้อมูลนั้นๆได้ทันที ซึ่งตรงนี้จะทำให้การเทียบข้อมูลเป็นไปได้อย่างทันท่วงที (เกิดลูกค้าอยากดูเราก็สามารถ filter ข้อมูลให้ดูได้เลยยังไงล่ะ)

ซึ่งสำหรับคลาสนี้นั้นแนะนำ tools ตัวหนึ่งที่สามารถทำการ visualize data ได้อย่างมีประสิทธิภาพตัวหนึ่งเลยคือ tableu ซึ่งเจ้า tool ตัวนี้นั้นสามารถทำ aggregated data ได้ และมีทั้ง presentation ได้จบภายในตัวเลยทีเดียว ซึ่งอันที่จริงแล้วเราก็สามารถใช้ MS-Excel เพื่อทำ Pivot Table ได้ แต่ว่ามันเป็นกราฟทื่อๆ ไม่มีลูกเล่นและมิติ ในบางกรณีอาจจะเหมาะ แต่ถ้าในบริษัทใหญ่ๆ มีบอร์ดเก่งๆก็น่าจะมีมุมมองที่หลากหลายกว่า (แล้วก็คงจะไม่ค่อยอยากรอเรานั่งจิ้ม field เท่าไหร่ด้วย) ดังนั้นเราก็ควรเลือก tools ให้ถูกกับการใช้งานมากที่สุด

Cr. Google

สำหรับ tools ตัวอื่นๆที่นิยมใช้ในการวิเคราะห์เช่น PowerBI ก็สามารถใช้ได้เช่นกัน ควรเลือกจากความสามารถในการทำงานของ tool ว่าสอดคล้องกับการใช้งานของเราหรือไม่

สุดท้ายนี้ต้องขอบอกเลยว่า เป็นสิ่งที่ถ้าเข้าใจแล้วจะทำให้การใช้ชีวิตสนุกขึ้นอีกนิดนึง อาจจะมีความยากในช่วงแรก แต่ถ้าจับความสัมพันธ์ของข้อมูลได้เมื่อไหร่ การเอาเดต้ามา x กันนั้นจะยิ่งสนุกมากขึ้นเลยล่ะ

--

--