[Life@TILDI] ทำความเข้าพื้นฐาน Data Management กันเถอะ !!!

Punsiri Boonyakiat
CJ Express Tech (TILDI)
5 min readMar 12, 2024

disclaimer:ในบทความนี้เราจะมาเล่าประสบการ์ณการเรียนรู้ Data Management ภายในทีมผ่านการทำ Online group discussion และการสอนโดยอาจารย์พี่ปอ Pongthep Vijite โดยสาเหตุที่อยากเอา session นี้มาแบ่งปันเพื่อนๆ ก็คือ นอกจากว่า Data Management จะเป็นความรู้พื้นฐานในองค์กรแล้วเราพบว่าการที่ได้เรียนรู้เรื่องนี้ร่วมกันกับทุกคนในทีมเป็นเรื่องที่สนุกมากๆ ผู้เขียนเองแม้จะทำงานกับข้อมูลมานาน แต่เรื่อง Data Management ก็ยังเป็นเรื่องใหม่พอสมควร แน่นอนว่าทุกคนในองค์กรอยากใช้ Data หรืออยากสร้าง Data Culture! แต่เราจะจัดการข้อมูลยังไงเป็นเรื่องสำคัญเช่นกัน ซึ่ง session นี้ทำให้เราได้เห็นมุมมองที่หลากหลายจากหลายๆ roles ที่ทำงานใน squad เดียวกัน หรือคนละ squad กันว่ามีมุมมองกับข้อมูลยังไงบ้าง คาดหวังยังไงบ้าง และเรารู้สึกว่ามันเจ๋งมากๆจริงๆ

# Tables of Contents
1. แนะนำผู้สอนและหนังสือ
2. What is Data?
3. Data is Asset!
4. Data Discovery/ Dark Data
5. Data Strategy?
6. สรุป + ส่งท้าย

1.แนะนำผู้สอนและหนังสือ

แนะนำผู้สอน พี่ปอ Pongthep Vijite

แนะนำผู้สอน facilitate session นี้ ซึ่งเป็นกิจกรรมภายในทีม คือพี่ปอ Pongthep Vijite เป็น Data Engineer and Platform Manager ซึ่งพี่ปอจะดูแลทีมที่ประกอบไปด้วย Data engineer (DE), Data platform engineer (DPE) , Analytics Engineer (AE) และ Site Reliability Engineer (SRE) นอกเหนือจากดูแลทีมแล้ว ยังเป็นผู้ก่อตั้ง Community ใน Facebook สำหรับ Data Engineer และ Data Officer ด้วย แถม!!! ยังเป็นอาจาร์ยสอนเรื่อง Data Management ที่ NIDA อีก !! เรียกว่าคนในทีมรอ session นี้กันเยอะมาก!

โดยเนื้อหาที่ถูกนำมาถกประเด็นกันใน session จะมาจากหนังสือที่ชื่อว่า DMBoK — Data Management Body of Knowledge ที่เรียกว่าเป็นตำราสำหรับคนที่จะศึกษาเรื่องของการบริหารจัดการข้อมูลภายในองค์กรเลย!

2. What is Data?

เมื่อถามว่า Data หรือข้อมูลคืออะไร? หลายๆคนสามารถตอบได้ทันทีว่า data คือข้อมูลที่ถูกเก็บรวบรวม เก็บรักษา และประมวลผลเพื่อนำมาใช้หา insigth ที่มีค่าได้ต่อธุรกิจได้ มันสามารถเป็นตัวเลข, ข้อความ, รูปภาพ, เสียง, วิดีโอ สามารถแบ่งได้เป็น structured data หรือ unstructured data อย่างไรก็ดี ใน session แบบนี้ พอมีหลายๆ role มาอยู่ด้วยกันเราก็มองเห็นมุมมองที่แต่ละคนนิยามความหมายของ Data ต่างกันอย่างสิ้นเชิง!!!

ตัวอย่างคำตอบใน session ว่าข้อมูลคืออะไรในมุมมองของแต่ละ Role ในองค์กร

เช่น ข้อมูลสามารถมีความหมายที่แตกต่างกันไปตามมุมมองบทบาทและการจัดการข้อมูล (Data Management) ของผู้ใช้งาน ดังนั้นพอนั้งนึกดูที่แต่ละคนนิยามความหมายของข้อมูลต่างกันนั้นอาจจะเป็นเพราะบทบาทและการใช้งานข้อมูลที่แตกต่างกัน เช่น

  1. Data Analytics (DA):ใช้ข้อมูลเพื่อวิเคราะห์ เพื่อสร้างความเข้าใจข้อมูลที่สำคัญ เพื่อตรวจสอบแนวโน้ม และทำนายผลลัพธ์ที่เป็นประโยชน์สำหรับธุรกิจ
  2. Data Science (DS): ใช้ Machine learning ในการการประมวลผลข้อมูล ทำการวิเคราะห์ข้อมูลเพื่อค้นพบความรู้ที่ซ่อนอยู่และสร้างแบบจำลองทำนาย
  3. Data Engineering (DE): ทำการออกแบบ สร้าง และบำรุงรักษาโครงสร้างระบบฐานข้อมูลและพื้นฐานข้อมูลในองค์กร ทำงานเพื่อเพิ่มประสิทธิภาพในการจัดเก็บข้อมูล และการจัดการข้อมูลในระบบให้ปลอดภัย
  4. Business User (BU): ใช้ข้อมูลในการสนับสนุนการตัดสินใจธุรกิจ
เราก็ต่างคลำช้างกันคนละจุดแม้ว่ารามีเป้าหมายในการดูแลช้างเหมือนกัน

พอได้ฟังคำตอบจากหลายๆ Role ในห้องก็นึกถึงภาพนี้เลย!! แม้ในองค์กรจะมีคนที่ทำงาน Data หลายส่วนเพื่อขับเคลื่อนเป้าหมายเดียวกัน แต่ว่าแต่ะละ Role ก็มีมุมมองและบทบาทในการทำงานต่างกัน เรา interact กับข้อมูล มีความคาดหวังไม่เหมือนกัน!! แม้จะมีเป้าหมายในกันขับเคลื่อนองค์กรเหมือนกัน

3. Data is Asset!

ดังนั้นในมุมมองของ Data Management ซึ่งเกิดจากคำว่า ข้อมูล + การบริหารจัดการ! เราจึงต้องทำความเข้าใจก่อนว่าข้อมูลมันคืออะไรกันแน่???

Data Management = Data + Management

“งั้นลองมาเปรียบเทียบข้อมูล กับ รถ สมมุติว่าเราเป็นบริษัทเต็นท์รถที่ให้บริการเช่ารถออนไลน์ คุณคิดว่ามันเหมือนกันยังไง?”

“สิ่งที่เหมือนกันคือ” มันคือ Asset หรือสินทรัพย์ขององค์กร!!

ดังนั้นเมื่อเข้าใจคำว่า Asset เราจึงเห็นความสำคัญว่าทำไมเราต้องให้ความสำคัญกับ Data management เพราะเราต้องการดูแลรักษา​ สินทรัพย์ขององค์กร หรือนำมาใช้ประโยชน์ให้เกิดมูลค่าสุงสุดจนสร้างกำไร สร้าง value ให้องค์กรได้

มาลองเปรียบเทียบ Data ที่เป็น Asset ขององค์กร และรถยนต์ที่เป็น Asset ขององค์กรเช่นกันหากว่าเราเป็นบริษัทที่ให้บริการการเช่ารถ จะเหมือนหรือต่างกันอย่างไรบ้าง?

#Excercise 
# จงเปรียบเทียบ ข้อมูล และ รถ ในมุมมองการเป็น Asset ขององค์กรดังนี้
1. การนำไปใช้ (Utilization)
2. ความมีค่า (Value)
3. ค่าใช้จ่าย (Cost)
4. การบริหารจัดการ (Management)
5. การเสี่ยงและความปลอดภัย (Risk and Security)

1. การนำไปใช้ (Utilization):

  • รถ: ใช้ในการเดินทาง, การขนส่ง ภายในองค์กร หรือให้เช่าในการทำธุรกิจ
  • ข้อมูล: การนำข้อมูลไปใช้ในการตัดสินใจธุรกิจ, การพัฒนาผลิตภัณฑ์, และการสร้างความเข้าใจทางธุรกิจ

2. ความมีค่า (Value):

  • รถ: ค่าของรถมีไว้ทั้งในเชิงการใช้งานและค่าตลาด ความคุ้มค่าของรถลดลงตามเวลาและการใช้งาน
  • ข้อมูล: ข้อมูลมีค่าเมื่อถูกนำมาใช้ในการตัดสินใจ, วิเคราะห์, หรือการพัฒนาธุรกิจ ค่าของข้อมูลมีการเพิ่มขึ้นเมื่อสามารถแปลงข้อมูลเหล่านั้นให้เป็นความรู้ที่มีประโยชน์

3. ค่าใช้จ่าย (Cost):

  • รถ: หากเราอยากให้รถไม่เสื่อมสภาพ และทำกำไรให้บริษัทก็จะต้องมี ค่าบำรุงรักษา ค่าน้ำมัน ค่าประกันภัย ค่าจ้างพนักงานมาดูแลรถยนต์
  • ข้อมูล: ข้อมูลก็มีค่าจัดเก็บเช่นกัน และค่าใช้จ่ายในการประมวลผลข้อมูล ค่าใช้จ่ายในการขนย้ายหรือ transfer ของมูล

4. การบริหารจัดการ (Management):

  • รถ: การบำรุงรักษารถ, การปรับแต่ง, และการป้องกันการสูญหายมีความสำคัญเพื่อให้รถทำงานอย่างมีประสิทธิภาพ
  • ข้อมูล: การบริหารจัดการข้อมูลเป็นส่วนสำคัญ เช่น การป้องกันความสูญหาย, การรักษาความครบถ้วนของข้อมูล, และการเข้าถึงข้อมูล ที่เรามักจะคุ้นเคยกันเช่น Data Loss, Data Governance, Data Secuirty

5. การเสี่ยงและความปลอดภัย (Risk and Security):

  • รถ: การป้องกันปลอดภัยของรถ, การสูญหาย, และความเสี่ยงจากอุบัติเหตุบทท้องถนน
  • ข้อมูล: ความปลอดภัยข้อมูล เพื่อป้องกันการแก้ไขข้อมูล, การสูญหาย, และการปลอมแปลง หรือข้อมูลทางธุรกิจหลุดรั่ว

แล้ว Data นั้นเป็น Asset ที่มีความพิเศษกว่า Asset อื่นๆอย่างไร? ทำไมความเข้า Data Management จึงมีความสำคัญกับองค์กรเป็นอย่างมาก?

  1. Tangibility (ความมีตัวตนของสินทรัพย์) — ข้อมูลเป็นสินทรัพย์แบบ intangible คือไม่สามารถจับต้องได้ อยู่ในรูป digital และเก็บใน servers หรือ บนcloud
  2. Depreciation (ความเสื่อมราคา) — สินทรัพย์ทั่วไปมักมีค่าเสื่อมราคาเมื่อเวลาผ่านไป แต่อย่างไรก็ดี ข้อมูลยิ่งเก็บไว้นานยิงมีมูลค่าในการหา Insight ดูข้อมูลย้อนหลัง อย่างไรก็ดีหากเก็บนานไปไม่ได้ใช้ก็มีค่าใช้จ่ายในการจัดเก็บและจะกลายเป็น Dark Data ได้
  3. Lifespan (อายุการใช้งาน) — ข้อมูลมีอายุการใช้งานที่ไม่จำกัด ไม่มี “วันหมดอายุ” ข้อมูลมีความยืดหยุ่นสูง สามารถนำไปใช้ใหม่ วิเคราะห์ใหม่ และใช้ในวัตถุประสงค์ต่างๆ โดยไม่ต้องเปลี่ยนแปลงทางกายภาพ หากจัดเก็บได้ดี

แล้ว Asset เดียวกันในองค์กรแต่ละคนมีหน้าทีดูแลแตกต่างกันอย่างไร?

เช่นถ้าเป็นตัวอย่างรถยนต์ ก็อาจจะมี Marketing ที่ต้องทำตลาดดูว่าจะปล่อยรถยนต์ให้เช่าได้อย่างไร มีแผนกจัดซื้อเพื่อดูว่าจะซื้อรถคันไหนเข้ามาเพิ่มเพื่อให้ตอบโจทย์ธุรกิจ มียามที่คอยตรวจตราดูแลความปลอกภัยของรถไม่ให้ถูกโจรกรรม

เมื่อเทียบกับคำตอบในข้อ 1 ทุกคนจึงเห็นตรงกันว่า Asset เดียวกัน มีเป้าหมายเดียวกันในการขับคลื่อน data culure ขององค์กร แต่หากอยู่คนละตำแหน่างก็จะมีมุมในการทำงานบกับ Daat ไม่เหมือนกันได้เราจึงต้อง Empathy กันและกัน

เมื่อเรารู้แล้วว่า Data เป็น Asset ที่สำคัญต่อองค์กร ซึ่งจะมีทั้งแง่มุมที่เราต้องใช้งานเพื่อให้เกิดประโยชน์สูงสุดแล้วยังต้อง ดูแลรักษา เพื่อป้องกันความเสี่ยงในการสูญหายหรือโจรกรรมข้อมูลด้วย!

แถม! ตัวอย่างการบริหารจัดการ Data ซึ่งเป็น Asset ที่สำคัญไม่ดีพอจะเกิดกรณี Use Case แบบนี้ ซึ่งเป็นสิ่งที่เราไม่อยากให้เกิดขึ้นกับองค์กรไหนๆเลยที่ทำข้อมูลสำคัญหลุดรั่ว หรือ สูญหาย หรือ โดนโจรกรรม!!

4. Data Strategy ?

เมื่อเรารู้แล้วว่าข้อมูลคืออะไร มีความสำคัญต่อองค์ยังไงทำไมต้องเข้าไปบริหารจัดการให้ดี จึงนำมาสู่คำถามที่ว่า “แล้วเราจะมีกลยุทธ์ในการจัดการข้อมูลอย่างไรเพื่อให้เหมาะกับธุรกิจขององค์กร?”

ซึ่งจากรูปด้านล่างจะเป็นการเสนอแนวทางการออกแบบกลยุทย์การบริหารจัดการข้อมูลภายในองค์กรจากบทความ “What’s Your Data Strategy?” ว่าจะบริษัทตัดสินใจว่าจะเลือกใช้กลยุทธ์ข้อมูลแบบโจมตีหรือแบบป้องกันอย่างไร ถ้าเปรียบเทียบกับกีฬาฟุตบอลที่จะมีกองหน้า กองกลาง กองหลัง ที่จะกองหน้าจะเน้นกลยุทธ์แบบบุก pro-active ในขณะที่กองกลางจะเป็นกลยุทธ์ในการสร้างพื้นฐานที่ดี และกองหลังจะเป็นกลยุทธ์ในการป้องกันประตูไม่ให้ถูกยิง ซึ่งถ้านำมาเปรียบเทียบกับกลยุทธ์ของการบริหารจัดการข้อมูลจะเป็นดังรูปด้านล่าง

Data Strategy
  1. Offensive Data Capabilities (การโจมตี) — เน้นการสร้างผลลัพธ์ที่เชิงบวกผ่านการเพิ่มรายได้และกำไรหรือการสร้างประสบการณ์ลูกค้าที่ดีขึ้น โดยการใช้ insight จากข้อมูล โดยมีแนวทางเช่น
  • Marketing & AI Analytics — การใช้เทคโนโลยี AI และการวิเคราะห์ข้อมูลเพื่อปรับปรุง หรือ เพิ่มประสิทธิภาพในการสร้างกลยุทธ์การตลาด
  • Customer Insights — ข้อมูลและความเข้าใจที่ได้จากการวิเคราะห์ลูกค้า เพื่อเข้าใจพฤติกรรม ความต้องการ และปัจจัยที่ส่งผลต่อการตัดสินใจทางธุรกิจ
  • Experimentation & Innovation — การทดลอง นำองค์ความรู้ใหม่ๆ นำนวัตกรรมเพื่อพัฒนาผลิตภัณฑ์หรือบริการ ด้วยการใช้ข้อมูล
  • Data Democratization — ทำให้ข้อมูลเป็นทรัพยากรที่สามารถเข้าถึงได้โดยทุกคนในองค์กร ไม่ว่าจะเป็นผู้บริหารหรือพนักงานทั่วไป เพื่อสนับสนุนการตัดสินใจที่มีข้อมูลเป็นพื้นฐาน
  • Data Monetization — กระบวนการทำกำไรจากข้อมูล ซึ่งสามารถเป็นไปได้ผ่านการขายข้อมูล การให้บริการวิเคราะห์ข้อมูล หรือการใช้ข้อมูลเพื่อสร้างรายได้

2. Foundational Data Capabilities (การสร้างพื้นฐาน)— กลยุทธ์การวางรากฐาน Data platform ที่แข็งแรงจะเป็นตัวส่งเสริมให้องค์กรก้าวกระโดนในการจัดการข้อมูล

  • Business intelligence — เป็นกระบวนการที่ใช้เทคโนโลยี, ข้อมูล, และการวิเคราะห์เพื่อเข้าใจและวิเคราะห์ข้อมูลจที่จะช่วยในการตัดสินใจทางธุรกิจ, การวางแผน, และการจัดการทรัพยากร
  • Customer 360 — การเข้าใจลูกค้าในทุก journey ที่มีผลทางธุรกิจ แบบครบทุกมุมมองตั้งแต่ข้อมูลพื้นฐานไปจนถึงประวัติการทำธุรกิจ เพื่อให้เข้า ส่งเสริมการขาย สร้าง loyalty ต่อบริการหรือผลิตภัณฑ์
  • Data Quality — คุณภาพของข้อมูล การตรวจสอบความถูกต้อง, ความครบถ้วน ความน่าเชื่อถือ และความเหมาะสมของข้อมูล เพื่อสร้างความน่าเชื่อถือต่อผลลัพธ์ที่ได้จากวิเคราะห์ ต่อยอดข้อมูล
  • Data Catalog — ระบบที่ให้ข้อมูลเกี่ยวกับทรัพยากรข้อมูลทั้งหมดในองค์กร รวมถึงตาราง ฐานข้อมูล และแหล่งข้อมูลทั้งหมด เพื่อช่วยในการค้นหาและการใช้งานข้อมูล เป็นการส่งเสริมให้คนในองค์เข้าถึงข้อมูลได้มากขึ้น ใช้ประโยชน์จากข้อมูลได้มากขึ้น
  • Metadata Management — ข้อมูลที่อธิบายข้อมูล หรือบัญชีข้อมูลของข้อมูลอื่น ๆ โดยจะรวบรวม บริหารจัดการ เพื่อเพิ่มความเข้าใจในการนำข้อมูลไปใช้งาน
  • Data Architecture —ระบบ Platform ข้อมูลทั้งหมดในองค์กร รวมถึงโครงสร้างของฐานข้อมูล การนำเข้าและการส่งออกข้อมูล และการทำให้ข้อมูลเป็นระบบทำงานร่วมกันได้อย่างมีประสิทธิภาพ (Orchrestration)
  • Culture & Literacy — วัฒนธรรมขององค์กรต่อข้อมูลและความสามารถในการเข้าใจ ใช้ และวิเคราะห์ข้อมูลในทีมและองค์กร ซึ่งเราควรส่งเสริมให้คนในองค์กรมี data literacy หรือความเข้าใจในการประยุกต์ใช้ข้อมูลเพื่อพัฒนาธุรกิจ

3. Defensive Data Strategy (การป้องกัน) — เน้นการป้องกันผลลัพธ์ที่ไม่พึงประสงค์ ลดความเสี่ยงผ่านการตรวจสอบบริหารจัดการข้อมูล

  • Compliance AI (Fraud, AML) — เน้นในด้านภัยคุกคามและการป้องกันภัยคุกคามทางช่องทาง Digital โดยใช้เทคโนโลยี AI เพื่อตรวจจับและป้องกัน
  • Data Lineage & Integrity— ติดตามและบันทึกลำดับขั้นของข้อมูลตั้งแต่ต้นทางไปจนถึงปลายทาง และส่งเสริมความถูกต้อง เพื่อสร้างความน่าเชื่อถือของข้อมูลที่จะถูกใช้ต่อไป
  • Regulatory Compliance — กฎระเบียบ ข้อบังคับ และกฎหมายที่เกี่ยวข้องกับการจัดการข้อมูลในองค์กร เพื่อป้องกันความผิดพลาดและความเสี่ยง
  • Data Security — ป้องกันข้อมูลจากการเข้าถึง การทำลาย หรือการประมวลผลที่ไม่ได้รับอนุญาต
  • Data Privacy — การปกปิดและปกปิดข้อมูลส่วนบุคคล รวมถึงการปฏิบัติตามกฎหมาย PDPA
Data Strategy เทียบกับกลยุทธ์ของการวางตำแหน่งนักฟุตบอล

Data Strategy เทียบกับกลยุทธ์ของการวางตำแหน่งนักฟุตบอล ซึ่งขึ้นอยู่กับบริบทและความต้องการขององค์กร ณ เวลานั้นๆ ว่าต้องการขับเคลื่อน บริหารจัดการข้อมูลกลยุทธ์องค์กรไปในแนวทางไหน!! ซึ่ง ควรจะสอดคล้องไปกับกลยุทธ์เชิงธุรกิจด้วย!

5. สรุป + ส่งท้าย

บรรยากาศใน Online Session กว่าหลายชีวิตมาร่วม Discuss กันสนุกมากๆๆๆๆๆ

“Data is Asset” ทุกๆคนมีหน้าที่ในการบริหารจัดการ Asset ด้วย mindset วิธีการ เครื่องมือที่แตกต่างกัน! และเราควรศึกษากลยุทธ์ในการบริหารจัดการข้อมูลเพื่อให้สร้างมูลค่าทางธุรกิจให้องค์กรได้สูงสุด !!

Key takeaways ของ data management 101 คือ

  1. มองให้ได้ว่า data คืออะไร
  2. เข้าใจความแตกต่างของแต่ละ role ที่มีส่วนร่วมกับ asset
  3. เข้าใจความสัมพันธ์ระหว่าง business strategy และ data strategy

ปล. จริงๆแล้วเนื้อหาใน session ของ Data Management มีเยอะมากแต่อันนี้เราขอหยิบบางส่วนมาเป็นตัวอย่างเพื่อแบ่งปันประสบการ์ณค่ะ อยากจะของคุณ พี่ปอ Pongthep Vijite ที่จัด session นี้ภายในทีม และระหว่างทีม ซึ่งเป็นเรื่องที่ทำให้เรามีความเข้าจภาพรวมของ Data Management มากขึ้นและเห็นความสำคัญของบทบาทตัวเองที่กำลังพยายามขับเคลื่อน data culture ภายในองค์กรได้ชัดเจนขึ้น และทำให้มี motivation มากๆๆค่ะ

Reference

--

--

Punsiri Boonyakiat
CJ Express Tech (TILDI)

Senior Data Engineer | Google Cloud Certified Professional Data Engineer| Traveller | A Mom | Learner