DAMA — DMBOK : Data Management เมื่อการจัดการข้อมูลไม่ได้มีแค่การเก็บข้อมูล (Part 1)

Chayanis Tuntearapong
Data Teller
Published in
2 min readMay 22, 2024

บทความนี้เกิดจากการสรุปหนังสือ DATA MANAGEMENT BODY OF KNOWLEDGE SECOND EDITION ล้วน ๆ + ความเข้าใจของเราเอง อาจจะมีคำศัพท์แปลก ๆ ยาก ๆ มาบ้าง และ อาจจะยาวกว่าบทความกว่าปกติที่เราเขียน เพราะ บทนึงเนื้อหาเยอะมาก

ในมุมมองของเราเอง เราค่อนข้างคุ้นเคยกับการทำ Data Management ผ่านการเขียน SQL ในการดึงข้อมูล ทำความสะอาดข้อมูล ไม่ว่าจะเป็นการจัดการ Missing Value , Outlier การจัดกลุ่มข้อมูล จากมุมมองราย Transaction ไปเป็นราย Customer แต่ลึก ๆ แล้วการทำ Data Management มันไม่ได้จบเพียงแค่นี้ มันมีหลายสิ่งหลายอย่างที่น่าสนใจ

ในหนังสือ DAMA มองว่า การจัดการข้อมูล คือ การพัฒนา ดำเนินการ และควบคุมแผน นโยบาย โปรแกรม และการปฏิบัติที่ส่งมอบ ควบคุม ปกป้อง และ เพิ่มคุณค่าของข้อมูลและสินทรัพย์ข้อมูลตลอดอายุการใช้งานของพวกมัน เพราะฉะนั้นการจัดการข้อมูลไม่ได้จบแค่การที่เราเก็บ แต่หมายถึง การสร้างมาตรฐาน นโนบายต่าง ๆ ที่เหมาะสม ซึ่งใน DM-BOK มีสิ่งที่เรียกว่า DAMA Framework ซึ่งเราจะมาดูกลังจากนี้

ข้อมูลคือทรัพย์สินหนึ่งในองค์กร แม้ว่าอาจจะจับต้องไม่ได้ เหมือนที่ดิน หรือ เงิน แต่สามารถสร้างมูลค่าได้ ผ่านการเปลี่ยนข้อมูลเป็นอย่างอื่น เช่น สารสนเทศ (information) ความรู้ (knowledge) [ แนะนำให้ไปอ่านบทความนี้ Data 101 : data, information ,knowledge and wisdom ]

การที่องค์กรจะสามารถทำให้ตัวเองเป็น “Data — Driven” ได้ ต้องหยุดที่จะพึ่งพาสัญชาติญาณของตัวเอง และ นำสิ่งที่วิเคราะห์เปลี่ยนมาเป็นแผน กลยุทธ์ที่สามารถทำได้จริง ๆ ในองค์กร

Data Management Principles : หลักการในการจัดการข้อมูล

การจัดการข้อมูลที่มีประสิทธิภาพต้องการความรับผิดชอบจากผู้นำ — DAMA

หลักการในการจัดการข้อมูล สามารถแบ่งได้เป็น 4 หัวข้อหลัก

  1. ข้อมูลนั้นมีมูลค่า Data is Valuable

อย่างที่ได้กล่าวในข้างต้นข้อมูลนั้นเป็นทรัพย์สินในองค์กรที่มีลักษณะเฉพาะตัว และ มูลค่าของข้อมูล สามารถอธิบายออกมาได้ในเชิงเศรษฐศาสตร์ได้ สิ่งที่เป็นความท้าทายอย่างนึงเลยก็ได้ ข้อมูลนั้นสามารถคัดลอก โยกย้ายออกมาได้ แต่ก็หายได้เช่นเดียวกัน ถ้ามองข้อมูลในเชิงทรัพย์สิน มันเป็นสิ่งที่มีความ Dynamic สูงมาก ซึ่งนั้นเลยเป็นเหตุผลที่การทำงานด้านการจัดการข้อมูลจะต้องหาเจ้าของข้อมูล มีการบริหารความเสี่ยงในกรณีที่ข้อมูลสูญหาย หรือ ถูกขโมย ลองนึกภาพว่า ถ้าข้อมูลของลูกค้า ข้อมูล Lead ข้อมูลการจัดเก็บคงคลัง หายไป หรือ ถูกขโมยไปจากบริษัท สิ่งนี้้จะมีผลกระทบร้ายแรงแค่ไหน นั้นเลยเป็นเหตุ และ ผล ที่ข้อมูลควรถูกจัดการอย่างระมัดระวัง และ เหมาะสม

อีกข้อที่ควรต้องคิดคือ จริง ๆ แล้วข้อมูลก็มีต้นทุน ไม่ว่าจะเป็นค่าใช้จ่ายการเก็บข้อมูล การโอนถ่ายข้อมูล การพัฒนาเพื่อให้ข้อมูลมีคุณภาพ และ ประสิทธิภาพมากขึ้น ถ้านึกภาพไม่ออก ก็ลองคิดว่าถ้าใช้ S3 / Google Cloud Storage ส่งข้อมูลแบบ Real-time ไปยังหน้า Web app ค่าใช้จ่ายที่ถูกคิด ก็จะถูกคิดตั้งแต่ ที่เก็บข้อมูล bandwidth ในการโอนถ่ายข้อมูล จนไปถึงการแสดงข้อมูลบน web app ที่ต้องมีการออกแบบ ให้เหมาะสมกับผู้ใช้งาน

การเก็บข้อมูลที่ดี จะช่วยให้เราสามารถประเมินมูลค่าของข้อมูล ว่าข้อมูลแบบไหนที่มีมูลค่ามาก หรือ น้อย เพื่อที่เราจะได้จัดการอย่างเหมาะสม เพราะถ้าเราจัดการไม่ได้ หรือวางแผนการเก็บข้อมูลที่ไม่มีคุณภาพมา ก็เหมือนเราเก็บขยะเอาไว้

2. ความต้องการในการจัดการข้อมูล คือ ความต้องการทางธุรกิจ Data Management Requirements are Business Requirements •

การจัดการข้อมูลนั้นรวมไปถึง การจัดการคุณภาพข้อมูล Metadata (ชุดข้อมูลที่อธิบายข้อมูล) ต้องมีการวางแผน และต้องขับเคลื่อนการตัดสินใจในด้านเทคโนโลยีสารสนเทศด้วยเช่นกัน

อย่างที่กล่าวไว้ในข้อแรกว่า ถ้าเราเก็บข้อมูลที่ไม่มีคุณภาพมา ก็เหมือนเราเก็บขยะ และ สิ่งที่ออกมาก็เป็นขยะ (garbage in, garbage out) จริง ๆ หลายคนอาจจะไม่ได้คิดว่า การเก็บข้อมูลขยะจะส่งผลกระทบแค่ไหน แต่ถ้าอ้างอิงจาก HBR ในเดือน ก.ย. 2016 จะพบว่าใน US ค่าใช้จ่ายสำหรับข้อมูลคุณภาพต่ำสูงถึง 3.1 ล้านล้านดอลล่าร์สหรัฐ (ถ้าประเทศไทย ประมาณ 1000 ล้านล้านบาท) ค่าใช้จ่ายพวกนี้เป็นค่าใช้จ่ายแฝง ซึ่งสามารถเกิดได้หลายสาเหตุ ไม่ว่าจะเป็นการบริหารจัดการในองค์กร การทำงานซ้ำซาก กระบวนการงานที่ช้า

การจัดการคุณภาพข้อมูลที่ดี ก็จะทำให้เราสามารถหา Insight ได้แม่นย้ำขึ้น ซึ่งต้องแลกมาด้วยการวางแผนที่ดี ไม่ว่าจะเป็นการออกแบบ Business process ควบคู่กับ data process การสร้าง System + data Architecture ที่สามารถรู้ว่าข้อมูลถูกสร้างที่จุดไหน

นอกจากนี้การออกแบบชุดข้อมูลที่ใช้ในการอธิบายข้อมูล (Metadata) เป็นสิ่งที่จะช่วยได้มาก ๆ เพราะการที่มีการอธิบายข้อมูลนั้น ๆ จะทำให้คนที่ทำงานเข้าใจความหมายของข้อมูลนั้น ๆ ได้ไว ซึ่งความท้าทายคือ คนมักจะเลยการทำ metadata ซึ่งจริง ๆ แล้วควรจะเป็นสิ่งแรกที่ควรจะทำเพื่อเพิ่มประสิทธิภาพในการจัดการข้อมูล

3. การจัดการข้อมูลขึ้นอยู่กับทักษะที่หลากหลาย Data Management depends on diverse skills

คนที่เก่งด้าน IT ไม่ใช่คนกลุ่มเดียวที่จะแบกการจัดการข้อมูลเพียงฝ่ายเดียวแต่ต้องเป็นการรวมมือจากหลากหลายทีม เพราะว่าการจัดการข้อมูลนั้นซับซ้อน และ ใช้ทักษะที่หลากหลายมาก ๆ เพราะฉะนั้นการทำงานเป็นทีมจริงสำคัญ

การจัดการข้อมูลต้องมีมุมมองขององค์กรมาด้วย เพราะเราต้องเข้าใจทั้งขอบเขต และ ฐานข้อมูลในองค์กร สามารถไปได้ทั้งองค์กร ไม่ว่าจะเป็นทีม Sale, Marketing หรือ operations การที่มีมุมมองขององค์กรข้อดีคือเราจะสามารถจัดการได้ว่าด้วยข้อมูลลักษณะเดียวกัน ควรแสดง และ วัดผลในรูปแบบไหน ลองนึกภาพว่า ทีม Sale + Marketing ใช้ข้อมูลชุดเดียวกัน แต่การวัดผลก็ต่างกันแล้ว Sale ต้องการดูยอดขายที่ได้ แต่ Marketing อาจจะดูว่า Conversion Rate จากสิ่งที่ได้ทำโฆษณาไป นั้นได้กลับมากี่ % นี่เป็นเป็นสิ่งที่ Data Governance ถูกหยิบมาใช้

นอกจากนี้การจัดการข้อมูลต้องอย่าลืมฝ่ายใด ฝ่ายนึง เพราะจริง ๆ แล้วเวลาที่เกิดอะไรขึ้น เราจะต้องรับผิดชอบรวมกัน การที่เรารวมทุกฝ่ายเข้าด้วยกัน ข้อดีอย่างนึงคือ เราจะสามารถจัดการวงจรชีวิตของข้อมูล รวมไปถึงสามารถป้องกันความเสี่ยงต่าง ๆ ที่อาจจะเกิดจากการใช้ข้อมูลที่ผิด

4. การจัดการข้อมูลคือการจัดการวงจรชีวิต Data Management is lifecycle management

Data Lifecycle Key activities (DATA MANAGEMENT BODY OF KNOWLEDGE SECOND EDITION)

วางแผน -> สร้าง -> ควบคุมคุณภาพ -> สร้างมาตรฐานความปลอดภัย

การวางแผน ทำให้เกิดการสร้าง หรือ ใช้ข้อมูลที่ดี สิ่งนี้คือจุดสำคัญ การควบคุมคุณภาพทำให้เราเลือกข้อมูลที่มีมูลค่าได้ การสร้าง Metadata ก็จะช่วยควบคุมมาตรฐานของข้อมูล รวมไปถึงการจัดการความเสี่ยงไม่ว่าจะเป็นความปลอดภัยของข้อมูล ไม่ว่าจะเป็นการสร้าง หรือ การลบข้อมูลล้วนจะต้องไปรับการดูแลในเรื่องของความปลอดภัยทั้งนั้น เพราะไม่งั้น การที่ข้อมูลที่เราลบไปแล้วหลุด ก็สามารถสร้างความเสียหายอันใหญ่หลวงได้เช่นกัน

จากที่กล่าวข้างต้นมานี่เป็นแค่ส่วนแรก ของบทที่ 1 Data Managementเท่านั้น ยังมีเรื่องของ Data Management Strategy, Data Management Framework, DMBOK Pyramid, DAMA Data Management Framework Evolved อีก ซึ่งสิ่งเหล่านี้จะช่วยให้เรามีมุมมองที่มองรอบมากขึ้นเกี่ยวกับ Data อย่างที่บอกไว้ว่าการจัดการข้อมูลไม่ใช่การเก็บข้อมูลทั้งนั้น แต่เป็นการเข้าใจวงจรชีวิต และ การทำให้เข้ากับธุรกิจได้เช่นกัน

--

--

Chayanis Tuntearapong
Data Teller

Data Scientist who working in financial industry | Data consulting | Learner | Worshiper | seeking in Life-long Learning |Pet-lover