ความเป็นมาของวิทยาการข้อมูล

Wimon Ut
2 min readMar 6, 2023

--

ในโลกของการสื่อสารยุคดิจิทัลที่มีการแลกเปลี่ยนข้อมูลจำนวนมากผ่านสื่อดิจิทัลที่หลากหลาย ข้อมูลเหล่านี้อยู่ในรูปแบบทั้งเป็น ข้อความ รูปภาพ เสียง วีดิทัศน์ และ อื่น ๆ รวมทั้งเป็นข้อมูลในรูปแบบที่มีโครงสร้าง ไม่มีโครงสร้าง หรือกึ่งโครงสร้าง จากภาพแสดงจำนวนข้อมูลทั้งหมดที่ถูกสร้าง บันทึก คัดลอก และใช้งานทั่วโลก โดยในปี 2022 ข้อมูลเหล่านี้เพิ่มขึ้นอย่างรวดเร็วถึง 97 เซ็ตตะไบต์ (zettabytes) ซึ่งคาดการณ์ได้ว่าปี 2025 การสร้างข้อมูลทั่วโลกมีแนวโน้มเพิ่มขึ้นมากกว่า 180 เซ็ตตะไบต์ หรือ 180x1021 ไบต์

ที่มา: https://www.statista.com/statistics/871513/worldwide-data-created/
ที่มา: https://www.ionos.com/digitalguide/websites/web-development/what-is-a-byte/

ปริมาณแหล่งข้อมูลที่เพิ่มขึ้นอย่างรวดเร็ว ข้อมูลที่มีขนาดใหญ่ขึ้นและมีความซับซ้อนมากขึ้น จึงทำให้ต้องมีวิธีการหรือวิทยาการในการจัดการข้อมูล รวมถึงต้องใช้ผู้เชี่ยวชาญด้านวิทยาการข้อมูลในการจัดการข้อมูลดังกล่าว เพื่อจัดการข้อมูลที่มีความสำคัญต่อองค์กร และผู้ใช้งานแอพพลิเคชันขององค์กร ทำให้วิทยาการข้อมูลเป็นหนึ่งในสาขาที่เติบโตเร็วที่สุดในทุกอุตสาหกรรม

วิทยาการข้อมูล เป็นกระบวนการที่ต้องอาศัยความรู้ในด้านต่าง ๆ ได้แก่ คณิตศาสตร์และสถิติ (math and statistics) วิธีการทางวิทยาศาสตร์ (scientific methods) ขั้นตอนวิธี (algorithms) การเขียนโปรแกรมเฉพาะทาง (specialized programming) การวิเคราะห์ขั้นสูง (advanced analytics) ปัญญาประดิษฐ์ (Artificial Intelligent) และการเรียนรู้ของเครื่อง (machine learning) โดยใช้ความเชี่ยวชาญเฉพาะด้านดังกล่าว ในการวิเคราะห์ข้อมูลเชิงลึกหลากหลายรูปแบบ และมีปริมาณมากมายจากหลายแหล่งข้อมูล เพื่อนำข้อมูลเชิงลึกเหล่านี้ไปใช้เป็นองค์ความรู้ หรือแนวทางในการตัดสินใจ การวางแผนเชิงกลยุทธ์ขององค์กร

เป้าหมายที่สำคัญของงานด้านวิทยาการข้อมูล คือ การแก้ปัญหาทางด้านข้อมูลที่ซับซ้อนด้วยเทคนิคการจัดการข้อมูล และนำไปประยุกต์ใช้ในด้านต่าง ๆ ดังนี้

(1) การธนาคาร (banking) โดยวิเคราะห์ข้อมูลเพื่อใช้ในการตรวจสอบการฉ้อโกง (fraud detection) การสร้างแบบจำลองความเสี่ยงด้านเครดิต (credit risk modeling) และการคำนวณมูลค่าที่ลูกค้าใช้จ่ายกับสินค้าหรือบริการตลอดอายุการใช้งานของลูกค้า (customer lifetime value)

(2) การเงิน (finance) วิเคราะห์ข้อมูลเพื่อการแบ่งกลุ่มลูกค้า (customer segmentation) การวิเคราะห์ความเสี่ยง (risk analysis) และการศึกษาขั้นตอนวิธีการซื้อขายด้านการเงิน (algorithmic trading)

(3) การดูแลสุขภาพ (health care) เช่น การวิเคราะห์ภาพทางการแพทย์ (medical image analysis) การค้นคว้าด้านยารักษาโรค (drug discovery) ชีวสารสนเทศ (bio-informatics) ซึ่งเป็นศาสตร์ในการเรียนรู้ด้านวิทยาศาสตร์ชีวภาพ

(4) การเพิ่มประสิทธิภาพการผลิต (manufacturing optimization) วิเคราะห์ข้อมูลเพื่อการคาดการณ์ความล้มเหลว (failure prediction) ที่อาจเกิดขึ้นในอนาคต การจัดตารางการบำรุงรักษาในกระบวนการผลิต (maintenance scheduling) หรือการตรวจจับความผิดปกติ (anomaly detection) ในการผลิต

(5) พาณิชย์อิเล็กทรอนิกส์ (e-commerce) นำข้อมูลที่วิเคราะห์ได้ไหใช้ในการโฆษณาให้ตรงกับกลุ่มเป้าหมาย (targeted advertising) การแนะนำผลิตภัณฑ์ (product recommendation) รวมทั้งการวิเคราะห์ความรู้สึก (sentiment analysis) โดยใช้หลายเทคโนโลยีเพื่อกลั่นกรองคำพูดของลูกค้าทั้งหมด และสรุปเป็นข้อมูลทางธุรกิจที่สามารถนำไปใช้ประโยชน์ในธุรกิจต่อได้

(6) การขนส่ง (transportation) วิเคราะห์การเรียนรู้ของเครื่อง (machine learning) สร้างรถยนต์ระบบอัตโนมัติ (self-driving cars) การจัดการห่วงโซ่อุปทาน (supply chain management) และการควบคุมความแออัด (congestion control) เพื่อหลีกเลี่ยงความแออัดหรือการเพิ่มขึ้น/การลดลงแบบทวีคูณ

+++ สาขาที่เกี่ยวข้องกับวิทยาการข้อมูล

เอกสารอ้างอิง

Chuno Wahi. (2023). What is Data Science? Importance Of Data Science, Life Cycle. Retrieved January 30, 2023, from https://collegevidya.com/blog/what-is-data-science/

Petroc Taylor. (2022). Amount of data created, consumed, and stored 2010–2020, with forecasts to 2025. Retrieved Sep 8, 2022, from

https://www.statista.com/statistics/871513/worldwide-data-created/

IBM Staff. (2023). What is Data Science. Retrieved January 30, 2023, from

https://www.ibm.com/th-en/topics/data-science

Inigo Martinez, Elisabeth Vilesbc and Igor G Olaizola. (2021). Data Science Methodologies: Current Challenges and Future Approaches. Big Data Research, Vol. 24, January 2021.

--

--