Data 101 : Data Lake Vs Big Data ความเหมือนที่แตกต่าง

Chayanis Tuntearapong
Data Teller
Published in
May 20, 2024

คำว่า “Big Data” หรือคำว่า “Data Lake” อาจจะเป็น Buzz word ที่เคยได้ยินกันมาบ้าง ไม่ว่าจะเป็นในแวดวง Start up / Enterprise ในอุตสาหกรรมต่าง ๆ ไม่ว่าจะเป็น การเงิน ประกัน หรือแม้กระทั่งห้างสรรพสินค้าที่เราซื้อของกันทุกวัน ก็ล้วนมีสองสิ่งนี้เป็นองค์ประกอบหลัก

จริง ๆ คำว่า “Big Data” และ “Data Lake” ก็มีความเหมือนกันในหลาย ๆ อย่าง ไม่ว่าจะเป็น การเก็บชุดข้อมูลที่มีขนาดใหญ่ หรือ มีข้อมูลที่หลากหลาย แต่จริง ๆ ทั้งสองอย่างนี้มีความแตกต่างกันในแนวคิดบางอย่าง เรามาดูกันว่า ทั้งสองสิ่งนี้มีความเหมือนที่แตกต่างกันอย่างไร

ข้อมูลขนาดใหญ่เหมือนกัน แต่มุมมองต่างกัน

จริง ๆ แล้วทั้ง Big Data และ Data Lake ต่างกันที่วิธีมอง Big Data นั้นเป็นการพูดถึงชุดข้อมูลขนาดใหญ่ (ซึ่งเราอาจจะคุ้นเคยดีกับคำว่า 5V) แต่ Data Lake จะกล่าวถึงแหล่งเก็บข้อมูล ซึ่งก็คือการเก็บข้อมูลดิบ (Raw Data) เพื่อนำไปใช้ต่อนั้นเอง ซึ่งถ้าดูองค์ประกอบโดยรวมของขจากรูปภาพด้านล่าง จะเห็นได้ชัดเลยว่ามีมุมมองที่แตกต่างกัน ถ้าจะให้พูดโดยไม่สับสนก็คือ ถ้าพูดถึงลักษณะข้อมูล ให้ใช้คำว่า “Big Data” แต่ถ้าพูดถึงกระบวนการการจัดเก็บข้อมูลขนาดใหญ่ รวมไปถึงการจัดการ และ ตรวจสอบคุณภาพ “Data Lake” จะครอบคลุมกว่านั้นเอง

Key Concept ของ Big Data และ Data Lake

สรุป

จริง ๆ แล้วถ้าอยากจะเริ่มต้นเรียนรู้เรื่องของการบริหารจัดการข้อมูลแบบคลอบคลุม และต้องการจะเข้าใจกระบวนการในการจัดเก็บ และ บริหารข้อมูล การเริ่มไปถึง Data Lake ก็จะช่วยให้เราไปในเรื่องที่ลึกขึ้น ส่วน Big Data ก็จะทำให้เราเข้าใจในลักษณะข้อมูลมากขึ้น Tools ที่ใช้ของทั้งสองก็เหมือนกัน แต่ก็อย่างที่บอกไว้ มันก็อาจจะแตกต่างที่วิธีมองไปเท่านั้นเอง

สำหรับใครที่ต้องการติดตามข่าวสารเพิ่มเติมนอกจากที่ Medium แล้ว สามารถไปที่ https://www.facebook.com/datatellerth/ ซึ่งเป็นช่องทางหลักของ Data Teller ได้เช่นกัน อย่าลืมไปติดตามกันนะจ๊ะ

--

--

Chayanis Tuntearapong
Data Teller

Data Scientist who working in financial industry | Data consulting | Learner | Worshiper | seeking in Life-long Learning |Pet-lover