Data 101 : Data Lake Vs Big Data ความเหมือนที่แตกต่าง
คำว่า “Big Data” หรือคำว่า “Data Lake” อาจจะเป็น Buzz word ที่เคยได้ยินกันมาบ้าง ไม่ว่าจะเป็นในแวดวง Start up / Enterprise ในอุตสาหกรรมต่าง ๆ ไม่ว่าจะเป็น การเงิน ประกัน หรือแม้กระทั่งห้างสรรพสินค้าที่เราซื้อของกันทุกวัน ก็ล้วนมีสองสิ่งนี้เป็นองค์ประกอบหลัก
จริง ๆ คำว่า “Big Data” และ “Data Lake” ก็มีความเหมือนกันในหลาย ๆ อย่าง ไม่ว่าจะเป็น การเก็บชุดข้อมูลที่มีขนาดใหญ่ หรือ มีข้อมูลที่หลากหลาย แต่จริง ๆ ทั้งสองอย่างนี้มีความแตกต่างกันในแนวคิดบางอย่าง เรามาดูกันว่า ทั้งสองสิ่งนี้มีความเหมือนที่แตกต่างกันอย่างไร
ข้อมูลขนาดใหญ่เหมือนกัน แต่มุมมองต่างกัน
จริง ๆ แล้วทั้ง Big Data และ Data Lake ต่างกันที่วิธีมอง Big Data นั้นเป็นการพูดถึงชุดข้อมูลขนาดใหญ่ (ซึ่งเราอาจจะคุ้นเคยดีกับคำว่า 5V) แต่ Data Lake จะกล่าวถึงแหล่งเก็บข้อมูล ซึ่งก็คือการเก็บข้อมูลดิบ (Raw Data) เพื่อนำไปใช้ต่อนั้นเอง ซึ่งถ้าดูองค์ประกอบโดยรวมของขจากรูปภาพด้านล่าง จะเห็นได้ชัดเลยว่ามีมุมมองที่แตกต่างกัน ถ้าจะให้พูดโดยไม่สับสนก็คือ ถ้าพูดถึงลักษณะข้อมูล ให้ใช้คำว่า “Big Data” แต่ถ้าพูดถึงกระบวนการการจัดเก็บข้อมูลขนาดใหญ่ รวมไปถึงการจัดการ และ ตรวจสอบคุณภาพ “Data Lake” จะครอบคลุมกว่านั้นเอง
สรุป
จริง ๆ แล้วถ้าอยากจะเริ่มต้นเรียนรู้เรื่องของการบริหารจัดการข้อมูลแบบคลอบคลุม และต้องการจะเข้าใจกระบวนการในการจัดเก็บ และ บริหารข้อมูล การเริ่มไปถึง Data Lake ก็จะช่วยให้เราไปในเรื่องที่ลึกขึ้น ส่วน Big Data ก็จะทำให้เราเข้าใจในลักษณะข้อมูลมากขึ้น Tools ที่ใช้ของทั้งสองก็เหมือนกัน แต่ก็อย่างที่บอกไว้ มันก็อาจจะแตกต่างที่วิธีมองไปเท่านั้นเอง
สำหรับใครที่ต้องการติดตามข่าวสารเพิ่มเติมนอกจากที่ Medium แล้ว สามารถไปที่ https://www.facebook.com/datatellerth/ ซึ่งเป็นช่องทางหลักของ Data Teller ได้เช่นกัน อย่าลืมไปติดตามกันนะจ๊ะ