Data Warehouse และ Database ต่างกันอย่างไร

Ingram Micro Thailand
Ingram Micro Thailand
2 min readSep 19, 2018

ทุกวันนี้เรามักจะได้ยินหลายๆ คนพูดถึง Data Warehouse กันบ่อยครั้งมาก จนทำให้เราเกิดความสงสัยว่า อะไรคือ Data Warehouse กันแน่ และเจ้าสิ่งนี้ถูกสร้างขึ้นมาเพื่อประโยชน์อะไรกัน ผมคิดว่าไม่ใช่เรื่องที่แปลกอะไรที่หลายๆ ท่านมีคำถามลักษณะนี้ ในเมื่อเทคโนโลยีนี้มีถูกนำไปใช้งานอย่างแพร่หลายในเชิงธุรกิจ นับว่าเป็นสิ่งที่ร้อนแรงมากๆ ในปัจจุบัน

Data Warehouse จะเป็นการพูดถึงเรื่องการเก็บรวบรวมข้อมูลเพื่อนำไปใช้ในการวิเคราะห์สำหรับพยากรณ์สิ่งที่จะเกิดขึ้นในอนาคต แน่นอนถ้าจะใช้ศัพท์ที่เป็นทางการสิ่งนี้ก็คืองานด้าน Analytic และ Business Intelligence นั่นเอง การที่จะทำการพยากรณ์ หรือคาดการณ์ สิ่งที่จะเกิดขึ้นในอนาคตได้นั้นเราจะต้องมีข้อมูลปริมาณที่มากพอเพื่อให้ได้ผลลัพธ์ที่ถูกต้องที่สุด มาถึงตรงนี้แล้วหลายคนคงจะพอเดาได้ว่า Data Warehouse คืออะไร ถ้าจะนิยามกันให้เข้าใจง่ายๆก็คือ คลังสำหรับเก็บข้อมูลที่รวบรวมข้อมูลจาก Database หรือ ฐานข้อมูลต่างๆ ในองค์กร เพื่อนำข้อมูลเหล่านั้นมาใช้ในการวิเคราะห์ ใช้ประโยขน์ในเชิงธุรกิจ อาทิเช่น ระบบ Decision Support System หนึ่งในตัวอย่างที่ประสบความสำเร็จอย่างมากในการนำเอา Data Warehouse มาใช้งานคือกลุ่มของธุรกิจค้าปลีก ซึ่งระบบจะรวบรวมข้อมูลที่ต้องการออกมาจากเครื่อง POS (Point-of-Sales) หรือเครื่องเก็บเงิน จากนั้นนำเอาข้อมูลหล่านั้นมาวิเคราะห์เพื่อสร้างและทดสอบโปรโมชั่นที่จะจัดทำขึ้น โดยการวิเคราะห์จากพฤติกรรมของผู้บริโภคทำให้โปรโมชั่นที่ออกมาตรงกับความต้องการของตลาดมากที่สุด นับว่าเป็นเครื่องมือสำหรับช่วยในการวางแผนด้านการตลาดที่ดีเลยทีเดียว

ความแตกต่างระหว่าง Database และ Data Warehouse

สิ่งที่เห็นได้ชัด คือ ขนาดและความหลากหลายของข้อมูล Database จะพูดถึงข้อมูลที่เป็น real-time ค่อนข้างเฉพาะเจาะจงไม่ได้มีความหลากหลายของข้อมูลเหมือนกับ Data Warehouse แม้ว่าเราจะสามารถใช้ข้อมูลจาก Single Database สำหรับการคำนวณ การวิเคราะห์ได้ แต่เนื่องจากข้อมูลที่เก็บไม่มีความหลากหลาย และมีข้อจำกัดในเรื่องของขนาด ทำให้การวิเคราะห์ในรูปแบบนี้ไม่ได้เป็นสิ่งที่นำมาใช้ประโยชน์อะไรได้มากนักนอกจากการคำนวณง่ายๆ การวิเคราะห์อะไรที่ไม่ซับซ้อนนัก

ในส่วนของ Data Warehouse กลับกันข้อมูลจะไม่ได้เป็นแบบ real-time แต่จะเป็นข้อมูลในแต่ละช่วงเวลา (Historical) และไม่ได้มีการ update เท่ากับ Database แต่มีความหลากหลายของข้อมูลมาก เพราะ Data Warehouse จะเก็บข้อมูลจาก Source หรือแหล่งที่มาจำนวนมาก ซึ่งเรียกได้ว่าเป็นลักษณะเฉพาะของ Big Data คือ Volume — Velocity — Variety (ปริมาณ ความเร็วของข้อมูล ความหลากหลาย)

เมื่อมีข้อมูลที่หลากหลายคุณภาพของข้อมูล ความถูกต้องของข้อมูลเป็นเรื่องสำคัญกระบวนการนำข้อมูลจาก Database เข้า Data Warehouse อาจต้องมีการปรับโครงสร้างข้อมูล การเพิ่ม/ลด field เพื่อให้ได้เนื้อหาที่สอดคล้องกัน การคัดข้อมูลเก่าที่ไม่เกี่ยวข้องที่ไม่จำเป็นออก เพื่อให้ได้มาซึ่งข้อมูลที่มีคุณภาพเป็นเรื่องที่สำคัญ โดยทั่วไปขึ้นอยู่กับ Tools ของ Data Warehouse แต่ละค่าย

ส่วนงานของการวิเคราะห์ (Analytic)

เมื่อเรามีข้อมูลที่ถูกจัดเก็บอยู่ใน Data Warehouse ซึ่งเป็นถังข้อมูลที่มีขนาดใหญ่เพียงพอในการเก็บข้อมูลปริมาณมหาศาลแล้ว สิ่งต่อมาคือกระบวนการประมวลผลเพื่อวิเคราะห์ข้อมูล ผู้ที่รับหน้าที่ในส่วนนี้ คือ Data Scientist ซึ่งพวกเขาจะเป็นกลุ่มคนที่ทำงานกับข้อมูลจำนวนมหาศาล ทำการวิเคราะห์ประมวลผลเพื่อให้ได้มาซึ่ง Information ที่ตกผลึกสามารถใช้ในการช่วยตัดสินใจในเชิงธุรกิจในแง่มุมต่างๆ การประมวลผลนั้นมีความจำเป็นต้องใช้ความเร็วสูงซึ่งการใช้ Magnetic Disk คงไม่เพียงพอกับการทำงานกับข้อมูลจำนวนมาก และต้องการความเร็วในการประมวลผลข้อมูลด้วยหลักทงาคณิตศาสตร์ที่ซับซ้อน การนำเอา In-Memory เข้ามาใช้ก็เพื่อเป็นการหลีกเลี่ยงการสูญเสียเวลาไปกับการ รับ/ส่ง ข้อมูลระหว่างการประมวลผล (I/O) ดังนั้น เราจึงเห็นการประมวลผลแบบ In-Memory ถูกนำมาใช้ใน Hadoop และ Data Warehouse Platform อย่างแพร่หลาย

สิ่งที่อยู่ใน Data Warehouse จะมีทั้งที่เป็น Structured Data และ Unstructured Data ซึ่งก็เรียกได้ว่ามีความซับซ้อนขึ้นไปอีกในการวิเคราะห์ข้อมูลจากข้อมูลที่มีความหลากหลาย Data Warehouse Platform จึงเป็น Platform ที่ถูกออกแบบมาใช้งานเฉพาะทาง และจะต้องรองรับการเติบโตของข้อมูลในอนาคตได้ ทั้งในรูปแบบของ Scale-Up และ Scale-Out จะเห็นได้ว่า ความแตกต่างระหว่าง Database และ Data Warehouse มีความชัดเจนมากทั้งในเรื่องของลักษณะการใช้งาน และปริมาณของข้อมูล ทุกวันนี้กระแสของการนำเอา Data Analytic มาประยุกต์ใช้ในเชิงธุรกิจอย่างแพร่หลาย โดยหลายๆ องค์กรนำมาใช้เพื่อรพยากรณ์เหตุการณ์ หรือ แนวโน้มต่างๆ ที่เป็นประโยชน์ต่อธุรกิจของตน Platform ของ Data Warehouse Platform และ Analytic Platform มีหลากหลายทั้งแบบ On-Premise คือการมีระบบเป็นของตนเอง หรือ Cloud Platform ให้เลือกใช้ตามความเหมาะสมของรูปแบบธุรกิจของแต่ละองค์กร สำหรับผู้ที่ต้องการปรึกษาเรื่องเทคโนโลยีในด้านต่างๆ ในโลก IT

สามารถติดต่อขอคำปรึกษาได้ที่ บริษัท อินแกรม ไมโคร (ประเทศไทย) หรือ สามารถติดต่อเพื่อขอเข้าเยี่ยมชมศูนย์ Solution Center ทางทีมงานพร้อมที่จะให้บริการ

Ingram Micro Solution Center
TH-ProServices@ingrammicro.com
02–012–2265

พรสิทธิ์ ปาลิไลยก์
Pornsit Palilai

Technical Service Manager — Security Consultant
Ingram Micro (Thailand)

--

--