นิทานเรื่อง big data กับหนังสือในห้องสมุด

สมศรีเป็นคนชอบอ่านหนังสือ เธอเริ่มสะสมหนังสือทีละเล่มจนเต็มชั้นวาง หนังสือเหล่านี้เธอสามารถหยิบมาเปิดดูเมื่อไหร่ก็ได้ จะบอกว่าเธอเคยอ่านหนังสือทุกเล่มบนนั้นก็ไม่ผิด เมื่อมีใครถามเกี่ยวกับเนื้อหาในหนังสือเหล่านั้น เธอตอบได้แทบจะทันที เพื่อนๆจึงชอบถามสมศรีเมื่อมีคำถาม

เมื่อเวลาผ่านไป เธอก็มีหนังสือมากขึ้น จากชั้นหนังสือชั้นเดียว เธอก็ได้ขยายเป็นห้องสมุด เธอไม่สามารถอ่านหนังสือได้ครบทุกเล่มอีกต่อไปแล้ว คนที่มาถามเธอเกี่ยวกับความรู้ในหนังสือก็เพิ่มขึ้น ไม่ว่าจะเป็นเพื่อน ชมรมหนังสือ ฯลฯ สมศรีจึงเริ่มจ้างพนักงานมาช่วยดูแลหนังสือของเธอ มีระบบการจัดเก็บหนังสือบนชั้นแบ่งหมวดหมู่ ทำให้พอรู้คร่าวๆว่าอะไรอยู่ตรงไหน เมื่อได้รับคำถาม สมศรีสามารถสั่งพนักงานให้หาหนังสือที่เกี่ยวข้องมาวางบนโต๊ะเธอ แล้วเธอก็หาคำตอบได้ภายใน 1 ชั่วโมง แม้จะใช้เวลามากกว่าเดิมในการหาคำตอบ แต่สมศรีก็ตอบคำถามได้หลากหลายกว่าเดิม

ความสามารถในการตอบคำถามของสมศรีได้รับความนิยมอย่างเหลือล้น จึงมีคนบริจาคหนังสือมากมายให้สมศรีเพื่อเพิ่มความรู้ให้กับเธอ เธอเปิดโกดังเพื่อเก็บหนังสืออีกกว่า 100 สาขาทั่วประเทศ ถึงจุดนี้ นอกจากไม่มีทางอ่านหนังสือได้ครบทุกเล่มแล้ว สมศรียังไม่รู้ว่าเธอมีหนังสืออะไรอยู่บ้าง เล่มไหนอยู่สาขาไหนก็ไม่รู้ การจัดแบ่งเป็นหมวดหมู่ในแต่ละสาขาก็ทำได้ลำบากเพราะคนขยันมาบริจาคมากจนจัดหนังสือไม่ทัน

พอมีคนมาถามคำถาม สมศรีต้องโทรหาผู้ช่วยที่จะแจ้งไปยังสาขาทั้ง 100 อีกทีให้ช่วยหาสิ่งที่เกี่ยวข้องกับคำถามแล้วส่งมาที่บ้านสมศรี เธออาศัยประสบการณ์ในการค้นหาหนังสือในห้องสมุดเธอเพื่อสั่งพนักงานว่าดูอย่างไรว่าหนังสือเล่มนั้นเกี่ยวกับสิ่งที่ต้องการ พนักงานจำนวนมากในแต่ละสาขาก็จะไล่อ่านหนังสือทุกเล่ม เพื่อหาสิ่งที่เกี่ยวข้องตามที่สมศรีบอก แต่จะส่งหนังสือที่เกี่ยวข้องมาทุกเล่มก็อาจจะวางในบ้านสมศรีไม่พอ จึงถ่ายเอกสารมาเฉพาะหน้าที่น่าสนใจ กว่าเอกสารเหล่านี้จะมาถึงสมศรีก็ใช้เวลาเป็นวัน

ที่สนุกไปกว่านั้น อย่าลืมว่าสมศรีก็พลาดได้ บางทีพนักงานก็ตอบกลับมาว่า ไม่เห็นเจออะไรที่เกี่ยวข้องเลย สมศรีจึงต้องเปลี่ยนคำสั่งแล้วโทรหาผู้ช่วยใหม่ หรือบางทีสั่งละเอียดไป ได้หนังสือมาไม่กี่เล่ม ก็ต้องโทรไปสั่งใหม่ กระบวนการเหล่านี้ปวดหัวกว่าสมัยก่อนที่สมศรีมีหนังสือเพียงชั้นเดียวมากมาย แต่สมศรีในวันนี้ก็สามารถตอบคำถามได้แทบจะครอบจักรวาลเลยทีเดียว ถ้าคนถามยินดีรอนานหน่อย

สมศรีเริ่มเห็นว่าคำถามบางอย่างมีคนถามซ้ำๆทุกวัน สมศรีจึงแบ่งพนักงานส่วนหนึ่งให้เตรียมคำตอบสำหรับคำถามเหล่านั้น แล้วส่งรายงานให้เธอทุกเช้า จะได้ตอบได้เร็วขึ้น ทำไปทำมารายงานก็เยอะจนเธอต้องสร้างห้องสมุดสำหรับเก็บรายงานอีกที

บางทีเหนื่อยมากๆสมศรีก็อยากจะกลับไปมีหนังสือน้อยกว่านี้ จะได้ไม่ต้องใช้วิธีที่วุ่นวายขนาดนี้

สมนึกเห็นสมศรีโด่งดัง สามารถตอบคำถามได้มากมาย ก็อยากจะเลียนแบบมาทำกับบริษัทตัวเองบ้าง สมนึกทึกทักเอาเองว่าที่สมศรีตอบคำถามจากหนังสือได้ดีขนาดนี้เพราะว่าสมศรีมีพนักงานนับพัน และโกดังจำนวนมาก ตามที่หนังสือพิมพ์ชอบลงข่าวบ่อยๆ สมนึกจึงเริ่มสร้างโกดัง 10 แห่งทั่วประเทศทันที แล้วคิดว่าจะใช้ขั้นตอนแบบเดียวกันในการโทรแจ้งทั้งสิบสาขาเพื่อหาหนังสือ สมนึกภูมิใจกับแผนนี้มาก และคุยไปทั่วว่าบริษัทของเขาจะใช้ระบบโกดังใหญ่เหมือนสมศรีเลย

เมื่อลงมือทำจริงๆ สมนึกเพิ่งพบว่าบริษัทตัวเองมีหนังสือน้อยมาก (จริงๆใส่ในห้องเดียวก็หมด) แต่กลายเป็นว่าหนังสือจำนวนน้อยนั้นกระจายไปสิบแห่งทั่วประเทศ และแทนที่จะเดินไปหยิบได้ สมนึกต้องโทรแจ้งผู้ช่วยที่จะโทรไปหาทั้งสิบสาขาเพื่อสั่งงาน และต้องรอหนึ่งวันเหมือนสมศรีกว่าจะได้หนังสือ ทั้งที่สมนึกมีหนังสือน้อยกว่ามาก


ข้อมูลมากก็เหมือนมีความรู้มาก แต่ก็อาจเกิดอาการความรู้ท่วมหัวเอาตัวไม่รอดเหมือนกัน เพราะหาไม่เจอ เอาออกมาใช้ไม่ได้ ยิ่งข้อมูลปริมาณมากก็มีข้อจำกัดของเทคโนโลยีที่ใช้ได้มากขึ้น

ชั้นหนังสือของสมศรีก็เหมือนข้อมูลขนาดเล็ก เช่น ไฟล์ excel ที่เราสามารถมองเห็นได้แทบทุกอย่าง จะทำอะไรก็ทำได้ทันที

ห้องสมุดของสมศรีก็เหมือนฐานข้อมูล (database) ที่มีการจัดเก็บให้หาได้ง่าย แต่ก็เพิ่มขั้นตอนในการใช้งาน ดูแล และใช้เวลามากขึ้น

ระบบโกดังของสมศรีก็เหมือนเทคโนโลยีสำหรับ big data เช่น Hadoop ที่ใหญ่เกินจะมองเห็น และไม่สามารถใช้ฐานข้อมูลหรือจัดเก็บอย่างเป็นระบบ การหาข้อมูลอะไรซักอย่างจาก big data เน้นความถึกเป็นหลัก ใช้เครื่องเป็นพันๆเครื่องไล่อ่านข้อมูลเพื่อหาสิ่งที่เราต้องการ แต่เครื่องเหล่านี้ก็ค่อนข้างปัญญาน้อย เราต้องบอกขั้นตอนการหาให้ละเอียด ต้องอดทนรอ บางทีก็หาถูกบ้าง ผิดบ้างถ้าสั่งไม่ดีพอ

สมนึกเป็นตัวแทนของคนที่อยากใช้เทคโนโลยีสำหรับ big data เพราะอยากจะ ได้ชื่อว่าใช้ big data กับเขาบ้าง ทั้งที่มีทางเลือกอื่นที่เหมาะสมกว่า

ที่สมศรีต้องใช้ระบบโกดังใหญ่เพราะสถานการณ์บังคับ และเป็นทางเลือกที่ดีที่สุดสำหรับข้อมูลจำนวนมากขนาดนั้น ในขณะที่สมนึกเข้าใจผิดว่าการใช้เทคโนโลยีสำหรับ big data คือสิ่งอันน่าปรารถนา และสร้างความลำบากในการเข้าถึงข้อมูลโดยไม่จำเป็น

ทั้งสมนึกและสมศรีความจริงแล้วมีเป้าหมายเดียวกันคืออยากใช้ข้อมูลให้เกิดประโยชน์ องค์กรชั้นนำหลายแห่งมีวัฒนธรรมในการใช้ข้อมูลประกอบการตัดสินใจ (data-driven culture) อันนี้คือสิ่งที่สำคัญซึ่งควรสนับสนุนและน่าภาคภูมิใจกว่าการบอกว่าได้ใช้ big data หรือไม่ ข้อมูลจะเล็กใหญ่ก็นำไปสร้างประโยชน์ได้ ถ้าให้ความสำคัญ ถ้าสมนึกเข้าใจตรงนี้ เขาอาจจะไม่ต้องเสียเงินสร้างโกดังฟรีก็ได้