อยากลองเริ่มทำ Data Story? ชี้เป้าแหล่ง Dataset ให้ไปลองเล่นกัน

Thanisara GG
Punch Up
Published in
3 min readAug 16, 2022

คำถามที่เจอบ่อยๆ คือ “อยากลองทำ Data Story หรือ Data Visualization ควรเริ่มยังไงดี?” คำตอบที่ง่ายแต่จริงคือ ลองเลย! เริ่มลงมือทำ แล้วฝึกฝนอย่างสม่ำเสมอ

ทุกวันนี้ เราสามารถเสิร์ชหาเนื้อหาความรู้และคอร์สออนไลน์เกี่ยวกับ Data Story หรือ Data Visualization ได้มากมาย รวมถึงมีเครื่องมือสำเร็จรูปหลายอย่างที่ช่วยให้เราสร้างงานสร้างโปรเจกต์ของเราขึ้นมาได้

แต่สิ่งที่อาจจะสำคัญไม่แพ้ความรู้และเครื่องมือคือการเริ่มต้นลงมือทำ

Data Story หรือ Data Visualization คืองานที่ ‘ข้อมูล’ เป็นหัวใจสำคัญ ซึ่งอาจไม่ต้องเป็นข้อมูลขนาดใหญ่หรือเป็นประเด็นที่ซีเรียสจริงจัง แต่ Data Story หรือ Data Visualization ที่ดี มักจะต้องมาจาก การตั้งคำถามหรือข้อสังเกตเริ่มต้นที่น่าสนใจ ประกอบกับ การได้มาซึ่งชุดข้อมูลที่มีคุณภาพ ตามมาด้วยการเลือกใช้วิธีนำเสนอและวิธีสื่อสารที่เหมาะสม

ซึ่งทั้งหมดนี้สามารถฝึกฝนได้ โดยอาจเริ่มจากการหยิบชุดข้อมูล (Dataset) เล็กๆ ที่เป็นเรื่องใกล้ตัวที่สนใจ หรือเรื่องที่มีคนรวบรวมเอาไว้อยู่แล้ว และนี่คือตัวอย่างแหล่งข้อมูลเปิด (Open Data) ทั้งของไทยและต่างประเทศ ที่อยากชี้เป้าให้ไปลองดาวน์โหลดมาเล่นกันดู

ศูนย์กลางข้อมูลเปิดภาครัฐ (Open Government Data)

ที่สำนักงานพัฒนารัฐบาลดิจิทัล (สพร.) พัฒนาขึ้นภายใต้แนวคิดการเป็นศูนย์กลางในการเข้าถึงข้อมูลเปิดภาครัฐของประเทศที่ให้ประชาชนสามารถเข้าถึงข้อมูลภาครัฐได้สะดวก รวดเร็ว

WeVis: Open Data for Participatory Democracy

ชุดข้อมูลเกี่ยวกับการเมือง การเลือกตั้ง และสิทธิมนุษยชน รวบรวมโดยกลุ่มเทคโนโลยีภาคประชาชน (Civic Tech) WeVis มีเป้าหมายส่งเสริมสิทธิในการเข้าถึงข้อมูล (Rights to Information) และการมีส่วนร่วมทางประชาธิปไตยบนพื้นฐานของข้อมูลของประชาชนชาวไทย

UDDC: Open Data for a More Inclusive Bangkok

ออนไลน์แพลตฟอร์มเปิดข้อมูลเมืองเป็นสาธารณะศูนย์ออกแบบและพัฒนาเมือง หรือ Urban Design and Development Center (UddC) มีเป้าหมายเพื่อสนับสนุนการมีส่วนร่วมของพลเมืองในการใช้ข้อมูลเมือง ที่จะเป็นส่วนต่อยอดในการให้ความเห็นหรือขับเคลื่อนการพัฒนาเมือง

Bestimate Data Catalog

แพลตฟอร์มรวมข้อมูลอสังหาฯ บ้าน คอนโดแบบมหาศาลแบบครบจบที่เดียว โดยบริษัท บาเนีย (ประเทศไทย) สตาร์ทอัพ Property Tech โดยข้อมูลชุดนี้เป็นข้อมูลที่ทางบาเนียทำการจัดเก็บมาตลอด 5 ปี และมีการอัปเดตข้อมูลอย่างสม่ำเสมอ จากแหล่งข้อมูลทั้งภายในองค์กร รวมถึงพาร์ทเนอร์ต่าง ๆ จนกลายมาเป็น Data ด้านอสังหาฯ ทั้งหมด 16 แกน

ProPublica Data Store

ชุดข้อมูลจากสำนักข่าว ProPublica ที่รวบรวมมาจากข้อมูลที่ใช้รายงานข่าวเรื่องต่างๆ ตลอดระยะเวลาหลายปี มีเป้าหมายเผื่อขยายผลงานข่าวแบบสืบสวนสอบสวน (Investigative Journalism) โดยมีการแบ่งประเภท เช่น สิ่งแวดล้อม การศึกษา สุขภาพ ฯลฯ เพื่อให้ค้นหาได้ง่าย พร้อมบริการเชื่อมต่อ API

Our Data by FiveThirtyEight

ชุดข้อมูลจากสำนักข่าว FiveThirtyEight (abc news) ที่รวบรวมมาจากข้อมูลที่ใช้รายงานข่าวเรื่องต่างๆ ตลอดระยะเวลาหลายปี ตั้งใจให้ดาวน์โหลดไปเพื่อทดลองทำ Data Story และ Visualization โดยเฉพาะ ที่น่าสนใจของสำนักข่าวนี้คือข้อมูลด้านกีฬาและการเมืองที่มีการรวบรวมไว้อย่างละเอียด และวิเคราะห์ออกมาได้น่าสนใจ

Earthdata by NASA

ข้อมูลเกี่ยวกับโลกและอวกาศ (ที่เกี่ยวกับโลก) ที่ NASA ได้ทำการเก็บรวบรวมไว้อย่างครบถ้วนที่สุด ด้วยเครื่องมือทางวิทยาศาสตร์อวกาศนับตั้งแต่ Remote Sensing บทดาวเทียมนอกโลก จนถึงการลงพื้นที่ของนักวิทยาศาสตร์ เป้าหมายหลักก็เพื่อให้บุคคลหรือองค์กรที่สนใจ นำไปใช้ต่อเพื่อเข้าใจโลกใบนี้ให้มากขึ้นและแก้ปัญหาต่างๆ ที่กำลังเกิดขึ้นกับโลก

Data.world

Data Catalog ที่มุ่งส่งเสริม Data Governance ด้วยเป้าหมายที่จะทำให้ชุดข้อมูลต่างๆ สามารถถูกค้นพบ เข้าถึง และเข้าใจได้โดยง่าย ทั้งในระดับองค์กรและระดับสังคม ที่น่าสนใจคือในเว็บไซต์นี้เปิดให้คนมาอัพโหลด Dataset ของตัวเอง ไม่ว่าจะเป็นประเด็นจริงจังอย่างความเหลื่อมล้ำหรือปัญหาสิ่งแวดล้อม ไปจนถึงเรื่องสนุกๆ อย่างความนิยมของซีรีส์บนสตรีมมิ่งหรือความเผ็ดของอาหารในแต่ละประเทศ

Kaggle Open Data Community

ออนไลน์คอมมูนิตี้ของกลุ่มทำงานในวงการ Data Science และ Machine Learning ที่มีการแชร์ชุดข้อมูลและโค้ดกัน ซึ่งก็เปิดให้คนมาอัพโหลด Dataset ของตัวเองเช่นกัน และตัวชุดข้อมูลก็มีประเด็นที่หลากหลาย รวมถึงมีคอร์สให้ความรู้ และการจัด Competition ในคอมมูนิตี้นี้ด้วย

Dataset ในลิสต์ที่ชี้เป้าเหล่านี้ ล้วนเป็น ข้อมูลเปิด (Open Data) ที่เกิดจากภาครัฐ ภาคเอกชน และภาคประชาชน ยิ่งเปิดข้อมูลมากเท่าไหร่ ก็ยิ่งมีโอกาสที่คนจะเอาไปใช้ประโยชน์ต่อได้มากเท่านั้น ไม่ใช่แค่เอาไปทำ Data Story/Visualization เพื่อฝึกฝีมือ สื่อสารสร้างความเข้าใจ หรือสร้างการมีส่วนร่วมเท่านั้น แต่อาจนำไปพัฒนาเครื่องมือหรือแนวทางเพื่อแก้ปัญหา และยกระดับคุณภาพชีวิตในหลายๆ ด้านได้

DGA ให้คำนิยาม Open Data ว่า คือข้อมูลเปิดที่ทุกคนสามารถนำไปใช้ได้โดยอิสระ โดยเน้นหลักสำคัญ 3 อย่าง คือ

1. Availability and Access : ข้อมูลเปิดที่ทุกคนสามารถนำไปใช้ได้โดยอิสระทั้งหมด กรณีที่มีค่าใช้จ่ายจะต้องไม่มากไปกว่าการทำสำเนา สำหรับการเผยแพร่จะต้องอยู่ในรูปแบบที่ง่ายต่อการใช้งานและสามารถแก้ไขได้ สามารถดาวน์โหลดฟรีผ่านอินเตอร์เน็ต
2. Re-use and Redistribution : ข้อมูลที่เผยแพร่ต้องถูกจัดเตรียมภายใต้เงื่อนไข การอนุญาตให้นำมาใช้ใหม่และเผยแพร่ได้ รวมถึงการใช้ชุดข้อมูลร่วมกับชุดข้อมูลอื่น ๆ
3. Universal Participation : ทุกคนสามารถที่จะใช้ข้อมูลได้ ไม่ว่าจะเป็นการนำไปใช้ การใช้ซ้ำ การเผยแพร่ โดยไม่ติดเรื่องข้อจำกัดใดๆ แต่ทั้งนี้จะต้องเป็นไปตามวัตถุประสงค์ของเจ้าข้อมูลนั้นๆ เช่น หากเป็นข้อมูลที่ไม่อนุญาตให้ใช้งานเชิงพาณิชย์ (non-commercial) จะไม่สามารถนำไปใช้ในเชิงพาณิชย์ได้ หรือข้อมูลนั้นอาจมีข้อจำกัดในการใช้งานเพื่อวัตถุประสงค์บางอย่างเช่น ใช้ในการศึกษาเท่านั้น

เชื่อว่า ‘ข้อมูลเปิดที่มีคุณภาพ’ คือความฟินขั้นสุด สำหรับใครที่ทำงานในสาย Data Storytelling/Data Visualization ใครที่อยากเริ่มลองทำอะไรแบบนี้ ลองเลือก Dataset ที่สนใจในลิสต์ไปลองเล่นแล้วมาแชร์กันได้ ส่วน Dataset ไหนที่ยังไม่มี ก็สามารถมาร่วมกับพวกเราเพื่อสร้างสังคม Open Data กันต่อไปได้

สมัครร่วมทีมกับ Punch Up & WeVis เพื่อขับเคลื่อน Open Data และสร้างสรรค์งาน Data Story & Civic Tech ได้ที่นี่

เรียนรู้วิธีการสื่อสารแบบใหม่ที่สามารถแปลงข้อมูลยากๆให้กลายเป็น Visualization ที่ง่ายและสวยงามได้ในคอร์สออนไลน์ Data Storytelling with infographics ที่นี่

--

--