เงินซื้อความสุขได้ไหม และดัชนีค่าความสุขมาจากอะไรบ้าง— ส่งการบ้าน Project Week 1: Data Analytic

Parin Chiamananthapong
botnoi-classroom
Published in
4 min readAug 14, 2020
Maru, The smiling dog (https://web.facebook.com/marustagram)

Team member:

  1. Pop 🏠
  2. nnew 📊
  3. ป๋ำ 🎭
  4. โอ๊ต ⚙️
  5. หมิว ✈️
  6. นภันต์ 💻
  7. เท็น 🏭
  8. ภู 📡
  9. กระติ๊บ 📈
  10. ตุ๊ก 📚
  11. โอ๋ 💾
  12. Pui 📱

Objective: บทความนี้เป็นส่วนหนึ่งของ Data Science Essential ของ Botnoi Classroom หัวข้อ Data Analytic

สวัสดีครับ blog คราวนี้จะเปลี่ยนแนวจาก blockchain มาเป็นเรื่องเกี่ยวกับ data analytic แทน ช่วงนี้ผมได้ไปเรียนคลาส Data Science Essential#1 ของ Botnoi มา โดยคลาสนี้จะเรียนแบบ online 8 อาทิตย์ และจะมี weekly project ในแต่ละอาทิตย์สำหรับแต่ละกลุ่ม (มีทั้งหมด 20 กลุ่ม) สำหรับงานของ week แรกก็เปิดด้วยงานการทำ data analytic ซึ่งกลุ่มผม (กลุ่ม 16) ได้แรงบันดาลใจว่า “ความสุข” เป็นเรื่องที่ใกล้ตัวมาก ก็เลยอยากรู้ว่าตัวเลขดัชนีความสุขปัจจุบันที่เขานำมาใช้อันดับประเทศนี่เขาคิดมาจากอะไรบ้าง โดยใช้ขั้นตอนการวิเคราะห์จากที่เรียนมา ซึ่งผลที่ได้จะเป็นยังไงบ้างก็ติดตามต่อได้เลยครับ :D

บทความนี้จะเป็นการอธิบายคำถาม, ข้อสมมติฐานและการหาคำตอบจากข้อมูลที่มี โดยสำหรับคนที่เชี่ยวชาญแล้ว สามารถไปดูได้ที่ link Colab ด้านล่างโดยตรงได้เลย หรือถ้าสำหรับใครที่อยากรู้ผลที่วิเคราะห์ได้เฉยๆ ก็สามารถอ่านได้ที่ section ด้านล่าง ในส่วนของ “TL; DR ยาวไปไม่อ่าน” ที่เป็นสรุปสั้นๆก็ได้เหมือนกันครับ :P

TL; DR ยาวไปไม่อ่าน

  • ตัวชี้วัดความสุขในงานนี้ ทีมได้เลือก happiness index ซึ่งเป็นการวัดผลจากการให้ประชากรในแต่ละประเทศตอบแบบสอบถาม โดยให้คะแนนค่า 0–10 ในแต่ละคำถาม และคิดจากค่าอื่นๆเพิ่มเติม
  • โดยค่านี้จะคิดจากคำถาม 6 ด้าน คือ GDP per capita (รายได้เฉลี่ยต่อหัว), Health (อายุเฉลี่ย), Freedom (อิสรภาพ), Generosity (ความมีนำ้ใจ), Trust (บางทีข้อมูลก็ใช้เป็น Perception of Corruption แต่สรุปคือ ความเชื่อมั่นในรัฐบาล), Social (การช่วยเหลือในสังคม)
  • จากการที่เราได้นำค่าต่างๆมาทำ correlation พบว่า ปัจจัยที่ส่งผลต่อ happiness index จะเรียงจากมากไปน้อยดัวนี้ GDP per capita > Social > Health> Freedom > Trust และ Generosity
  • ดังนั้น เราอาจจะพอสรุปสั้นๆได้ว่า “เงินซื้อความสุขได้” ในบริบทนี้นะครับ :P
  • ทีมได้มีการข้อมูลเพิ่มเติมโดยแบ่งกลุ่มประเทศเป็นกลุ่มตะวันออก และตะวันตก เบื้องต้นพบว่ากลุ่มประเทศตะวันตกมีแนวโน้มที่จะมีความสุขมากกว่า

รูปข้างล่างจะเป็นการอธิบายถึงกระบวนการทำ Data Analytic ของ project นี้นะครับ แต่ในบทความนี้อาจจะไม่ได้เล่าตามลำดับขั้นตอนตามนี้นะครับ(อ้าว) โดยอาจจะปรับเปลี่ยนการเล่าตามความเหมาะสมกับ style ของ medium และของคนเขียนเอง(สำคัญสุดคือข้อนี้แหละ :P) สำหรับใครที่ต้องการดูขั้นตามตามกระบวนการ สามารถไปดูได้ที่ไฟล์ colab ด้านบนนะครับ

กระบวนการทำ Data Analytic (แคปจากในคลาสมา :P)

หน่วยวัดความสุข

อันที่จริง ความสุขนี่เป็นสิ่งที่ค่อนข้างนามธรรม ดังนั้นเพื่อที่จะทำการวิเคราะห์ได้ เราจะต้องหาหน่วยวัดมาจับให้มันมาเป็นค่าที่เราสามารถนำไปคำนวณต่อได้ก่อน ซึ่งค่าที่เราเลือกใช้คือ ค่า Happiness Index (ขอเรียกสั้นๆว่า ค่าความสุข ละกัน) โดยค่านี้จะเก็บจากการให้ประชากรในแต่ละประเทศตอบโพลคำถามโดยให้คะแนน 0–10 ในหัวข้อต่างๆ รวมไปถึงการนำข้อมูลจากแหล่งอื่นๆเช่น ข้อมูล GDP และข้อมูลสุขภาพจาก WHO มาคิดประกอบด้วย ซึ่งตัวข้อมูลนี้สามารถ download ได้จากเว็บ kaggle ครับ

ค่าความสุขปี 2019

เมื่อเราได้ข้อมูลมา ก็ลองมาดูสำรวจเล่นๆดูก่อนว่าประเทศไหนมีค่าความสุขมากสุดและประเทศไหนมีค่าความสุขน้อยสุด ซึ่งผลที่ได้จะเป็นไปตามนี้ครับ

ฝั่งซ้ายจะเป็น 10 ประเทศที่มีค่าความสุขมากสุด ส่วนฝั่งขวาคือ 10 ประเทศที่มีค่าความสุขน้อยสุดครับ

ส่วนประเทศไทยค่าความสุขจะอยู่ที่อันดับ 52 ซึ่งเรียกได้ว่ากลางๆค่อนไปทางดีเลยครับ 🎉

ประเทศไทยจร้า

ปัจจัยที่ส่งผลต่อค่าความสุข

เบื้องต้นทีมได้ตั้งสมมติฐานว่า ประเทศที่รวยกว่า น่าจะมีความสุขกว่า และ Healthy life expectancy น่าจะส่งผลต่อค่าความสุขมากที่สุด ซึ่งถ้าพิจารณาจากค่าความสุข เราจะพบว่าค่าดังกล่าวจะคิดจาก 6 ค่าดังนี้

  • GDP per Capital รายได้เฉลี่ยต่อหัว
  • Healthy life expectancy อายุค่าเฉลี่ยของการมีสุขภาพดี
  • Freedom to make life choices เสรีภาพในการใช่ชีวิต
  • Generosity ความมีน้ำใจ
  • Perception of Corruption ความเชื่อมั่นในรัฐบาล
  • Social support การปฏิสัมพันธ์ และการช่วยเหลือกันภายในสังคม

ซึ่งเราจะมาพิจารณาปัจจัยแต่ละข้อว่าจะส่งผลต่อค่าความสุขเยอะขนาดไหนโดยการใช้ correlation ของค่าปัจจัยต่างๆเทียบกับค่าความสุขครับ

“ค่า correlation ถ้าอธิบายแบบเข้าใจง่ายๆก็น่าจะประมาณ ค่าความสัมพันธ์ระหว่างข้อมูลสองชุด ซึ่งถ้าค่านี้เข้าใกล้ 1 คือไปทางเดียวกัน เช่น a มาก b มากตามละกันครับ”

GDP per Capital — รายได้เฉลี่ยต่อหัว 💰

จากการทดลอง plot กราฟ scatter plot บวกกับ regression แล้ว เราจะพบว่ายิ่งรวยยิ่งมีค่าความสุขมากขึ้นครับ ดังนั้นสมมติฐานของเราที่ว่า “ประเทศที่รวยมีแนวโน้มที่จะมีความสุขมากกว่า” ก็ค่อนข้างตรงครับ (ซึ่งอาจจะสันนิษฐานได้ว่า ถ้าประชากรมีเงินเพียงพอในระดับหนึ่งแล้ว ก็อาจจะทำให้ไม่เครียดมาก และสามารถไป focus ในสิ่งที่อยากทำอื่นๆ มากกว่าที่จะกังวลเรื่องการหาเงินก็เป็นได้)

Healthy life expectancy อายุค่าเฉลี่ยของการมีสุขภาพดี 🩺

โดยค่านี้จะเป็นอายุเฉลี่ยของประชากรในประเทศนั้น ซึ่งเราพบว่ายิ่งประชากรอายุยืนขนาดไหน ประเทศก็จะยิ่งมีค่าความสุขเพิ่มขึ้นครับ แต่จะตรงกับสมมติฐานของทีมเราที่ว่าตัวนี้จะส่งผลต่อค่าความสุขมากที่สุดไหม อันนี้เดี๋ยวต้องดูเปรียบเทียบกับตัวอื่นๆอีกทีครับ

Freedom to make life choices เสรีภาพในการใช้ชีวิต 🕊️

ค่านี้จะเป็นการให้คะแนนของผู้ตอบว่ารู้สึกว่าตนมีอิสระภาพในการใช้ชีวิตขนาดไหน ซึ่งจากการดูกราฟก็พบว่า ปัจจัยนี้ก็ค่อนข้างส่งผลต่อค่าความสุขพอสมควรครับ

Generosity ความมีน้ำใจ 💌

ค่านี้จะเป็นการค่าที่วัดความมีนำ้ใจของประชากรในประเทศนั้น (ไม่แน่ใจเหมือนกันว่าวัดยังไง แต่จากเท่าที่เข้าใจน่าจะเป็นการตอบแบบสอบถามว่าได้เคยบริจาคในช่วงเร็วๆนี้หรือเปล่า) ซึ่งเราจะพบว่าค่านี้กลับไม่ส่งผลต่อค่าความสุขเท่าไร (แปลกแฮะ)

Perception of Corruption ความเชื่อมั่นในรัฐบาล 🗳️

ค่านี้เป็นการวัดว่าประชากรในประเทศนั้นมีความเชื่อมั่นต่อรัฐบาลตัวเองเท่าไร ซึ่งเราก็พบว่าค่านี้ก็ไม่ได้ส่งผลต่อค่าความสุขเท่าไร (อาจจะมองว่าเป็นเรื่องไกลตัวก็ได้มั้ง :P)

Social support การปฏิสัมพันธ์ และการช่วยเหลือกันภายในสังคม ☎️

ค่านี้จะเป็นค่าที่บอกว่าประชากรมีการช่วยเหลือกันขนาดไหน (เท่าที่เคยเห็น คำถามจะออกแนวว่า ถ้าเกิดเหตุอะไร คุณสามารถขอความช่วยเหลือจากญาติหรือเพื่อนๆได้ไหม) ซึ่งเท่าที่ดูค่านี้ก็เกี่ยวข้องกับค่าความสุขโดยตรงเลยครับ

ซึ่งเมื่อนำค่า correlation ของปัจจัยต่างๆมาเทียบกันตามรูป heatmap ด้านล่าง เราจะพบว่าค่าปัจจัยที่ส่งผลต่อค่าความสุขจะเรียงจากมากไปน้อยได้ดังนี้

GDP per capita > Healthy life expectancy > Social support > Freedom to make life choices > Perceptions of corruption > Generosity ตามลำดับครับ

ดังนั้นจากสมมติฐาน 2 ข้อที่ทีมได้วางไว้ คือ

  • ประเทศที่รวยกว่ามีแนวโน้มที่จะมีค่าความสุขมากกว่า -> อันนี้จริงเพราะค่า GDP per capita มีค่า correlation ที่สูงที่สุด
  • ค่า Healthy life expectancy จะส่งผลต่อค่าความสุขมากที่สุด -> อันนี้ไม่ถูก เพราะจากภาพ heatmap ที่แล้ว เราจะพบว่าค่า GDP per capita นั้นมีค่า correlation ที่สูงกว่า และค่า Social support ที่มีค่าใกล้เคียงกับ Healthy life expectancy ครับ

แล้วประเทศในกลุ่มตะวันตกหรือตะวันออก ใครมีความสุขกว่ากัน

เนื่องจาก dataset ตัว happiness index นั้นไม่ได้มีข้อมูลที่บ่งบอกว่าประเทศไหนอยู่ในกลุ่มตะวันตกหรือตะวันออก ทางทีมจึงได้ไปหาข้อมูลของ ทวีป, ประชากร และข้อมูลการแบ่งกลุ่มตะวันตก เพิ่มเติม ซึ่งหลังจากที่เราแบ่งกลุ่มประเทศต่างๆออกเป็นกลุ่มตะวันตกและตะวันออกแล้ว เราจึงทำการหาค่าเฉลี่ยของค่าความสุข และได้ผลตามรูปด้านล่างครับ

ฝั่งตะวันตกมีค่าเฉลี่ยของค่าความสุขที่สูงกว่าฝั่งตะวันออก

ซึ่งเราจะพอสรุปได้ว่า “ประเทศในกลุ่มตะวันตกนั้น มีแนวโน้มที่จะมีค่าความสุขสูงกว่าประเทศในกลุ่มตะวันออก” ครับ (แต่เรามีค่าความมีนำ้ใจสูง 💌 กว่านะ)

ประเทศที่มีการเปลี่ยนอันดับระหว่างปี 2018 กับ 2019 เยอะนั้นเกิดจากปัจจัยอะไร

ในข้อนี้ทีมงานได้นำเอาข้อมูลของปี 2018 มาเปรียบเทียบเพิ่มเติม โดยต้องการตอบข้อสงสัยว่า “ประเทศไหนมีการเปลี่ยนแปลงเยอะที่สุด และปัจจัยในแต่ละอย่างมีอะไรเปลี่ยนไปบ้าง” ซึ่งจากผลจะพบว่า Malaysia เป็นประเทศที่อันดับร่วงเยอะสุด (45 อันดับ) ในขณะที่ Benin มีการเพิ่มเยอะสุด (อันดับขึ้นมา 34 อันดับ) ซึ่งจากการวิเคราห์เบื้องต้น ในเคสของ Malaysia ซึ่งมีค่า GDP กับ Healthy life expectancy ที่มีค่า correlation ค่อนข้างสูง แต่ก็ยังอันดับตกอาจจะเป็นไปได้ว่ามีประเทศอื่นๆที่ลำดับดีว่าแซงขึ้นก็เป็นได้

เกร็ดเล็กน้อย

  • พม่าเป็นประเทศที่มีค่าความมีนำ้ใจสูงที่สุด (0.566) และมีอันดับของค่าความสุขอยู่ที่ 131 (ส่วนหนึ่งอาจจะมาจากค่า GDP ที่ไม่สูงมากนัก)
  • สิงคโปร์เป็นประเทศที่มีค่าความเชื่อมั่นต่อรัฐบาลสูงที่สุด (0.453) และมีอันดับของค่าความสุขอยู่ที่ 34

วิเคราะห์เพิ่มเติม

  • จากการสังเกตุ ตัวค่าความสุขนี้ค่อนข้างให้คะแนนหนักไปทางด้าน GDP เยอะ ซึ่งอาจจะต้องไปดูเรื่องการคิดคะแนนเพิ่มเติม
  • วิธีการเก็บข้อมูลที่ทำแบบสอบถาม และจำนวนรวมไปถึงความหลากหลายของกลุ่มตัวอย่างที่ไปเก็บข้อมูลซึ่งน่าจะมีผลต่อคะแนนที่ได้เป็นอย่างมาก
  • ความรู้สึกและสถานการณ์ในประเทศอาจจะส่งผลต่อคะแนนค่าความสุขในช่วงนั้น
  • ความเข้าใจหรือทรรศคติที่แตกต่างกัน ทำให้การให้ความสำคัญของแต่ละคนไม่เท่ากัน
  • ค่าความสุขนี้อาจจะไม่ได้สะท้อนถึงความสุขที่แท้จริง ซึ่งอาจจะมีปัจจัยอื่นๆที่ส่งผลที่ไม่ได้ถูกนำมาคิดพิจารณาด้วย (ถ้าสังเกตุ ในบทความนี้ผมจะพยายามใช้คำว่า “ประเทศที่มีค่าความสุข” ไม่ใช่ “ประเทศที่มีความสุข” )

idea และสมมติฐานอื่นๆที่ยังไม่ได้ลองทำ (เนื่องจากเวลาจำกัด T T)

  • ความสัมพันธ์ระหว่าง ค่าความสุขกับอัตราการฆ่าตัวตาย (ถ้ามีความสุขก็ไม่ควรจะมีการฆ่าตัวตายเยอะ) โดยใช้ข้อมูลจาก https://www.kaggle.com/szamil/who-suicide-statistics
  • ความสัมพันธ์ระหว่างรายได้/รายจ่ายกับค่าความสุข คือประเทศที่มีความสุขน่าจะมีรายได้ที่เพียงพอต่อการใช้จ่าย โดยเอาข้อมูล minimum wage (รายได้ขั้นตำ่) กับ cost of living (ค่าครองชีพ) มาคิด แต่ dataset ที่หาได้ มีแค่ cost of living และน่าจะเอามาใช้ยากอยู่(ดังนั้นข้อนี้ไม่น่าจะทำได้ T T)
  • ความสัมพันธ์ระหว่างค่าความสุขกับระบอบการปกครอง อันนี้ไม่รู้ผลเป้นไง แต่น่าสนใจดี (เผอิญเห็นมี dataset เรื่องระบอบการปกครองในแต่ละประเทศอยู่ https://www.kaggle.com/mathurinache/democracy-dictatorship-index)
  • ความสัมพันธ์ระหว่างค่าความสุขกับ HDI (human development index)
    https://www.kaggle.com/sudhirnl7/human-development-index-hdi
  • ความสัมพันธ์ระหว่างค่าความสุขกับการบริโภค alcohol 🍻
    https://www.kaggle.com/marcospessotto/happiness-and-alcohol-consumption

--

--

botnoi-classroom
botnoi-classroom

Published in botnoi-classroom

This publication consists of articles related to Data science and AI written from Botnoi’s data scientists and students.

Parin Chiamananthapong
Parin Chiamananthapong

Written by Parin Chiamananthapong

POS (Plain Old Full-Stacked) Developer who loves coding, startup, blockchain and anime :D