รู้จัก COVID-19 ผ่านข้อมูล

New Naveen
data น่าฟาด
4 min readMar 23, 2020

เรียนรู้สถิติที่น่าสนใจของ COVID-19

Coronavirus คืออะไร

โคโรนาไวรัส เป็นไวรัสจำพวกหนึ่งที่ค้นพบมานานแล้ว มันมีรูปร่างปรากฏเป็นแฉกเหมือนสวมมงกุฎอยู่ โคโรนาไวรัสเป็นสาเหตุของโรคติดเชื้อในระบบทางเดินหายใจตั้งแต่โรคธรรมดา เช่นหวัด ไปจนถึงโรคที่ร้ายแรงกว่านั้นเช่น โรคทางเดินหายใจตะวันออกกลาง (MERS) และ โรคระบบทางเดินหายใจเฉียบพลันร้ายแรง (SARS)

โคโรนาไวรัส สายพันธ์ุใหม่ชื่อ SARS-CoV-2 ทำให้เกิดโรค COVID-19 ซึ่งเริ่มต้นระบาดในอู่ฮั่น ประเทศจีนเมื่อปลายปี 2019

Dataset

dataset ของ COVID-19 นำมาจาก kaggle ซึ่งรวบรวมข้อมูลการติดเชื้อรายประเทศ ตั้งแต่วันที่ 22 มกราคม 2020 จนถึงปัจจุบัน (23 มีนาคม 2020) และยังมีโปรไฟล์ของผู้ติดเชื้อเช่น เพศ อายุ ประเทศที่อยู่ ฯลฯ แต่ไม่ได้มีข้อมูลของผู้ติดเชื้อทุกคน นั่นทำให้ตัวเลขจากการวิเคราะห์ข้อมูลชุดนี้ อาจไม่ได้สะท้อนประชากรทั้งหมด และไม่ใช่ตัวเลขอย่างเป็นทางการ

จำนวนผู้ติดเชื้อ

จนถึงขณะนี้จำนวนผู้ติดเชื้อทั่วโลกยังเพิ่มขึ้นต่อเนื่อง

จำนวนผู้ติดเชื้อ COVID-19 รายวัน (ทั่วโลก)

เมื่อเหลียวกลับไปมองที่จีน ญี่ปุ่น และเกาหลีใต้ที่พบผู้ติดเชื้อเป็นประเทศแรกๆ จะเห็นว่าจำนวนผู้ติดเชื้อสะสมเริ่มคงที่ และในวันที่ 19 มีนาคม ประเทศจีนไม่พบคนจีนรายใหม่ที่ติดเชื้อแล้ว (แต่ยังคงพบผู้ติดเชื้อต่างชาติอยู่)

จำนวนผู้ติดเชื้อ COVID-19 สะสมรายวันในจีน เกาหลีใต้ และญี่ปุ่น

สำหรับประเทศไทยและประเทศอื่นๆ สงครามเพิ่งเริ่มต้นเท่านั้น

จำนวนผู้ติดเชื้อ COVID-19 สะสมรายวันในประเทศที่มีผู้ติดเชื้อสะสมสูงสุดในปัจจุบัน (ไม่รวมจีน เกาหลี และญี่ปุ่น)
จำนวนผู้ติดเชื้อ COVID-19 สะสมรายวันในไทย

จะเห็นว่า ในกรณีของประเทศไทยเมื่อจำนวนผู้ติดเชื้อผ่าน 100 คน จำนวนผู้ติดเชื้อรายใหม่ก็เติบโตขึ้นอย่างรวดเร็ว เราจะกลับมาคุยกันเรื่องจำนวนผู้ติดเชื้อ และการคาดการณ์จำนวนผู้ติดเชื้ออีกครั้งในตอนต่อไป…

อัตราการเสียชีวิต

แต่ติดเชื้อไม่ได้แปลว่าจะตาย เพราะเมื่อมาดูอัตราการเสียชีวิต (crude fatality rate) ของโรคนี้มีค่า 4.36% ซึ่งขยับสูงขึ้นจาก 3.4% ที่ WHO แถลงไว้เมื่อ 3 มีนาคมที่ผ่านมา อัตราการเสียชีวิตยังคงเปลี่ยนแปลงตามเวลา ซึ่งส่วนใหญ่จะสูงในช่วงเริ่มต้นและจะมีค่าลดลงเมื่อเวลาผ่านไป เนื่องจากพบผู้ติดเชื้อที่อาการไม่รุนแรงมากขึ้น (จากก่อนหน้าที่จะโฟกัสไปที่ผู้ป่วยอาการรุนแรง ซึ่งมีโอกาสตายสูง) และเรารู้จักวิธีรับมือกับโรคได้ดีขึ้น

อัตราการเสียชีวิตรายวัน จากในและนอกประเทศจีน เมื่อกลางเดือนมีนาคม อัตราการเสียชีวิตนอกประเทศจีนสูงกว่าอัตราในประเทศจีนแล้ว

เนื่องจากเรายังอยู่ในช่วงต้นของการระบาดทั่วโลก จึงยังเร็วเกินไปที่จะสรุปตัวเลขอัตราการเสียชีวิตที่แน่นอน ณ เวลานี้ แต่นี่ก็เป็นตัวเลขที่ดีที่สุดเท่าที่เราจะหาได้ การคำนวณอัตราการเสียชีวิตในกรณีนี้ขอใช้วิธีที่ซับซ้อนน้อยที่สุดคือ crude fatality rate (CFR) คำนวณจากจำนวนผู้เสียชีวิตสะสม/จำนวนผู้ติดเชื้อสะสม ณ วันนั้นๆ

เมื่อนำอัตราการเสียชีวิตมาเทียบกับโรคระบาดที่เป็นข่าวในช่วงหลายปีที่ผ่านมา จะพบว่าค่านี้ไม่ได้สูงมากนัก

อัตราการเสียชีวิตของ COVID-19 เทียบกับโรคต่างๆ (อัตราการเสียชีวิตเป็นค่าโดยประมาณ ซึ่งอาจแตกต่างกันไปในแต่ละช่วงเวลาและพื้นที่)

แต่เมื่อเทียบกับไข้หวัดธรรมดาแล้ว ก็สูงกว่า 40 เท่าตัว

อัตราการเสียชีวิตของ COVID-19 เทียบกับโรคต่างๆ (*อัตราการเสียชีวิตของโรคไข้เลือดออกชนิดร้ายแรงอาจสูงถึง 5% และอาจเพิ่มขึ้นถึง 20% หากไม่ได้พบแพทย์ทันเวลา)

ข้อมูลจาก kaggle ยังบอกอีกว่าอัตราการเสียชีวิตยังขึ้นกับอายุด้วย ยิ่งอายุมากโอกาสเสียชีวิตยิ่งสูง (ขอไม่โชว์กราฟข้อมูลให้ดู เพราะมีข้อมูลผู้ป่วยที่ไม่ระบุอายุมากเกินไป) จึงไปหารายงานที่บอกสถิตินี้อย่างเป็นทางการมาแทน

แนวโน้มไปในทางเดียวกับรายงานของประเทศจีนที่เก็บรวบรวมข้อมูลจากผู้ติดเชื้อ 44 ,672 คนเมื่อวันที่ 11 กุมภาพันธ์ 2020 นั่นคือยิ่งสูงอายุ ยิ่งมีโอกาสเสียชีวิตมาก

อัตราการเสียชีวิตแบ่งตามช่วงอายุ (ข้อมูลจาก China CDC)

ข้อมูลจาก kaggle ซึ่งไม่ได้ระบุเพศผู้ป่วยครบทุกคนบอกกับเราว่าอัตราการเสียชีวิตของเพศชายอยู่ที่ (8.46%) เพศหญิง (3.66%) ซึ่งดูสูงทะแม่งๆ อย่างไรก็ตามแนวโน้มนี้ก็สอดคล้องกับรายงานของประเทศจีนที่เก็บข้อมูลจากผุ้ติดเชื้อในจีน 55,924 ราย ณ วันที่ 20 กุมภาพันธ์ 2020 นั่นคือเพศชายมีอัตราการเสียชีวิตสูงกว่าเพศหญิง

อัตราการเสียชีวิตแบ่งตามเพศ (ข้อมูลจาก Report of the WHO-China Joint Mission on Coronavirus Disease 2019 (COVID-19))

สรุปคือถ้าใครจะใช้ข้อมูลโปรไฟล์ผู้ป่วยจาก kaggle มาวิเคราะห์ ให้ระมัดระวังเรื่องข้อมูลที่หายไป แม้แนวโน้มจะออกมาในทางเดียวกัน แต่ตัวเลขก็คลาดเคลื่อนจากรายงานอย่างเป็นทางการพอสมควร และไม่สามารถสรุปได้ว่าตัวเลขจริงเปลี่ยนไปแล้วหรือข้อมูลของเราไม่สมบูรณ์

นอกจากนี้อัตราการเสียชีวิตยังขึ้นอยู่กับว่าประเทศที่คุณอยู่มีมาตรการรองรับผู้ป่วยที่มีประสิทธิภาพแค่ไหน

อัตราการเสียชีวิตรายประเทศ 10 อันดับแรก (สำหรับประเทศที่ผู้ติดเชื้อเกิน 100 คน)

สำหรับประเทศไทยมีผู้เสียชีวิตแค่รายเดียวจาก 721 คน ซึ่งถือเป็นสัดส่วนน้อยมากๆ แต่ไม่ได้แปลว่าเมืองไทยอันตรายน้อยกว่าประเทศอื่นนะ

แล้วมันติดง่ายมั้ย

อีกหนึ่งความน่ากลัวของเชื้อโรคคือความสามารถในการแพร่กระจาย ตัวชี้วัดหนึ่งที่ใช้กันคือค่า R₀ (มักเรียกกันว่า R-naught) ค่า R₀ หรือ Basic reproduction number บอกกับเราว่าโดยเฉลี่ยแล้ว คนหนึ่งคนสามารถแพร่เชื้อให้คนที่ยังไม่ติดเชื้อได้กี่คน

ถ้า R₀ > 1 จะทำให้เกิดโรคระบาด คนติดเชื้อใหม่จะเพิ่มขึ้นเรื่อย
แต่ถ้า R₀ < 1 จะไม่เกิดโรคระบาด คนติดเชื้อใหม่จะลดลงเรื่อยๆ

R₀ จะมากหรือน้อยขึ้นอยู่กับ

  1. ระยะเวลาแพร่เชื้อ ยิ่งนาน โอกาสแพร่เชื้อยิ่งสูงทำให้ค่า R₀ สูงขึ้น
  2. วิธีการแพร่ระบาด ถ้าแพร่ระบาดทางอากาศ R₀ ยิ่งสูง แต่ถ้าแพร่ผ่านทางเลือดซึ่งยากกว่า ก็จะดึง R₀ ให้ต่ำลง
  3. ปฏิสัมพันธ์ของผู้ป่วย ยิ่งผู้ป่วยพบปะผู้คนจำนวนมาก R₀ ยิ่งสูงขึ้น นี่เป็นวิธีเดียวที่เราสามารถควบคุมได้ เพื่อลดค่า R₀ โดยหลีกเลี่ยงการไปอยู่ในที่มีคนเยอะ หรือกักตัวอยู่บ้าน

สำหรับ Covid-19 องค์การอนามัยโลกประเมินว่ามีค่า R₀ อยู่ระหว่าง 2 -2.5 นั่น ซึ่งขอตีเป็นกรณีที่เลวร้ายสุดคือ 2.5 ไปเลย นั่นหมายความว่า โดยเฉลี่ยแล้วผู้ป่วยหนึ่งคนสามารถแพร่เชื้อไปให้คนอื่นได้ 2.5 คน

เมื่อเทียบ R₀ ของ Covid-19 กับโรคอื่นๆแล้วพบว่าใกล้เคียงกับไข้หวัดนก และ SARS ซึ่งเป็นโรคทางเดินหายใจเหมือนกัน และสูงกว่าไข้หวัดธรรมดา นั่นหมายความว่าถ้าไม่มีการควบคุมอะไรเลย Covid-19 จะระบาดหนักกว่าโรคหวัดเสียอีก และยิ่งอัตราการเสียชีวิตสูงกว่าหวัดถึง 40 เท่า จะทำให้มีผู้เสียชีวิตเพิ่มขึ้นถึง 40 เท่าตัว!

R₀ ของ Covid-19 เทียบกับโรคต่างๆ

เรามักจะนำค่า R₀ มาพล็อตกราฟคู่กับอัตราการเสียชีวิต จะทำให้เราพอเห็นความร้ายกาจของโรคได้

จะเห็นได้ว่า โรคหัด (Measles) ซึ่งแพร่เชื้อได้ทางอากาศมีค่า R₀ สูงมาก แต่อัตราการเสียชีวิตค่อนข้างต่ำ เพราะอาการของโรคไม่รุนแรงถึงตาย ในขณะเดียวกันไข้หวัดนกหรืออีโบลาที่มีอัตราการเสียชีวิตสูง จะมีความสามารถในการแพร่เชื้อต่ำเทียบกับ ไข้ทรพิษ (smallpox) หรือโรคหัด เพราะส่วนใหญ่ผู้ติดเชื้อจะตายก่อนได้เดินทางไปแพร่เชื้อในวงกว้าง

เราจะพบว่า SARS มีอัตราการเสียชีวิตและ R₀ สูงกว่า Covid-19 แต่ทำไมจึงไม่เกิดการระบาดใหญ่เช่นนี้ นั่นเป็นเพราะโรค SARS จะเข้าระยะแพร่เชื้อในสัปดาห์ที่สองหลังแสดงอาการ แต่ Covid-19 อาจแพร่เชื้อได้ทันทีเมื่อแสดงอาการ การควบคุมโรคจึงทำได้ยากกว่า

การระบาดจะไปจบที่ตรงไหน

หากควบคุมสถานการณ์ได้ จำนวนผู้ติดเชื้อรายใหม่จะค่อยๆ ลดลงแบบประเทศจีน และเมื่อผู้ป่วยรักษาหายจำนวนผู้ติดเชื้อก็จะค่อยๆ หมดไป เมื่อการระบาดหยุดแล้วก็จำเป็นต้องเฝ้าระวัง ไม่ให้การระบาดเกิดขึ้นซ้ำอีก

จำนวนผู้ติดเชื้อรายใหม่ และจำนวนผู้ติดเชื้อสะสมรายวันในประเทศจีน

อย่างไรก็ตาม เหตุที่เราต้องชะลอการระบาดให้เกิดขึ้นช้าที่สุดมีเหตุผลหลักๆ สองประการ

1.เพื่อให้มีบริการทางการแพทย์ที่เพียงพอต่อผู้ป่วย หากผู้ป่วยเพิ่มขึ้นเร็วจนเกินขีดความสามารถของระบบสาธารณสุข จะมีผู้เสียชีวิตมากกว่าที่ควรจะเป็นเพราะทรัพยากรทางด้านการแพทย์ไม่เพียงพอ

Flattening the curve คือการชะลอจำนวนผู้ป่วยใหม่ ให้เพียงพอกับขีดความสามารถทางการแพทย์ (source: Vox)

2. เพื่อประวิงเวลา จนกว่าจะคิดค้นยารักษาหรือวัคซีนได้

หากโรคระบาดลุกลามจนควบคุมไม่ได้หนทางสุดท้ายคือการทำให้เกิด ภูมิคุ้มกันกลุ่ม (herd immunity)

ภูมิคุ้มกันกลุ่ม (Herd immunity)

เราสามารถพิสูจน์ทางคณิตศาสตร์ได้ว่า เมื่อประชากรในสังคมมีภูมิคุ้มกัน จนถึงสัดส่วน 1–1/R₀ การะบาดของโรคจะยุติลง ยกตัวอย่างเช่นโรคหัดมี R₀ = 15 ซึ่งระบาดในวงกว้างมาก คนในสังคมต้องมีภูมิคุ้มกันอย่างน้อย 93% ของประชากรทั้งหมด จึงจะหยุดการระบาดไว้ได้ นี่เป็นเหตุผลที่เราต้องรับวัคซีนโรคหัดตั้งแต่ยังเด็ก แม้มันจะไม่มีอันตรายร้ายแรง แต่การระบาดจะไปไวมาก หากไม่มีภูมิต้านทาน

การเกิด herd immunity จะยับยั้งการระบาดของโรคได้เมื่อประชากรมีภูมิคุ้มกันอย่างน้อย 1–1/R0 หากประชากรกลุ่มสีเหลือง (มีภูมิคุ้มกัน) มีจำนวนมากพอ จะช่วยกักผู้ติดเชื้อไม่ให้แพร่กระจายโรคได้ (source: wikipedia)

หาก Covid-19 มี R₀ = 2.5 หมายความว่า ประชากรในประเทศต้องมีภูมิคุ้มกันอย่างน้อย 60% หากประชากรในไทยมี 70 ล้านคน นั่นหมายความว่า คนไทยจะต้องมีภูมิคุ้มกันอย่างน้อย 42 ล้านคน การแพร่ระบาดจึงจะยุติ ซึ่งจะเกิดขึ้นได้จากการฉีดวัคซีน หรือหายจากการติดเชื้อ

อีกวิธีหนึ่งคือการควบคุม R₀ ให้ต่ำที่สุดเท่าที่จะเป็นไปได้ หากเราลด R₀ ให้เหลือต่ำกว่า 1 การระบาดจะยุติลงไปเอง และหากเราลด R₀ ให้เหลือ 1.5 (ตัวเลขสมมติ) สัดส่วนประชากรที่ต้องมีภูมิคุ้มกันจะลดเหลือเพียง 33% หรือประมาณ 23 ล้านคนเท่านั้น

มึงว่ากูติดยังวะ?

รายงาน Report of the WHO-China Joint Mission on Coronavirus Disease 2019 (COVID-19) บอกกับเราว่าอาการส่วนใหญ่ของผู้ติดเชื้อจะมีไข้ และไอแห้งๆ และมักแสดงอาการในช่วง 5–6 วันหลังติดเชื้อ บางคนอาจไม่แสดงอาการเลย

อาการของโรค COVID-19(ข้อมูลจาก Report of the WHO-China Joint Mission on Coronavirus Disease 2019 (COVID-19))

กรมควบคุมโรคระบุว่าหากกลับจากพื้นที่เสี่ยงแล้วมีไข้ 37.5 องศาเซลเซียสขึ้นไป มีอาการไอ มีน้ำมูก หายใจเหนื่อยหอบ อย่างใดอย่างหนึ่งควรพบแพทย์ทันที

ระหว่างนี้เราจะดูแลตัวเองอย่างไร

องค์การอนามัยโลกแนะนำว่า สำหรับผู้ที่ไม่เคยเดินทางไปอยู่ในพื้นที่เสี่ยงควรจะ

  • ล้างมือบ่อยๆ การล้างมือด้วยน้ำสบู่ และแอลกอฮอล์ช่วยฆ่าเชื้อที่ติดอยู่บนมือของเราได้
  • รักษาระยะห่างกับคนรอบข้าง ควรอยู่ห่างจากคนรอบข้างที่มีอาการไอ หรือจามอย่างน้อย 1 เมตร
  • หลีกเลี่ยงการสัมผัสตา จมูก หรือปาก หากมือเราไม่สะอาด ไวรัสสามารถเข้าสู่ร่างกายเราได้ผ่านช่องทางเหล่านี้
  • ปิดปากเวลาไอหรือจาม ด้วยการพับข้อศอก หรือใช้ผ้าและทิชชู่ปิด
  • หากมีอาการไข้ ไอ หรือหายใจติดขัด ให้ไปพบแพทย์
  • ติดตามข่าวสารจากทางการ

สำหรับผู้ที่เดินทางไปในพื้นที่เสี่ยงในช่วง 14 วันที่ผ่านมา ควรปฏิบัติตัวเพิ่มเติมดังนี้

  • กักตัวอยู่บ้านจนกว่าจะหาย หากมีอาการไม่สบาย แม้เพียงเล็กน้อย เช่นปวดหัว คัดจมูก
  • หากมีอาการไข้ ไอ หรือหายใจติดขัด ให้ไปพบแพทย์ทันที

สำหรับในไทย สามารถติดตามข่าวสารและมาตราการต่างๆได้จากกรมควบคุมโรค

ในตอนต่อไป เราจะมาสร้างโมเดลทางคณิตศาสตร์เพื่อทำนายจำนวนผู้ติดเชื้อกัน ในระหว่างนี้หลีกเลี่ยงเลี่ยงการเดินทางที่ไม่จำเป็น ระมัดระวังเรื่องการแชร์ข่าวเท็จ ทั้งเรื่องพื้นที่เสี่ยงที่ไม่ได้รับการยืนยัน วิธีรักษาโรคแบบแปลกๆ มาตรการรัฐที่ยังไม่ได้ประกาศ ทั้งหมดทั้งมวลนี้เพื่อตัวเราเองและคนที่เรารัก

รักษาสุขภาพกันด้วยนะครับ Stay healthy, stay hygienic.

--

--

New Naveen
data น่าฟาด

Data Scientist at Infinitas by Krungthai, Science Blogger, Marathoner and Hamster Lover