https://static.euronews.com/articles/stories/04/53/88/74/1440x810_cmsv2_e91b01ff-7daf-548c-be95-85028b44a6e4-4538874.jpg

วิเคราะห์สาเหตุการแพ้การเลือกตั้งปี 2020 ของ Donald Trump ด้วย data analytic By DSE#2_G9

jaiko neko
botnoi-classroom
Published in
5 min readNov 24, 2020

--

1. จุดประสงค์ของการทำ Data Analytic คืออะไร

เพื่อหาสิ่งที่ทำให้ Donald Trump แพ้การเลือกตั้ง โดยวิเคราะห์ข้อมูลจาก 2 พรรค ( พรรค DEMและพรรค REP)

2. การเก็บข้อมูล/รวบรวมข้อมูลดิบ

  • 2.1. ข้อมูลการเลือกตั้งปี 2020

2.1.1. ข้อมูลผลการเลือกตั้งปี 2020 (https://www.kaggle.com/unanimad/us- election-2020) เลือกข้อมูลผลการเลือกตั้งระดับCounty(president_county_candidate.csv)

2.1.2. ข้อมูล Electoral Votes ปี 2020 (https://www.kaggle.com/daithibhard/us-electoral-college-votes-per-state-17882020)

  • 2.2. ข้อมูลการเลือกตั้งปี 2016

2.2.1. ข้อมูลผลการเลือกตั้งปี 2016 เลือกข้อมูลผลการเลือกตั้งระดับ County (president_county_candidate.csv)

2.2.2. ข้อมูล Electoral Votes ปี 2016 (/kaggle/input/2016uspresidentialvotebycounty/pres16results.csv)

  • 2.3. ข้อมูลประชากร (Gender, Human Race) ระดับ County จากเว็บไซต์ United States Census Bureau

Population dataset population dataset: https://www.census.gov/data/tables/time-series/demo/popest/2010s-counties-detail.html
file layout: https://www2.census.gov/programs-surveys/popest/technical-documentation/file-layouts/2010-2019/cc-est2019-alldata.pdf

  • 2.4. ข้อมูล State Name (https://www.kaggle.com/stansilas/us-state-county-name-codes)

3. การตั้งคำถาม ตั้งสมมติฐาน

จากข้อมูลที่เลือกมาวิเคราะห์ ทางทีมตั้งข้อสมมติฐานออกเป็น 2 ข้อ ที่ส่งผลให้ Trump แพ้ในการเลือกตั้งปี 2020 (โดยข้อมูลที่นำมาใช้จะเป็นข้อมูลการเลือกตั้งในปี 2016 กับปี 2020) ดังนี้

  1. รูปแบบของประชากรที่เปลี่ยนไป ส่งผลให้คะแนนการเลือกตั้งมีการเปลี่ยนแปลง โดยหัวข้อประเด็นของประชากรที่เปลี่ยนแปลง แบ่งแยกเป็น 3 กลุ่มย่อย คือ

1.1 New Voters ประชากรที่มีสิทธิในการเลือกตั้งกลุ่มใหม่ที่ไม่เคยโหวตมาก่อน

เนื่องจากนโยบายหลักของ Biden ให้ความสำคัญกับ climate change ในขณะที่ Trump ไม่ได้มองว่าเรื่องนี้เป็นสิ่งสำคัญที่ต้องจัดการลำดับแรกๆ (จากข้อมูล https://www.voanews.com/2020-usa-votes/climate-change-one-bidens-top-priorities ) เมื่อนำมาประกอบกับการเรียกร้องเรื่องภาวะโลกร้อนของ Greta Thunberg ที่มีอิทธิพลกับวัยรุ่นอเมริกา การถอนตัวออกจาก the Paris Climate Agreement และ การที่กลุ่มวัยรุ่นยื่นฟ้องรัฐบาลสหรัฐที่ไม่ใจในปัญหานี้ (จากแหล่งข่าว https://www.reuters.com/article/us-climate-change-thunberg-protests/teenage-activist-greta-thunberg-takes-climate-protest-to-trump-idUSKCN1VY1WA) สามารถสันนิษฐานเบื้องต้นได้ว่า กลุ่มวัยรุ่นที่เป็น new vote มีแนวโน้มจะเลือก Biden ที่ใส่ใจในเรื่องภาวะโลกร้อนมากกว่า

1.2 Gender Ratio อัตราส่วนของเพศ

เนื่องจากนโยบายต่างๆของ Trump ที่แสดงออกถึงความไม่เท่าเทียมกันทางเพศ อย่าง การไม่ให้เพศทางเลือกเข้ารับการเป็นทหาร หรือมักจะไม่ให้เกียรติผู้หญิง ซึ่งเราเห็นกันบ่อยๆในทวิตเตอร์ อาจทำให้เป็นสาเหตุที่เกิดการเทคะแนนเสียงจากผู้หญิงและเพศทางเลือกไปเลือกไบเดนแทน ดังนั้นถ้ามีอัตราส่วนของประชากรหญิงที่เพิ่มขึ้น เท่ากับว่ามีโอกาสที่คะแนนเสียงของไบเดนจะเพิ่มขึ้นด้วยเช่นกัน

1.3 Races เชื้อชาติ

จากมุมมองที่ Trump มีต่อเชื้อชาติอื่นผ่านความคิดเห็นในทวิตเตอร์หลายๆครั้ง อย่างเช่น

จากทวิตนี้แสดงให้เห็นได้อย่างชัดเจนว่า Trump เหยียดชนชาติผิวสี ยิ่งในยุคที่เรื่องของ diversity มีความชัดเจนและเป็นที่ยอมรับมากขึ้น ยิ่งทำให้ภาพลักษณ์ของ Trump ยิ่งแย่ และมีความเป็นไปได้ว่า Trump อาจจะไม่ได้รับคะแนนเสียงจากคนที่ไม่ใช่ชนชาติอเมริกาโดยกำเนิด

2. การที่คู่แข่งของ Trump รอบนี้เป็น Biden ซึ่งทั้งคู่เป็นเพศชายเหมือนกัน จึงมีโอกาสเป็นไปได้ว่า คะแนนเสียงจากฝั่งผู้ชายอาจจะเปลี่ยนใจไปเลือก Biden แทน Trump ซึ่งผิดกับปี 2016 ที่ Trump แข่งกับ Hillary ซึ่งเป็นการแข่งระหว่าง ชายกับหญิง ดังนั้นหากดูจากคะแนนรัฐเดิมที่ Hillary ได้คะแนนเทียบกับ Biden แล้วคะแนน Biden ได้สูงกว่าและคะแนนฝั่ง Trump ลดลง มีความเป็นไปได้ว่า คะแนนที่เพิ่มขึ้นอาจมาจากคะแนนเพศชายที่เปลี่ยนใจหันมาเลือก Biden (ในกรณีที่รัฐนั้นมีอัตราของ new vote ที่เป็นเพศหญิงกับชายไม่ได้มีอัตราการเพิ่มอย่างผิดปกติ)

4. การสร้างฐานข้อมูลเพื่อการวิเคราะห์ (Data Mart)

การเลือกข้อมูล

เนื่องจากข้อมูลผลการเลือกตั้งปี 2020 และปี 2016 มีไม่ครบถ้วนทั้ง County และ State จึงทำการเลือกมาเฉพาะข้อมูลจาก County และ State ที่มีเหมือนกัน

การจัดรูปแบบและการ clean ข้อมูล

1. Drop column ที่ไม่ได้ใช้

2. เปลี่ยนชื่อ column เพื่อให้ชื่อ column consistent ระหว่างข้อมูลเลือกต้ังปี 2020 และ 2016

3. Drop sample ที่ไม่มีข้อมูล state หรือ county

4. ใช้ชื่อเต็มของ state แทน abbreviation

ทำการลบ column ที่ไม่ได้ใช้ จากตัวแปรชื่อ pres_2016 ที่เก็บไฟล์ pres16results.csv จากนั้น เปลี่ยนชื่อ column เพื่อให้ชื่อ column สอดคล้องกันระหว่างข้อมูลเลือกต้ังปี 2020 และ 2016 และ Drop sample ที่ไม่มีข้อมูล state หรือ county สุดท้ายทำการ ใช้ชื่อเต็มของ state แทนชื่อย่อ

อัตราการเปลี่ยนแปลง New Voter, Gender, Human Race ของแต่ละรัฐ

จากผลการวิเคราะห์จะเห็นได้ว่าประชากรกลุ่ม non-white มีจำนวนเพิ่มขึ้นในทุกรัฐ

5. การหาคำตอบจากข้อมูล

คำถาม : ทำไม Donald Trump ถึงแพ้การเลือกตั้งปี 2020

จากข้อมูลทางทีมได้สมมติฐานเพิ่มขึ้นอีก 1 ข้อ

สมมติฐานเพิ่มเติม :

สมมติฐาน : Trump เสีย State ซึ่งเคยเป็นฐานเสียงเมื่อการเลือกตั้งปี 2016

คำตอบ: Trump เสีย 5 รัฐใหญ่ (Electoral Votes สูง) [‘Michigan’, ‘Georgia’, ‘Wisconsin’, ‘Pennsylvania’, ‘Arizona’] ให้กับ DEM ในปี 2020

จากสมมติฐานเพิ่มเติมทำให้เกิดคำถามเชื่อมโยงกับสมมติฐานตั้งต้น ดังนี้

อะไรทำให้คะแนน Vote ภายใน State ที่เคยเป็นฐานเสียงของ Trump เมื่อการเลือกตั้งปี 2016 เปลี่ยน

สมมติฐาน :

- 1. รูปแบบประชากรเปลี่ยนไป

1.1. New Voters

คำตอบ: จำนวน New Voters บางรัฐเพิ่มขึ้นอย่างมีนัยยะ

1.2. Gender Ratio

คำตอบ: Gender Ratio ไม่ได้เปลี่ยนแปลงมากจากปี 2016 ไม่น่าจะส่งผลกับผลการเลือกตั้ง

1.3. Races

คำตอบ: จำนวน NON-WHITE ภายใน 5 รัฐนั้นเพิ่มขึ้นจากปี 2016

- 2. เพศของ Candidate จากฝั่ง DEM (ฝั่ง Biden)

2.1. Voters หันมาเลือก DEM เพราะ Candidate เป็นผู้ชาย คาดว่า Voters ผู้ชายจะโหวตให้กับ Candidate ผู้ชาย

คำตอบ: เนื่องจาก Gender Ratio ไม่ได้เปลี่ยนแปลงมากจากปี 2016 เพศของ Candidate ไม่น่าจะส่งผลต่อการตัดสินใจ

ค้นหาว่าใครชนะในแต่ละ Country โดยได้ผลลัพธ์ว่า Trump จากพรรค REP ชนะทั้งหมด 2564 และ 2605 ในปี 2020 และปี 2016 ตามลำดับ แต่จำนวนผลโหวตทั้งหมดของ Biden นั้นกลับนำขึ้นมาชนะจาก 52,661,615 คะแนนต่อ 40,297,889 คะแนน

จากการค้นหาว่าใครนั้นชนะในแต่ละ state ปรากฏว่า Trump ชนะใน 24 state มากกว่า Biden ที่ชนะเพียง 20 stateเท่านั้น

แต่เนื่องจากแต่ละ state มีจำนวนผู้แทนไม่เท่ากัน ทำให้ผลรวมจำนวนผู้แทนของ Biden มีจำนวน 273 เสียง โดยที่ Trump กลับได้จำนวน 229 เสียงเท่านั้น

county ไหนที่ส่งผลให้เกิดการเปลี่ยนแปลง

จากผลลัพธ์ในปี 2016 จะเห็นได้ว่า Trump จะชนะในรัฐ Arizona รัฐ Michigan รัฐ Pennsylvania และรัฐ Wisconsin แต่ผลลัพธ์ในปี 2020 กลับกลายเป็น Biden ชนะทั้งหมด

ในรัฐ Arizona จากกราฟข้อมูลมีการเปรียบเทียบจำนวนประชากรเพศชายและเพศหญิง ระหว่างปี 2016 กับ ปี2020
ในรัฐ Arizona จากกราฟข้อมูลมีการเปรียบเทียบจำนวนประชากรโดยแบ่งตามเชื้อชาติ ระหว่างปี 2016 กับ ปี2020

6.การสรุปผล

6.1. ข้อมูล States ที่ไม่ได้นำมาวิเคราะห์คือ state ที่ไม่ได้มีผลการเปลี่ยนแปลงจึงไม่ส่งผลต่อการวิเคราะห์ ประกอบด้วย state ดังนี้

  1. Alaska
  2. Connecticut
  3. Maine
  4. Massachusetts
  5. New Hampshire
  6. Rhode Island
  7. Vermont

6.2. การที่จะชนะ State ต้องชนะด้วยคะแนน Popular Votes
**Compare number of winning counties in these states**

ถึงแม้ว่า Donald Trump จะชนะในหลาย counties แต่จำนวนประชากรภายใน counites เหล่านั้นมีน้อยทำให้คะแนน Votes น้อยและไม่สามารถ ชนะ State ได้

6.3. การชนะการเลือกตั้ง ต้องชนะด้วย Electoral Votes

ถึงแม้ว่า Trump จะชนะหลาย state แต่ใน state เหล่านั้นมีคะแนน Electoral vote น้อย ส่งผลให้ Trump ยังคงแพ้การเลือกตั้ง

6.4. Trump เสีย 5 รัฐใหญ่ (Electoral Votes สูง) [Michigan, Georgia, Wisconsin, Pennsylvania, Arizona] ให้กับ DEM ในปี 2020
Biden ชนะ 14 รัฐใหญ่จาก 20

State Votes

(Biden) 0 California 55.0

(Trump) 1 Texas 38.0

(Trump) 2 Florida 29.0

(Biden) 3 New York 29.0

(Biden) 4 Illinois 20.0

>>> 5 Pennsylvania 20.0 ( state ที่เปลี่ยนมาเลือก Biden )

(Trump) 6 Ohio 18.0

>>> 7 Georgia 16.0 ( state ที่เปลี่ยนมาเลือก Biden )

>>> 8 Michigan 16.0 ( state ที่เปลี่ยนมาเลือก Biden )

(Trump) 9 North Carolina 15.0

(Biden) 10 New Jersey 14.0

(Biden) 11 Virginia 13.0

(Biden) 12 Washington 12.0

(Trump) 13 Tennessee 11.0

(Trump) 14 Indiana 11.0

>>> 15 Arizona 11.0 ( state ที่เปลี่ยนมาเลือก Biden )

(Biden) 16 Massachusetts 11.0

(Biden) 17 Minnesota 10.0

(Biden) 18 Maryland 10.0

(Trump) 19 Missouri 10.0

>>> 20 Wisconsin 10.0 ( state ที่เปลี่ยนมาเลือก Biden )

6.5. สิ่งที่ทำให้คะแนน Vote ภายใน State ที่เคยเป็นฐานเสียงของ Trump เมื่อการเลือกตั้งปี 2016 เปลี่ยน
ข้อสมมติฐาน (แต่ไม่สามารถใช้ผลการวิเคราะห์นี้มาเป็นหลักฐานยืนยันข้อสมมติฐานนี้ได้เนื่องจากไม่มีข้อมูลมายืนยันว่าประชากรเลือกใคร จึงทำได้เพียงสันนิฐานตามข้อมูล)

1. New Voter

> จำนวน New Voter เพิ่มมากขึ้น มีความเป็นไปได้ว่าพวกเค้าโหวตเลือก DEM

2. Human Race

> จำนวน NON-WHITE เพิ่มมากขึ้น มีความเป็นไปได้ว่าพวกเค้าโหวตเลือก DEM เนื่องจากนโยบายของ DEM ค่อนข้างจะยืดหยุ่นให้กับคนเหล่านี้

3. อาจมี Voter บางส่วนที่ไม่ชอบการทำงานของ Trump และหันไปเลือก DEM

หากใครต้องการดู source code และการวิเคราะห์แบบเนื้อเน้นๆ ตามไปดูได้ที่ลิงค์นี้เลยค่า https://www.kaggle.com/lucksikalos/us-election-eda

References:

  1. Population dataset population dataset: https://www.census.gov/data/tables/time-series/demo/popest/2010s-counties-detail.html
  2. file layout: https://www2.census.gov/programs-surveys/popest/technical-documentation/file-layouts/2010-2019/cc-est2019-alldata.pdf
  3. https://thestandard.co/us-election-2020/

--

--