สื่อสารอย่างไรให้ได้ใจคนแต่ละ Gen: เจาะลึกพฤติกรรมการรับข่าวสารของผู้คนด้วย data analytics

DSE4_G8
botnoi-classroom
Published in
7 min readAug 22, 2021

--

บทความนี้เป็นส่วนหนึ่งของ Botnoi Data Science Essential รุ่นที่ 4 Project 1 หัวข้อ Data Analytics

เมื่อก่อนเรารับข่าวกันยังไงนะ?

น่าจะเริ่มจากร้องป่าวประกาศ จากนั้นมีการพิมพ์ลงในหนังสือพิมพ์ ประกาศเสียงตามสาย ฟังวิทยุ มาจนกลายเป็นดูโทรทัศน์ และเริ่มส่งผ่านอุปกรณ์ที่ใช้อินเตอร์เน็ตได้อย่างคอมพิวเตอร์ และสมาร์ทโฟนอย่างในปัจจุบัน ยิ่งเทคโนโลยีก้าวหน้าเท่าไหร่ คนยิ่งเชื่อมต่อกันง่ายขึ้น ปริมาณข้อมูลข่าวสารที่เราเลือกรับได้ก็มีมากมายมหาศาลยิ่ง ๆ ไปอีก

แล้วเราจะรู้ว่าควรส่งข่าวแต่ละประเภทให้ถึงมือเป้าหมายที่เราต้องการได้อย่างไรกัน?

แน่นอนว่าช่วงวัยที่ต่างกันย่อมทำให้คนเรามีรสนิยมและพฤติกรรมหลายอย่าง
แตกต่างกัน พฤติกรรมการรับข่าวสารก็เป็นหนึ่งในนั้น การจะเลือกว่าช่องทางไหนจะสามารถสื่อสารข้อมูลออกไปได้ถูกคน ถูกที่ ถูกเวลา ถูกช่องทาง และมีประสิทธิภาพที่สุด ก็คงเป็นการคิดที่ต้องใช้ข้อมูลจำนวนเยอะมาก ๆ ดูด้วยตา ขยำด้วยมือก็คงลำบาก เลยต้องใช้เครื่องมือช่วยสักหน่อย

และนั่นสิ่งที่เรากำลังจะทำในโปรเจ็กชุดนี้!

พวกเราเป็นผู้เรียน Data Science Essential 4 กลุ่มที่ 8 ที่ต้องมารวมตัวกันแบบปุบปับ เราได้รับโจทย์ใหญ่คือ ให้ใช้ข้อมูลดิบจาก www.data.go.th มาทำการวิเคราะห์
เว็บนี้ถือเป็นศูนย์กลางข้อมูลเปิดภาครัฐ (Open Government Data) ซึ่งจัดทำโดยสำนักงานพัฒนารัฐบาลดิจิทัล (สพร.) (เป็นแหล่งข้อมูลที่หลากหลายทีเดียว แถมแจกให้เข้าถึงได้กันทุกคน ใครสนใจเรื่องอื่น ๆ ลองเข้าไปกด ๆ หา ๆ ดูก็ได้นะ)

หลังจากแยกย้ายกันไปดูข้อมูล เราเห็นตรงกันว่าจะทำเรื่องของการรับรู้ข้อมูลข่าวสารของคนแต่ละช่วงวัย เพื่อตอบข้อสงสัยที่ได้กล่าวมาแล้วข้างต้นโน้น ประกอบกับความอยากรู้เพิ่มเติมว่าในภาวะวิกฤติ Covid-19 เช่นนี้ เราจะทำยังไงให้ผู้คนได้รับข่าวสารที่จำเป็นกันอย่างถูกต้อง ทั่วถึง ทันเหตุการณ์

เอาล่ะ อยากรู้แล้ว ไปรู้จัก Data analytics และมาชำแหละข้อมูลชุดนี้ไปพร้อม ๆ กันเลย!

หมายเหตุ: เพื่อป้องกันความงง ในที่นี้เราจะใช้คำว่า gen แทน generation และ gen z, y, x, และ b แทน generation z, y, x, และ baby boomer ตามลำดับ

อะไรคือ Data analystics?

พูดแบบง่าย ๆ data analytics ก็คือศาสตร์ในการการวิเคราะห์ข้อมูลต่าง ๆ จากชุดข้อมูล (big data) เพื่อนำผลลัพธ์มาช่วยในด้านธุรกิจหรือวัตถุประสงค์อื่น ๆ ที่ต้องการ

ทำไมต้องทำ Data analystics?

เพราะถ้าเรากดเข้าไปดูข้อมูลแบบเก็บมาสด ๆ ดิบ ๆ ข้อมูลนั้น ๆ มักจะกระจัดกระจาย ไม่ก็มีมากมายมหาศาลจนคอมแทบค้าง ดูแล้วชวนให้มึนตึ้บ ตาลาย อยากจะเบือนหน้าหนี เลยต้องนำข้อมูลมารวบรวม จัดระบบระเบียบ และสกัดให้ได้ในสิ่งที่ต้องการ (ที่อ่านได้ง่ายไม่ตาลายแล้ว) ถ้าจะพูดให้เห็นภาพก็จะเป็นประมาณรูปด้านล่างนี้

แล้วกว่าจะทำให้ข้อมูลยุบยั่บนั่นกลายมาเป็นผลลัพธ์ที่นำไปใช้ตัดสินใจทางธุรกิจต่อได้มันมีขั้นตอนยังไงบ้างล่ะ? ไถอ่านต่อได้เล้ย

ขั้นตอนการทำ Data analytics คร่าว ๆ

ขั้นที่ 1: ตั้งจุดประสงค์ของการวิเคราะห์ — เราจะทำไปทำไม เอาคำตอบไปใช้ทำอะไรต่อ ตรงนี้ต้องระบุได้ชัดๆ ถามตัวเอง ถามทีมงานให้เคลียร์ๆ ถ้าขั้นแรกชัดเจน ขั้นต่อไปจะง่ายขึ้นมาก

ขั้นที่ 2: เก็บข้อมูล / รวบรวมข้อมูลดิบ — รวบรวมข้อมูลที่น่าจะตรงกับจุดประสงค์ที่ตั้งไว้

ขั้นที่ 3: การตั้งคำถามและสมมติฐาน — ขั้นตอนสำคัญที่ทำให้เราออกแบบการวิเคราะห์ได้ตรงเป้ายิ่งขึ้น

ขั้นที่ 4: การสร้างฐานข้อมูลเพื่อการวิเคราะห์ (data mart) ซึ่งประกอบไปด้วย
- การเลือกข้อมูล — ควรหยิบข้อมูลชุดไหนมาเพื่อวิเคราะห์และให้ได้คำตอบตามโจทย์ที่ตั้งไว้
- การจัดรูปแบบข้อมูลหรือแปลงข้อมูลมาให้อ่านง่ายและพร้อมใช้งาน
- การทำความสะอาดข้อมูล — นำข้อมูลที่ไม่ต้องการออก คัดคุณภาพ ปรับขนาดให้เท่ากัน ฯลฯ ทำให้นำข้อมูลมาใช้ได้อย่างเต็มเม็ดเต็มหน่วยมากขึ้น

ขั้นที่ 5: หาคำตอบจากข้อมูล — ทำข้อมูลที่เตรียมไว้แล้วข้างต้นมาวิเคราะห์ หาคำตอบว่าคำถามและสมมติฐานที่ตั้งไว้มั้ยนะ หรือมีอะไรอื่นใดน่าสนใจอีก

ขั้นที่ 6: สรุปผลการวิเคราะห์ — นำคำตอบมาสรุป และนำไปใช้ต่อตามวัตถุประสงค์ที่วางไว้ เป็นอันเสร็จสิ้น

ถ้าเข้าใจเรื่องกระบวนการแล้ว มาดูแต่ละขั้นตอนแบบละเอียดๆ กัน

มาทำ Data analytics ไปพร้อมกับเรากัน!

ขอบอกก่อนว่าเนื่องจากนี่เป็นโปรเจ็กที่เรามารวมตัวกันแบบเฉพาะกิจเพื่อทำตามโจทย์ที่ตั้งไว้ เพื่อความกระชับรวดเร็วในการทำงาน เราจึงแยกย้ายกันไปหาข้อมูลดิบที่น่าสนใจก่อน จากนั้นจึงค่อยกำหนดเป้าหมายและสมมติฐาน จึงขอสลับขั้นตอนที่ 1 กับ 2 เล็กน้อย กลายเป็นกระบวนการดังต่อไปนี้

ขั้นที่ 1: แยกย้ายกันไปรวบรวมข้อมูล

เราเลือกชุดข้อมูลจากเว็บไซต์ data.go.th และตกลงกันได้ว่าจะเลือกใช้ชุดข้อมูล “แบบสำรวจพฤติกรรมการใช้สื่อเพื่อการติดตามข่าวของคนแต่ละช่วงวัย รอบแรกปี 2562” เนื่องจากมีการเก็บข้อมูลในหลากหลายแง่มุม และน่าจะนำมาวิเคราะห์ต่อได้อีกเยอะ

ขั้นที่ 2: หาจุดประสงค์/เป้าหมาย

เมื่อได้ชุดข้อมูลแล้ว ก็มาหาเป้าหมายในการนำชุดข้อมูลไปใช้ พวกเราเห็นว่าในชุดข้อมูลนี้สามารถนำไปวิเคราะห์ในมุมมองของสื่อได้ เลยตกลงว่าจะนำมาวิเคราะห์เพื่อหาวิธีในการส่งข่าวให้ตรงกลุ่มเป้าหมายอย่างทั่วถึงและมีประสิทธิภาพมากที่สุด และถ้าเป็นไปได้ก็อยากให้บริษัทเอเจนซี่โฆษณาหรือผู้ที่สนใจนำไปใช้ประโยชน์ในการเผยแพร่คอนเทนต์ต่าง ๆ ได้ด้วย

ขั้นที่ 3: ตั้งคำถามและสมมติฐาน

เราลองสมมติตัวเองเป็นสำนักข่าวหรือคนที่อยากยิงข่าวให้กับคนกลุ่มหนึ่ง เราคงอยากรู้ว่ากลุ่มคนไหนสนใจข่าวอะไร ใช้แพลตฟอร์ม เเละอุปกรณ์อะไรในการรับข่าวสารมากที่สุด ซึ่งข้อมูลที่เลือกมาใช้จะบอกอะไรกับเราบ้างหล่ะ ทางกลุ่มเราจึงตั้งสมมติฐานขึ้นมา 3 ข้อใหญ่ Generation มีผลอย่างไรกับการใช้อุปกรณ์ แพลตฟอร์มเเละประเภทของข่าวสาร

จากการระดมความคิดว่าจะตั้งคำถามและสมมติฐานอย่างไรจึงจะตอบโจทย์เป้าหมายที่เราตั้งไว้ ก็ได้ความดังนี้

คำถามที่ 1 แต่ละ Gen มีผลอย่างไรกับการใช้อุปกรณ์ในการรับข่าว
เราได้สมมติฐานคือ
1.1) Gen Z น่าจะใช้อุปกรณ์ในการรับข่าวสารเป็นโทรศัพท์มือถือมากที่สุดในขณะที่ Gen B จะใช้โทรทัศน์ในการรับข่าวสารมากที่สุด

คำถามที่ 2: แต่ละ Gen มีผลอย่างไรกับการใช้ platform ในการรับข่าว มีสมมติฐานคือ
2.1) Gen Z น่าจะใช้แพลตฟอร์มTwitter ในการรับข่าวสารเป็นโทรศัพท์มือถือมากที่สุดในขณะที่ Gen X จะใช้แพลตฟอร์ม Facebook ในการรับข่าวสารมากที่สุด
2.2) Gen X มีความสนใจเข้า Pantip มากกว่า Gen อื่นๆ
2.3) Gen Y มีความสนใจฟัง Podcast มากที่สุด

คำถามที่ 3: แต่ละ Gen ให้ความสนใจข่าวแต่ละประเภทอย่างไรบ้าง สมมติฐานที่ตั้งไว้ก็คือ
3.1) Gen Z เพศชาย น่าจะสนใจข่าวการเมืองมากกว่า Gen Z เพศหญิง
3.2) Gen Z มีความสนใจในข่าวเทคโนโลยีมากกว่า Gen B
3.3) Gen Y มีความสนใจในข่าวต่างประเทศมากกว่า Gen X

เมื่อได้คำถามและสมมติฐานแล้ว ก็ไปหยิบข้อมูลมาลงมือวิเคราะห์ต่อได้ เริ่ม!

ขั้นที่ 4: สร้างฐานข้อมูลเพื่อการวิเคราะห์ (Data Mart)

ขั้นตอนนี้เป็นการนำข้อมูลดิบมาปรับเปลี่ยนและทำความสะอาดให้พร้อมสำหรับการนำไปใช้ในการวิเคราะห์ต่อไป ทางกลุ่มเราเลือกทำ Data Analytics แบบ Descriptive Analytics ซึ่งหมายถึงการวิเคราะห์เพื่อแสดงผลออกมาให้ง่ายต่อการเข้าใจ ในที่นี้คือเพื่อหาพฤติกรรมการบริโภคข่าวสารของคนแต่ละ Gen โดยจัดเตรียมชุดข้อมูลเพื่อการวิเคราะห์ตามขั้นตอนต่อไปนี้

<<ต่อไปนี้จะนำเสนอเฉพาะขั้นตอนสำคัญๆ ใครอยากดูโค้ดแบบเต็มๆ เข้าไปดูที่ link นะ>>

4.1) Import library ที่จะใช้ และโหลดชุดข้อมูลจาก Google drive

library (หรือบ้างก็เรียกว่า package) เหล่านี้จะให้เราเรียกใช้ฟังก์ชันที่จะใช้งานเฉพาะทางได้เลย เช่น การจัดการ dataframe (คือการแสดงผลข้อมูลในลักษณะคล้ายตาราง)หรือการพล็อตกราฟแบบต่าง ๆ กลุ่มของเราใช้เท่านี้

จากนั้นโหลดข้อมูลที่เลือกไว้ในขั้นตอนที่ 1 มาลงในรูปแบบของ CSV File แล้วจัดให้อยู่ในรูปแบบ dataframe ด้วย pd.read_csv()

4.2) ทำความสะอาดข้อมูล (Cleansing data)

แน่นอนว่าข้อมูลดิบที่เก็บมา มักมีอยู่หลายส่วนที่เราไม่ต้องการ หรือมีค่าว่าง หรือรูปแบบข้อมูลที่ผิดแผกไปจนอาจส่งผลต่อการวิเคราะห์ เช่น เกิดปี 3010 (นักเดินทางข้ามเวลา?) หรือสูง 1340 ซม. (เป็นไททัน?) เป็นต้น เราจึงต้องตัดส่วนเกินเหล่านี้ออก ซึ่งเราทำทั้งหมด 2 รอบ ได้แก่

ครั้งที่ 1
เราเห็นว่า จำนวน column ของข้อมูลหลัก มีส่วนที่ไม่สัมพันธ์กับข้อมูลอีกชุดที่มีไว้ถอดรหัส (data dictionary) จึงตัด column ที่ไม่ได้ใช้แน่นอนออกไป

ครั้งที่ 2
จากข้อมูลจะเห็นว่ายังมีข้อมูลที่เป็น NaN อยู่ เมื่อตรวจสอบแล้ว พบว่า column ที่มีค่า NaN คือตัวเลือกที่ผู้ตอบแบบสอบถามไม่ได้เลือกเข้ามาอยู่ใน 5 อันดับ เราจึงตัดออกไป จะได้ไม่นำมาคิดคะแนน (ขั้นตอนนี้หากดูตามใน colab จะอยู่ในช่วงของคำถามที่ 3)

ตัวอย่างข้อมูลที่ตัดข้อมูลที่เป็น NaN ออกไปแล้ว

4.3) แปลงข้อมูลและจัดรูปแบบ (data transformation)

เนื่องจากชุดข้อมูลที่เราได้มา มีไฟล์ที่สำคัญทั้งหมด 2 ไฟล์ ไฟล์แรกเป็นข้อมูลที่รวบรวมมาจากการตอบแบบสอบถาม (ไฟล์หลักที่เราจะใช้ในการวิเคราะห์) และไฟล์ที่ 2 คือ data dictionary

ภาพไฟล์ข้อมูลหลัก
ภาพไฟล์ dictionary

เราเลยเปลี่ยนข้อมูลหลักเป็นตัวหนังสือให้อ่านได้ง่ายขึ้น โดยอ้างอิงจากข้อมูลใน data dictionary ด้วยฟังก์ชัน .map() กลายเป็นตารางหน้าตาประมาณนี้

ต่อมา เราอยากเอาชุดข้อมูลมาเทียบเป็นเจน เราจึงแปลงปีเกิดและจัดกลุ่มออกมาเป็น Generation B, X, Y, และ Z

ตัวอย่างข้อมูลที่ได้หลังจากทำการจับกลุ่มประชากรตามปีเกิดให้ออกมาอยู่ในรูปแบบของ Generation

ในการแบ่ง Gen เราได้ลงความเป็นกันว่าจะใช้ทฤษฎีการแบ่งของ Williams (2011) เนื่องจากมีงานวิจัยอ้างอิงถึงความเหมาะสมของไลฟ์สไตล์คนไทย คือ

Gen B เกิดปีพ.ศ. 2507 ลงไป
Gen X เกิดระหว่างปีพ.ศ. 2508–2522
Gen Y เกิดระหว่างปีพ.ศ.2523–2540
Gen Z เกิดปีพ.ศ. 2541 ขึ้นมา

ข้อมูลเรื่อง generation จึงดูสมจริงและเหมาะสมกับคนไทยมากขึ้น

จากนั้น แปลงค่าข้อมูลที่จะนำมาคิดค่าแบบ Weight score เนื่องจากชุดข้อมูลที่ใช้ ได้ให้ผู้ตอบแบบสอบถามเลือกติ๊กแต่ละหัวข้อตามลำดับความชอบ (1–5) เราจึงแทนการให้คะแนนจากเดิมที่แสดงความชอบอันดับที่ 1–5 ซึ่งหมายถึงเรียงจากชอบมากไปน้อยตามลำดับ ด้วย score = 5, 4, 3, 2, 1 ซึ่งหมายถึงชอบมากจะได้คะแนนมากที่สุดแทน การคิดคะแนนแบบนี้ทำให้ผลการวิเคราะห์ละเอียดและแม่นยำกว่าการนำค่ามากที่สุดอย่างเดียวมาคิด (ตอนแรกไม่ได้ weight เป็นคะแนนออกมา แล้วกราฟออกมาเหมือน ๆ กันไปหมดเลย ขอแนะนำว่า อย่าหาทำจ้า)

ตัวอย่างข้อมูลที่ทำการ weight cases

4.4) การเลือกข้อมูล (data selection)

ในการนำไปวิเคราะห์ เราไม่ได้ใช้ข้อมูลทุก column จึงเลือกเฉพาะที่จะนำไปใช้จริงเท่านั้น ในที่นี้คือจะเลือกตามคำถามและสมมติฐานที่ตั้งไว้ เช่น คำถามแรกสนใจแค่ส่วนของ generation กับอุปกรณ์ที่ใช้รับข่าว เราจะเลือกมาคิดแค่สองส่วนนี้เท่านั้น แล้วก็ทำแบบนี้ไปจนครบทุกสมมติฐาน นี่เป็นเหตุผลว่าทำไมเราจึงต้องตั้งคำถามและสมมติฐานดี ๆ จะได้ไม่เสียแรงเปล่าในการเอาข้อมูลที่ไม่ต้องการมาคิดนั่นเอง

ขั้นที่ 5: การวิเคราะห์ข้อมูลเพื่อหาคำตอบ

ได้เวลาเอาชุดข้อมูลที่เตรียมไว้มาวิเคราะห์หาคำตอบกันแล้ว มาดูกันว่าจะตรงกับสมมติฐานที่เราตั้งไว้ไหม

แต่เดี๋ยวก่อนน! ก่อนจะไปดูผล เราขอเล่าถึงปัญหาในการทำงานส่วนนี้สักหน่อย

ลองเปรียบเทียบกราฟข้างต้น จะเห็นว่า แม้จะคิดด้วยข้อมูลชุดเดียวกันเป๊ะ ๆ แต่ผลที่ได้กลับต่างกัน เพราะอะไรน้า

เฉลยก็คือ เราพบว่าแต่ละ gen ก็มีจำนวนคนที่มาตอบแบบสอบถามไม่เท่ากัน การเอาคะแนนมาเทียบกันเลยคงจะไม่แฟร์เท่าไหร่ เราจึงหาจำนวนรวมของแต่ละ gen มาหารค่าความนิยมที่ได้ เพื่อทำให้ค่าต่าง ๆ ก็กลายเป็นค่าเฉลี่ยที่นำมาเปรียบเทียบกันได้แล้ว! เราเรียกสิ่งนี้ว่าการ Normalization

ภาพตารางก่อนหาค่าเฉลี่ย

ภาพตารางหลังหาค่าเฉลี่ยแล้ว

ต่อจากนี้เราจะทำการวิเคราะห์โดยหาค่าเฉลี่ย หรือ scaling แบบนี้ในทุกสมมติฐานเลย โกๆ

คำถามที่ 1: แต่ละ Gen มีผลอย่างไรกับการใช้อุปกรณ์ในการรับข่าว

จากกราฟ เราจะเห็นว่าอุปกรณ์ในการรับข่าวสารของเเต่ละ Gen อันดับที่ 1 คือ โทรทัศน์ รองลงมา ได้เเก่ Smartphone หนังสือพิมพ์ คอมพิวเตอร์ เเละวิทยุ ตามลำดับ ถ้าเรามองเจาะจงไปที่ Generation กับการใช้โทรศัพท์ในการรับข่าวสาร จะเห็นได้เลยว่า Gen Z มีการใช้ Smartphone ในการรับข่าวสารมากที่สุด รองลงมาคือ Gen X Gen Y เเละ Gen B ตามลำดับ ตรงกับสมมติฐานที่เราตั้งไว้

คำถามที่ 2: แต่ละ gen มีผลอย่างไรกับการใช้ แพลตฟอร์มในการรับข่าว

สมมติฐาน 2.1 Gen Z น่าจะใช้ Twitter ในการรับข่าวสารเป็นโทรศัพท์มือถือมากที่สุดในขณะที่ Gen X จะใช้ Facebook ในการรับข่าวสารมากที่สุด อันนี้สังเกตเอาเองจากคนรอบตัว

จากกราฟ เราจะเห็นว่าสมมติฐานกลับตาลปัตร (ตึ้ง!) กลายเป็น Gen X มีการใช้ Twitter มากที่สุดเเละ Gen Z มีการใช้ Facebook มากที่สุดแทน

มาต่อกันที่สมมติฐาน 2.2 Gen X มีความสนใจรับข่าวจาก Pantip มากกว่า Gen อื่น ๆ ครั้งนี้เราคัดมาแต่ชุดข้อมูลที่เกี่ยวข้อง ให้เห็นกันชัด ๆ กันไปเลย

จะเห็นได้ว่า กราฟการใช้ Pantip ของเเต่ละ Gen กลุ่มที่ใช้ Pantip อันดับหนึ่ง คือ GenZ 31.39%
รองลงมา คือ GenB GenX เเละ GenY 27.91%, 21.45%, 19.25% ตามลำดับ สรุปได้ว่า Gen Z มีความสนใจในการเข้า Pantip มากกว่า Gen อื่น ๆ ตรงตามสมมติฐานของเราไหม? ก็ไม่ (ฮา)

และเนื่องจากเดี๋ยวนี้ Podcast กำลังมาแรง เราเลยมาลองดูต่อไปอีกว่า Gen ไหนจะนิยมมากกว่ากันน้า

สมมติฐานที่ 2.3 GEN Y มีความสนใจฟัง podcast มากที่สุด

ปรากฏว่าความนิยมในการใช้ Podcast มากที่สุดคือ Gen B 41.62% รองลงมาเป็น Gen X, Gen Y เเละ Gen Z 23.0% 21.51% เเละ 13.87% ตามลำดับ เซอร์ไพรส์อีกแล้ว

คำถามที่ 3: แต่ละ Gen ให้ความสนใจข่าวแต่ละประเภทอย่างไรบ้าง

จากสมมติฐาน ข้อ 1 เเละข้อ 2 เราได้เห็นความสัมพันธ์ระหว่าง Gen กับอุปกรณ์ เเละแพลตฟอร์มกันไปเเล้ว เเล้ว Gen ไหนจะสนใจข่าวเเบบไหนบ้างล่ะ ครั้งนี้เราเลือกเพศมาเป็นส่วนหนึ่งของสมมติฐานด้วย เนื่องจากเห็นว่าแต่ละเพศก็น่าจะมีความชอบประเภทข่าวสารต่างกัน

เมื่อทราบว่าจะวิเคราะห์เรื่องอะไรแล้ว ครั้งนี้ขอลงลึกลงไปอีก โดยการตัดข้อมูล Gen ที่ไม่ได้เกี่ยวข้องออก แล้วดูแค่ที่มีในสมมติฐานแทน

ไปดูสมมติฐานและผลการวิเคราะห์ทั้งสามข้อของเรากันเลย

สมมติฐาน 3.1 Gen Z เพศชาย น่าจะสนใจข่าวการเมืองมากกว่า Gen Z เพศหญิง

เนื่องจากการเก็บข้อมูลของเราเก็บมาทั้งหมด 5 อันดับ เเต่โดยเฉลี่ยภาพรวมเเล้ว Gen Z เพศชาย มีความสนใจในข่าวการเมืองมากกว่า Gen Z เพศหญิง ด้วยเปอร์เซนต์เฉลี่ยที่ 51.21% ต่อ 48.79% ตรงกับสมมติฐานที่คิดไว้

และมองผลออกมาเป็นอันดับ โดยมองชายเทียบหญิงได้ดังนี้
ลำดับความชอบอันดับ 1 : 53.00% : 47.00%
ลำดับความชอบอันดับ 2 : 49.00% : 51.00%
ลำดับความชอบอันดับ 3 : 48.00% : 52.00%
ลำดับความชอบอันดับ 4 : 61.00% : 39.00%
ลำดับความชอบอันดับ 5 : 23.59% : 76.41%

สมมติฐาน 3.2 Gen Z มีความสนใจในข่าวเทคโนโลยีมากกว่า Gen B

จากกราฟ พบว่า Gen Z มีความสนใจข่าวเทคโนโลยีมากกว่า Gen B ที่ 52.24% ต่อ 46.76% อันนี้ตรงตามสมมติฐาน (คอนเทนต์แนว Tech ต้องมาละน้า)

และมองผลออกมาเป็นอันดับ โดยมอง Gen Z เทียบ Gen B ได้ดังนี้
ลำดับความชอบอันดับ 1 : 58.44% : 41.56%
ลำดับความชอบอันดับ 2 : 100% : 0.00%
ลำดับความชอบอันดับ 3 : 41.28%: 58.72%
ลำดับความชอบอันดับ 4 : 36.16%: 63.84%
ลำดับความชอบอันดับ 5 : 65.22% : 34.78%

สมมติฐาน 3.3 Gen Y มีความสนใจในข่าวต่างประเทศมากกว่า Gen X

เมื่อดูที่ความชอบอันดับ 1 และ 2 จะพบว่า Gen X มีความสนใจข่าวเทคโนโลยีมากกว่า Gen Y ที่ 50.78% ต่อ 49.22% (ผิดอีกแล้ว!)

และมองผลออกมาเป็นอันดับ โดยมอง Gen X เทียบ Gen Z ได้ดังนี้
ลำดับความชอบอันดับ 1 : 60.46% : 39.54%
ลำดับความชอบอันดับ 2 : 54.00% : 46.00%
ลำดับความชอบอันดับ 3 : 46.14% : 55.86%
ลำดับความชอบอันดับ 4 : 48.86% : 51.14%
ลำดับความชอบอันดับ 5 : 48.86% : 51.14%

ขั้นที่ 6: สรุปผลการวิเคราะห์ และการนำไปใช้ต่อยอด

ด้านการใช้อุปกรณ์ในการรับข่าวสาร
จากการวิเคราะห์ เราจะเห็นได้ว่าข้อมูลที่เก็บมานั้นเป็นไปในทิศทางเดียวกันในทุกช่วงวัย คือ อุปกรณ์รับข่าวสารยอดนิยมที่มาแรงแซงทางโค้งที่สุดก็ยังคงเป็น โทรทัศน์ คิดเป็น 45% รองลงมาคือ สมาร์ทโฟน ที่กำลังไล่ตามมาติด ๆ คิดเป็น 33% ตามด้วยหนังสือพิมพ์ 12% คอมพิวเตอร์ 6% และสุดท้ายคือ วิทยุ 4%

แม้โทรทัศน์จะมีท่าทีว่าจะเสื่อมความนิยมลง (ในความรู้สึกของเรา ๆ) แต่ก็ปฏิเสธไม่ได้ว่า ในแง่ของการรับชมข่าวสาร Free TV ที่สามารถดูได้ทั้งครอบครัวนั้น มีค่าใช้จ่ายน้อยกว่าการมีสมาร์ทโฟนที่ใช้ได้เพียง 1 คนต่อ 1 เครื่อง และพ่วงมาด้วยการเสียค่าอินเตอร์เน็ต และนอกจากในแง่ของค่าใช้จ่าย เราจะเห็นว่า โทรทัศน์ก็มีการปรับตัวกับยุคสมัยอยู่เสมอ ไม่ว่าจะเป็นการรวมความบันเทิงที่นอกเหนือจาก Free TV มาให้รับชมได้ (มีแอปฯ ดูช่องต่างประเทศ ดูหนัง ฟังเพลง และเล่นเกม) รวมถึงพัฒนาเรื่องภาพและเสียงที่คมชัดสมจริงจนขนลุก นี่อาจเป็นเหตุผลที่โทรทัศน์ยังคงเป็นที่นิยมสำหรับผู้คนทุกเพศทุกวัยอยู่

ดังนั้น ในภาพกว้าง ๆ ถ้าเป้าหมายของคุณต้องการสื่อสารไปยังผู้คนจำนวนมาก อุปกรณ์การรับข่าวสารที่เข้าถึงทุกเพศ ทุกวัย ยังคงควรสื่อสารผ่านโทรทัศน์อยู่ และพิจารณาสมาร์ทโฟนเป็นอันดับถัดมา

แต่เมื่อเราลองมาดูแบบแยกแต่ละเจนแล้ว จะสังเกตได้ว่า Gen Z นิยมใช้สมาร์ทโฟนมากกว่าเจนอื่น ๆ ในขณะที่ Gen B นิยมดูโทรทัศน์และอ่านหนังสือพิมพ์ ข้อสังเกตตรงนี้ทำให้เราเห็นว่า สมาร์ทโฟนก็เป็นทางเลือกที่น่าสนใจในการทำการตลาดกับคนอายุน้อย ๆ และน่าจะเป็นที่นิยมมากขึ้นตามช่วงวัยของ Gen Z ที่เติบโตขึ้นและราคาสมาร์ทโฟนในท้องตลาดที่ต่ำลง หากได้เปรียบเทียบข้อมูลที่เก็บจากปีอื่น ๆ อีก ก็จะทำให้เห็นแนวโน้มได้ชัดเจนยิ่งขึ้น

ด้าน Platform ที่ใช้ดูข่าว
ในตอนแรก เราเข้าใจว่า Gen Z จะใช้ Twitter เป็นหลัก แต่ 3 อันดับยอดนิยมสำหรับคนทุก Gen กลับเป็น Facebook YouTube และ Instagram ซึ่งคิดเป็น 43% 30% และ 7% ตามลำดับ ลักษณะเด่นของทั้ง 3 platform ดังกล่าวนี้ คือการสามารถโพสต์ได้ทั้งรูปภาพ วิดีโอ และไลฟ์สตรีมได้ ทำให้เราสามารถรับข่าวได้หลายรูปแบบและสามารถมีปฏิสัมพันธ์กับข่าวและคนที่กำลังรับข่าวพร้อมกันได้อีกด้วย (ดูทีวีทำไม่ได้นะเอ้อ) แต่สิ่งทำให้ Facebook นอนมาเป็นอันดับที่ 1 น่าจะเนื่องจากความครบเครื่องในเรื่องของรูปแบบการโพสต์และติดต่อสื่อสาร จึงเป็นที่นิยมมากกว่า Twitter ที่สามารถโพสต์ข้อความอย่างจำกัด เน้นที่ความรวดเร็วมากกว่า

ดังนั้นแล้ว หากต้องการส่งข้อมูลข่าวสารให้ทั่วถึงคนทุกวัย นอกจากส่งผ่านโทรทัศน์แล้ว ก็ควรพิจารณาใช้ Facebook และ Youtube เป็นอันดับต้น ๆ ด้วย

เมื่อลองเจาะสมมติฐานลงมาอีก ว่าแต่ละ Gen จะให้ความสนใจกับ Pantip ที่เคยโด่งดังอย่างมาก และ Podcast ที่กำลังเป็นที่นิยมในปัจจุบันอย่างไร ขอกระซิบก่อนว่าจากรายงาน Digital Start 2021 ฉบับเดือนเมษายน คนไทยฟัง Podcast สูงเป็นอันดับ 6 ของโลกเชียวนะ พอมาดู จากผลวิเคราะห์แล้ว เราต้องแปลกใจเมื่อพบว่า Gen Z นิยมใช้ Pantip ในการรับข่าวมากกว่า Gen B เสียอีก ในขณะที่ Gen B นิยมฟัง Podcast มากกว่า Gen อื่น ๆ อืมม ข้อมูลส่วนนี้ก็นำไปประกอบการตัดสินใจได้นะ ว่าจะจัดการอย่างไรกับการยิงเนื้อหาที่ต้องการให้ตรงกลุ่มเป้าหมายของเราได้อย่างไร

ด้านประเภทข่าว
เมื่อลองแยกพิจารณาเป็นเพศ ใน generation ที่น่าจะให้ความสนใจกับข่าวการเมืองอย่าง Gen Z แล้ว พบว่าในการลงความนิยมอันดับ 1 Gen Z เพศชายมีมากกว่าเพศหญิง แต่ในความนิยมอันดับสอง เพศหญิงกลับนิยมมากกว่าเพศชาย และเมื่อดูภาพรวมแล้วจะพบว่าทั้งสองเพศไม่ได้มีความนิยมในข่าวการเมืองแตกต่างกันอย่างมีนัยสำคัญมากนัก นี่เป็นเหตุผลว่าทำไมเราจึงควร Weight ค่าความนิยม แทนที่จะคิดจากความนิยมอันดับ 1 เพียงอย่างเดียวซึ่งให้ผลลัพธ์ที่มีความละเอียดน้อยกว่า

ส่วนสมมติฐานที่ 3.2 นี้ได้ผลตรงกับที่เราตั้งไว้ คือ Gen Z ให้ความสนใจข่าวเทคโนโลยี มากกว่า Gen B (ดูจากการลงคะแนนความสนใจที่อันดับ 1 และ 2) แน่นอนอยู่แล้ววัยนี้เค้าเกิดมาพร้อมกับเทคโนโลยีนี่นา

สมมติฐานที่ 3.3 พบว่า Gen X ให้ความสนใจข่าวต่างประเทศมากกว่า Gen Y เราจึงขอคิดว่า Gen X เป็นวัยที่เริ่มมีเงินทุน การชมข่าวต่างประเทศ ย่อมทำให้ทราบความเคลื่อนไหวต่าง ๆ ทั่วโลก ซึ่งอาจมีผลต่อเศรษฐกิจและการวิเคราะห์ประกอบการลงทุนก็เป็นได้

ผลการวิเคราะห์ในส่วนนี้ ช่วยให้ตัดสินใจได้ว่า หากต้องการส่งข้อมูลหรือเขียนคอนเทนต์ให้ตรงกลุ่ม ก็ควรเน้นเรื่องเกี่ยวกับเทคโนโลยีกับเหล่าวัยรุ่น และเรื่องความเคลื่อนไหวในต่างประเทศกับวัยผู้ใหญ่ที่ทำงานแล้วอย่างคน Gen X

และเพื่อตอบข้อสงสัยอีกข้อที่เราได้เกริ่นไปแล้วข้างต้น ในสถานการณ์ที่เกิดโรคระบาดเช่นนี้ ข้อมูลที่เราวิเคราะห์มาอาจช่วยเพิ่มช่องทางในการตัดสินใจเผยแพร่ข่าวสารที่จำเป็นได้ โดยควรส่งผ่านอุปกรณ์ที่ได้รับความนิยมสองอันดับแรกอย่างโทรทัศน์และสมาร์ทโฟน ส่วนแพลตฟอร์มออนไลน์ก็ควรเป็น Facebook Youtube และ Instagram เป็นหลัก เพื่อให้เข้าถึงผู้คนทุกเพศทุกวัยอย่างรวดเร็วที่สุด

อ่านมาถึงตรงนี้ หลายท่านอาจรู้สึกว่าผลการวิเคราะห์นั้นมันค่อนข้างขัดกับความรู้สึกอยู่บ้าง นั่นเป็นเพราะข้อมูลที่หยิบมาใช้นั้นเป็นข้อมูลที่เก็บจากแค่ช่วงเวลาหนึ่งของปี 2562 เท่านั้น และไม่มีการระบุว่ามีการเก็บข้อมูลอย่างไรบ้าง ดังนั้น หากต้องการผลการวิเคราะห์ที่แม่นยำและครอบคลุมมากขึ้น เราขอแนะนำว่าให้ใช้ข้อมูลที่มีการเก็บอย่างต่อเนื่องสม่ำเสมอมากกว่านี้และสามารถทราบได้ว่าเก็บมาอย่างไร มีการเก็บข้อมูลที่เพียงพอต่อการนำมาเป็นตัวแทนในการวิเคราะห์หรือไม่ เพื่อให้ได้ผลการวิเคราะห์ที่แม่นยำมากขึ้น และอาจนำไปต่อยอดเป็นการวิเคราะห์แบบพยากรณ์ (Predictive analytics) และการวิเคราะห์แบบให้คำแนะนำ (Prescriptive analytics) ต่อได้อีกด้วย

แต่ทั้งนี้ทั้งนั้น พวกเราก็ได้แสดงให้เห็นแล้วว่า กระบวนการ Data analytics นั้น สามารถทำให้ข้อมูลจำนวนมาก ๆ นั้นกลายเป็นผลลัพธ์ที่นำไปสู่การตัดสินใจในขั้นต่อไปได้อย่างไร และหวังว่ากระบวนการดังกล่าวนี้จะถูกนำไปใช้ในวงการธุรกิจ รวมถึงวงการอื่น ๆ ในประเทศอย่างเป็นวงกว้างมากขึ้นอีก เพื่อที่ภาคธุรกิจและอุตสาหกรรมต่าง ๆ จะได้พัฒนาต่อไปอย่างมีประสิทธิภาพมากขึ้น โดยใช้แรงน้อยลง ซึ่งน่าจะส่งผลดีต่อเศรษฐกิจภายในประเทศอย่างมาก

ได้ยินมาว่า พวกเราก็ได้มารวมกันจากการจัดกลุ่มด้วย data analytics เช่นเดียวกัน ทางทีมงานคละประสบการณ์และความสามารถของสมาชิกในทีมมาได้อย่างลงตัวมากจริง ๆ

อ้างอิง
คำถามที่พบบ่อย (FAQ) เกี่ยวกับ Big data และ Data analytics
สแกนนิสัย “คน 4 เจเนอเรชั่น” แม้ต่างกันก็อยู่ร่วมกันได้

อ้างอิงรูปภาพ

<a href=’https://www.freepik.com/vectors/logo'>Logo vector created by quinky — www.freepik.com</a>

<a href=’https://www.freepik.com/vectors/technology'>Technology vector created by starline — www.freepik.com</a>

<a href=’https://www.freepik.com/vectors/people'>People vector created by rawpixel.com — www.freepik.com</a>

--

--

DSE4_G8
botnoi-classroom

A group of data science students, studying Botnoi Data Science Essential course :)