เด็กตกงานเพราะเรียนไม่ตรงตามความต้องการ (เหรอ) ???

DSE4 Group5
Aug 21 · 4 min read

บทความนี้จัดทำขึ้นเพื่อเป็นส่วนหนึ่งของ Data Science Essential รุ่นที่ 4 ของ Botnoi Consulting Classroom กลุ่มที่ 5 หัวข้อ Data Analytics

source: https://board.postjung.com/1295185

จากสถานการณ์เชื้อไวรัสโคโรนาสายพันธุ์ใหม่ (Covid-19) ที่เริ่มระบาดในประเทศไทยช่วงต้นปี 2020 จนถึงปัจจุบัน ส่งผลให้ภาคธุรกิจต่างๆ ได้รับผลกระทบกันถ้วนหน้า และยังมีผลกับนักศึกษาจบใหม่ในปี 2020 และ 2021 ที่ไม่สามารถหางานทำได้ เพราะบริษัทต่างๆ ต้องการลดค่าใช้จ่ายลงเพื่อประคองธุรกิจให้ผ่านวิกฤตนี้ไปได้

โดยเฉพาะในกลุ่มปริญญาตรีของผู้สำเร็จการศึกษาในปี 2562 นั้นเผชิญภาวะการว่างงานเกือบครึ่งหนึ่ง (41.18%) อ้างอิงจากบทความ ‘ถ้า “เด็กตกงานเพราะเรียนไม่ตรงตามความต้องการของประเทศ” แล้วประเทศต้องการอะไร ไม่ต้องการอะไร?’ จาก IGNITE Thailand

Figure 1: สัดส่วนผู้สำเร็จการศึกษาของปีการศึกษา 2562 และการว่างงาน

ในทางกลับกัน เราก็ได้ยินมาว่าหลายๆ บริษัทไม่สามารถหาพนักงานเข้ามาทำงานได้ ซึ่งเป็นสิ่งตรงกันข้ามกับข้อมูลเรื่องการตกงานของนักศึกษาจบใหม่ที่ได้รับมา ดังนั้นเราจึงลองใช้ Data Analytic ในการหาคำตอบนี้กัน

โดยในส่วนของ Data Analytic นั้นจะแบ่งเป็น 5 ระดับด้วยกัน ได้แก่ Descriptive, Diagnostic, Predictive, Prescriptive, Cognitive & AI

Figure 2: รูปแบบการวิเคราะห์ข้อมูล

ซึ่งถ้าใครอยากจะเจาะลึกในแต่ละระดับมากขึ้นสามารถไปตามอ่านต่อได้ที่ “Data Analytics การวิเคราะห์เชิงลึก สถิติ และการวิเคราะห์” โดยระดับที่ทางทีมนำมาใช้ในการวิเคราะห์ครั้งนี้คือระดับ Descriptive

จุดประสงค์ของการทำ Data Analytic ของกลุ่มเราคือ ต้องการให้เกิดประโยชน์สำหรับนักเรียนม.ปลาย เพื่อใช้เป็นเเนวทางการตัดสินใจในการเลือกสาขาวิชาที่ถนัดและตรงกับตลาดเเรงงาน รวมถึงเป็นประโยชน์สำหรับภาครัฐบาลใช้ประกอบการวางแผนกลยุทธ์เพื่อลดปัญหาเด็กจบใหม่ที่ไม่มีงานทำ หรือจบมาไม่ตรงกับความต้องการของตลาดเเรงงานในสถานการณ์ปัจจุบัน โดยได้เเบ่งจุดประสงค์ออกเป็น 2 ประเด็น คือ

  1. หาความสอดคล้องหรือความสัมพันธ์ระหว่างจำนวนตำแหน่งงานสำหรับนักศึกษาจบใหม่ (Entry Level) ในแต่ละกลุ่มสาขาอาชีพ กับจำนวนนักศึกษาระดับปริญญาตรีที่เพิ่งสำเร็จการศึกษา
  2. หาสาขาวิชาที่ตลาดเเรงงานให้ความสนใจเป็นอย่างมาก พร้อมทั้งสายงานที่น่าจับตามองในภาวะวิถีปกติแบบใหม่ (New Normal)

Question and Assumption

Question 1 : ปัจจุบันนักศึกษาจบจากกลุ่มภาควิชาใดมากที่สุด

Assumption : คาดว่าเด็กส่วนใหญ่นิยมเข้าศึกษาในกลุ่มภาควิชาบริหารธุรกิจ เนื่องจากสามารถนำไปประกอบธุรกิจส่วนตัวหรือต่อยอดธุรกิจจากทางบ้านได้ มี ความต้องการของตลาดสูงเพราะธุรกิจหรือเศรษฐกิจเป็นสิ่งขับเคลื่อนประเทศและอาชีพอื่นๆ ยิ่งปัจจุบันเป็นยุคที่การค้าขายออนไลน์กลายเป็นส่วนหนึ่งของชีวิตไปแล้ว ทำให้อาชีพนี้ไปได้กว้างกว่าเดิมและหางานง่ายขึ้น

Question 2: ตำแหน่งงานในแต่ละกลุ่มอาชีพ กับจำนวนนักศึกษาจบใหม่ในระดับปริญญาตรี มีตำแหน่งที่ภาคธุรกิจเปิดรับ สอดคล้องกับนักศึกษาที่จบมาใหม่หรือไม่ และกลุ่มภาควิชาใดมีความต้องการของภาคธุรกิจมากที่สุด

Assumption : คาดว่าตำแหน่งงานกับจำนวนนักศึกษาจบใหม่ ยังไม่สอดคล้องกันเนื่องจากนักศึกษาตกงานจำนวนมาก ส่วนกลุ่มภาควิชาที่มีความต้องการมากที่สุด น่าจะเป็นกลุ่มงานในสายเทคโนโลยีที่มีการเติบโตสูง รวมกับสถานการณ์การเเพร่ระบาดของเชื้อไวรัส Covid-19 ที่มาเปลี่ยนแปลงการใช้ชีวิตของเราไป ก็ยิ่งเร่งให้เกิดการ Disruption เกือบทุกสายงานเลยทีเดียว

Data Preparation

การสร้างฐานข้อมูลเพื่อการวิเคราะห์ (Data Mart) เริ่มจากการรวบรวมข้อมูลจากแหล่งต่างๆ จากนั้นนำข้อมูลทั้งหมดที่เราได้ มาทำการคัดเลือก จัดเรียง จัดกลุ่ม และคัดกรอง เพื่อให้เราได้ข้อมูลที่มีความถูกต้องแม่นยำและเหมาะสมสำหรับการนำมาวิเคราะห์มากขึ้น โดยเราจะใช้ python เป็นเครื่องมือในการดำเนินการดังกล่าว

สำหรับฐานข้อมูลที่จะนำมาใช้ในการวิเคราะห์นั้น มีการรวบรวมมาจาก 2 แหล่ง โดยมีรายละเอียดและวิธีการดังนี้

1. ข้อมูลการผู้สำเร็จการศึกษาของปีการศึกษา 2562 จาก https://data.go.th/

ชุดข้อมูลจำนวนผู้สำเร็จการศึกษาปีการศึกษา 2562 ที่ถูกจำแนกตาม สถาบัน คณะ สาขาวิชา ระดับการศึกษา และเพศ จากสำนักงานปลัดกระทรวงการอุดมศึกษาวิทยาศาสตร์วิจัยและนวัตกรรม

และนี่คือตัวอย่างของ dataset ที่เราได้มาจาก https://data.go.th/dataset/univ_grd_11_01

Figure 3: ข้อมูลผู้สำเร็จการศึกษาของปีการศึกษา 2562

สำหรับข้อมูลชุดนี้ เราจะเจาะจงเฉพาะกลุ่มผู้สำเร็จการศึกษาในระดับ ปริญญาตรี และ ประกาศนียบัตรวิชาชีพชั้นสูง (ปวส.) เท่านั้น เนื่องจากกลุ่มปริญญาโทและเอก อาจจะเป็นกลุ่มที่มีงานทำอยู่แล้ว และมาเรียนต่อเพื่อหาความรู้เพิ่มเติม

Figure 4: Coding สำหรับการ filter ข้อมูล

เนื่องจากปริมาณของสาขาวิชามีเป็นจำนวนมาก เราจึงกำหนดกลุ่มอาชีพขึ้นมาจำนวน 11 กลุ่ม

Figure 5: 11 กลุ่มอาชีพ (source: www.flaticon.com)

จากนั้นก็ Keywords ของแต่ละกลุ่มอาชีพ เพื่อใช้เปรียบเทียบกับชื่อสาขาวิชา ว่าสามารถจัดเข้าไปยังกลุ่มอาชีพใดได้บ้าง

Figure 6: Categorized coding by keywords

โดยวิธีการจัดกลุ่ม จะทำการสร้าง Data Frame ใหม่ สำหรับเก็บผลลัพธ์ที่ตรวจสอบมาได้ ตามโค้ดด้านล่างนี้

Figure 7: Create data frame for classify data by faculty coding

ผลจากการแบ่งกลุ่มข้อมูลพบว่าได้ผลออกมาด้วยกัน 3 แบบ คือ

  1. สาขาวิชาที่ตรงกับ keywords แค่กลุ่มเดียว ก็จะจัดให้สาขานั้นอยู่ในกลุ่มอาชีพนั้นไปเลย
  2. สาขาวิชาที่ตรงกับ keywords มากกว่าหนึ่งกลุ่มขึ้นไป เช่น สาขาวิชาเศรษฐศาสตร์การเกษตร ถูกจัดอยู่ในกลุ่มการจัดการและกลุ่มการเกษตร เราจึงทำการจัดกลุ่มสาขาวิชาเหล่านี้อีกครั้ง ด้วยวิธี K-means และกำหนดสาขาที่น่าจะเป็นตามภาพรวมของกลุ่มนั้นๆ อีกที (หากใครสงสัยเกี่ยวกับ K-means สามารถอ่านเพิ่มเติมได้จาก https://medium.com/@Jutharath.Thankittikoon/what-is-k-means-clustering-ee36ab6f7638)
  3. สาขาวิชาที่ไม่ตรงกับ keywords กลุ่มใดๆ เลย ก็จัดเป็นกลุ่มอื่นๆ Etc. และไม่นำมาใช้ในการวิเคราะห์
Figure 8: Table classification data by program
Figure 9: K-mean clustering coding

2. ข้อมูลการรับสมัครงาน จากเว็บไซต์ JobsDB.com

ข้อมูลนี้ จะใช้วิธีการ Scraping จากบนหน้าเว็บไซต์เลย โดยเนื้อหาที่ดึงมาได้ จะมี ตำแหน่งงาน ความต้องการ สถานที่ทำงาน และหมวดหมู่ของตำแหน่ง จากนั้นก็จัดเก็บมาในรูปแบบไฟล์ csv เพื่อใช้ในการวิเคราะห์อีกครั้ง

การเตรียมข้อมูลจะคล้ายกับข้อมูลผู้สำเร็จการศึกษาโดยแบ่งกลุ่มงานออกเป็น 11 กลุ่ม โดยข้อมูลชุดนี้จะ focus เฉพาะกลุ่มงาน Entry level (ระดับพนักงานทั่วไป) เพื่อให้สามารถเปรียบเทียบกับข้อมูลนักศึกษาได้

ทั้งนี้ หากต้องการดูโค้ดเพิ่มเติม สามารถเข้าไปดูได้ที่: Project 1: Data Analysis.G5

จากนั้นจึงทำการเปรียบเทียบจำนวนนักเรียนที่จบการศึกษากับตำแหน่งงานที่เปิดรับสมัคร แต่เนื่องจากจำนวนข้อมูลของทั้ง 2 ชุดที่นำมาเปรียบเทียบมีจำนวนไม่เท่ากัน (นักศึกษา 350,000 คน ต่องานที่เปิดรับ 11,000 ตำแหน่ง) จึงทำการเทียบหน่วยเป็นร้อยละ เพื่อให้ตัวเลขอยู่ในฐานเดียวกัน

Figure 10: การเปรียบเทียบสัดส่วนร้อยละระหว่างจำนวนผู้จบการศึกษา และตำแหน่งงานที่เปิดรับสมัคร

จากทั้ง 11 กลุ่ม พบว่ากลุ่มในหมวด edu, tra, hea, agr หรือก็คือ Education, Travel, Health และ Agriculture น่าจะเป็นกลุ่มที่ตำแหน่งงานส่วนใหญ่อยู่ในส่วนของทางภาครัฐ หรืออาจจะไม่มีการประกาศรับสมัครงานทางเว็บไซต์ JobsDB ทางเราจึงตัดสินใจไม่นำกลุ่มดังกล่าวข้างต้นมาใช้ในการวิเคราะห์ เพราะจะทำให้หน่วยร้อยละที่เทียบไว้เปลี่ยนแปลงได้ และได้ผลลัพธ์ใหม่ดังภาพข้างล่างนี้

Figure 11: การเปรียบเทียบสัดส่วนร้อยละระหว่างจำนวนผู้จบการศึกษา และตำแหน่งงานที่เปิดรับสมัคร 7 กลุ่ม

Analysis and Finding Answers

Figure 12: สัดส่วนร้อยละจำนวนผู้จบการศึกษาตามภาควิชา

จากข้อมูลที่วิเคราะห์ สามารถตอบคำถามแรกข้างต้นได้ว่า นักศึกษาส่วนใหญ่จบจากกลุ่มภาควิชา Management, Social, Engineer ซึ่งถือว่าเป็นไปตามสมมติฐานที่ตั้ง และนี่ก็ถือได้ว่าเป็นกลุ่มภาควิชายอดฮิตแทบจะในทุกยุคของเด็กไทยเลยทีเดียว

Figure 13: การเปรียบเทียบสัดส่วนระหว่างจำนวนผู้จบการศึกษาและตำแหน่งงานที่เปิดรับสมัคร

ต่อมา จากคำถามที่สอง สามารถตอบได้ว่านักศึกษาจบใหม่กับตำแหน่งงานไม่สอดคล้องกัน เนื่องจากพบว่าสายงาน Social , Art , Science และ Architecture มีงานไม่พอรองรับกับนักศึกษาที่จบออกมาสู่ตลาด (หรืออาจจะเพราะข้อมูลตำแหน่งงานที่ได้รับมา ไม่ครอบคลุมเพียงพอ)

ส่วนสายงานในด้าน Technology มีความต้องการสูงและเปิดรับนักศึกษาจบใหม่จำนวนมากให้เข้ามาเป็นกำลังสำคัญในธุรกิจต่างๆ แต่นักศึกษาจบใหม่มีจำนวนน้อย เป็นไปตามสมมติฐานที่ตั้งไว้

เห็นได้ว่าตำแหน่งงานในสาย Technology ยังเป็นที่ต้องการของตลาดอีกจำนวนมาก มีความสอดคล้อง กับตลาดที่เข้าสู่ยุค Industry 4.0 สายอาชีพนี้จึงน่าจับตามองเป็นพิเศษ (สามารถศึกษาข้อมูลเพิ่มเติมเกี่ยวกับ Industry 4.0 ที่ https://www.i-scoop.eu/industry-4-0/) นอกจากจะมีตำแหน่งงานเปิดรับสมัครเยอะแล้ว ในส่วนของเงินเดือนก็ขอบอกว่าดีมากๆ อีกด้วย

ทางทีมจึงเห็นว่าควรวิเคราะห์ลึกลงไปอีก เพื่อพิจารณาถึงอาชีพต่างๆ ที่เปิดรับสมัครในสาย Technology เพิ่มเติม โดยได้ Top 10 ตำแหน่งงานในอาชีพสาย Technology

Figure 14: Top 10 สายงาน Technology

จากที่ดูในแต่ละสายงาน ก็ไม่ได้ต้องการแค่ความรู้ทางด้านเทคโนโลยีเพียงอย่างเดียว หากแต่ต้องการความรู้ด้านอื่นมาประกอบด้วย เช่น การบริหาร การติดต่อสื่อสาร หรือการวิเคราะห์ข้อมูล ทำให้นักศึกษาที่จบจากสาขาวิชาอื่นๆ สามารถพัฒนาความรู้เพิ่มเติมในด้านเทคโนโลยี และเข้ามาทำงานในสายนี้ได้ไม่ยากนัก ยกตัวอย่างเช่นอาชีพ Data Science ที่กำลังเป็นที่ต้องการของตลาดในระดับนึง เป็นอาชีพที่ต้องการความรู้หลายด้านประกอบกัน ตามภาพด้านล่าง

Figure 15: ตัวอย่างสายงานและความรู้ทางด้าน Data science (source: Botnoi Consulting)

ในทุกๆ วันนี้ บริษัทหลายๆ แห่งเริ่มไม่ได้สนใจวุฒิการศึกษาที่จบมาแล้ว โดยไปให้ความสำคัญกับทักษะที่สามารถทำได้ และความตั้งใจที่จะเรียนรู้สิ่งใหม่ๆ หากใครต้องการที่จะศึกษาหาความรู้ด้วยตัวเอง ทางเราขอแนะนำเว็บไซต์ดังนี้

  1. www.coursera.org
  2. www.edx.org
  3. www.udemy.com
  4. www.udacity.com

สำหรับใครที่สนใจด้าน Data Science เป็นพิเศษและไม่รู้จะเริ่มต้นยังไงทางทีมเราก็อยากจะขอแนะนำคลาส Data Science Essential จาก Botnoi Consulting คลาสสอน Data Science ที่สอนโดย Data Scientist ที่ปัจจุบันดำเนินมาถึงรุ่นที่ 4 แล้ว ใครสนใจสมัครก็สามารถไปติดตามได้ที่เพจ https://www.facebook.com/botnoigroup/

*หมายเหตุ ข้อมูลรับสมัครงานในบทความนี้มาจากเว็บไซต์ JobsDB เท่านั้น จึงเป็นข้อมูลเพียงส่วนหนึ่งที่นำมาใช้วิเคราะห์ มิใช่ข้อมูลการรับสมัครงานทั้งหมด

Especially thanks to data.go.th and Jobdb.th for valuable data

KNOWLEDGE IS POWER !!!

KEEP LEARNING !!!

botnoi-classroom

This publication consists of articles related to Data…

botnoi-classroom

This publication consists of articles related to Data science and AI written from Botnoi’s data scientists and students.

DSE4 Group5

Written by

botnoi-classroom

This publication consists of articles related to Data science and AI written from Botnoi’s data scientists and students.