แชร์การเตรียมตัวและคำแนะนำในการสอบ Google Cloud Certification: Data Engineer ปี 2024 (อัพเดทข้อสอบใหม่ Nov 2023)

Burasakorn Sabyeying
Mils’ Blog
Published in
5 min readDec 28, 2023
trying to remember all data services in GCP

บทความต้อนรับปี 2024 ด้วยการแชร์ประสบการณ์ที่เราไปสอบ Professional Google Cloud certifications: Data Engineer มาเมื่อไม่นานมานี้

ล่าสุดในปี 2023 ข้อสอบนี้เป็นข้อสอบที่ถูกปรับปรุงตัวข้อสอบให้ทันสมัยขึ้นโดยเปิดเป็น Beta ระยะหนึ่ง ซึ่งเป็นการสอบที่เพิ่มจำนวนข้อสอบและเปิดให้ผู้สมัครสอบฟีดแบ็คข้อสอบได้ โดยข้อดีคือได้ราคาถูกลงกว่าราคาปกติ แต่ข้อเสียคือสอบนานขึ้นถึง 4 ชม.จากปกติ 2 ชม. และได้ผลสอบช้า 6–8 weeks

จนกระทั่งเขาได้ผลตอบรับในการปรับปรุงเรียบร้อย แล้วก็ปรับมาเป็น General Availability ตั้งแต่วันที่ 13 November 2023 ซึ่งเป็นข้อสอบที่เราไปสอบมาค่ะ

ซึ่งข้อสอบแบบใหม่ แตกต่างจากข้อสอบเก่าพอสมควร เราเลยถือโอกาสมาเล่าให้ฟังในการเตรียมตัวและคำแนะนำการไปสอบ เผื่อว่าใครที่กำลังวางแผนจะไปสอบได้อุ่นใจมากขึ้น (เราเข้าใจคุณ เพราะเราก็เคยเคว้ง) หรือใครที่สงสัยว่าควรสอบดีไหม เป็นสิ่งจำเป็นรึเปล่า เราทิ้งความเห็นส่วนตัวไว้ท้ายๆค่ะ

Table of contents:

- Certification นี้คืออะไร วัดอะไร ต่างจากแบบเดิมยังไง?
- สนามสอบ
- การเตรียมตัวและอ่านหนังสือ
- คำแนะนำในการสอบ
- ของรางวัล
- ความเห็นส่วนตัวเรื่อง certification

Certification นี้คืออะไร วัดอะไร ต่างจากแบบเดิมยังไง?

ถ้าพูดถึง Google Cloud Certifications ละก็ หลักๆมี 3 ประเภทค่ะ

  1. Cloud Digital Leader
  2. Associate Cloud Engineer
  3. Professional Google Cloud Certifications

ซึ่งถ้าใครกำลังชั่งใจว่าตัวเองเหมาะกับข้อสอบตัวไหนอยู่ แนะนำ diagram ด้านล่างเลยค่ะ

ref https://cloud.google.com/blog/topics/training-certifications/which-google-cloud-certification-exam-should-you-take

ซึ่งตัวที่เราสอบเป็น Professional Google Cloud Certifications

These certifications are ideal for candidates with in-depth experience working hands-on setting up cloud environments for organizations based on their business needs, and have experience deploying services and solutions.

โดยตัว Professional มีหลากหลายแขนงมาก ตั้งแต่ Cloud Architect, Machine Learning Engineer, DevOps Engineer etc. ซึ่งตัวที่เราสอบมาคือ Data Engineer ค่ะ

จากคำนิยามใหม่ของ certification ตัวนี้

A Professional Data Engineer makes data usable and valuable for others by collecting, transforming, and publishing data. This individual evaluates and selects products and services to meet business and regulatory requirements. A Professional Data Engineer creates and manages robust data processing systems. This includes the ability to design, build, deploy, monitor, maintain, and secure data processing workloads.

โดยการวัดผลจะตรงตามนิยามที่เขาให้เลย ซึ่งแบบใหม่จะไม่เน้น Machine Learning แล้ว เมื่อเทียบกับนิยามตัวเก่า

รายละเอียดอื่นๆ

  • เขา recommend ประสบการณ์ขั้นต่ำ 3 ปีใน industry โดยรวม 1+ ปีในการ design และ manage solution โดยใช้ Google Cloud
  • ข้อสอบจะเป็น 50 ข้อ เป็น multiple choices ใช้เวลา 2 ชม.
  • สอบเสร็จจะรู้ผลทันที แล้วได้อีเมลล์ตอบกลับเพื่อคอนเฟิร์มอีกครั้ง
  • การสอบเลือกสอบได้ 2 แบบค่ะ คือแบบ online-proctor หรือ test-center

ส่วนตัวเราเลือกเป็น test center เนื่องจากไม่อยากเซ็ตอัพสนามสอบที่บ้านค่ะ อยากได้ฟีลไปสอบนอกบ้านเหมือนกลับมาเป็นนักเรียน ตื่นเต้นดี55555

สนามสอบ

สามารถเช็คจากเว็บ Kryterion ได้ว่ามีจุดสอบที่ไหนบ้าง

ณ เวลาที่เขียนบล็อกนี้ สนามสอบมี 3 จุดค่ะมีเฉพาะแค่ในกรุงเทพ

  1. Trainocate Thailand → ที่ Central World
  2. The Enterprise Resource Training → ตึกชาญอิสระ 2 ถนนเพชรบุรี แถวเอกมัยค่ะ
  3. Technical Inspection and Verification Co → แถวนนทบุรี

ซึ่งสนามที่เราไปมาคือ Enterprise Resource Training

การเตรียมตัวและอ่านหนังสือ

1.** สำคัญมากๆ** Official Exam guide ที่บอกว่าจะออกอะไร เรื่องอะไรบ้าง

ในนี้จะวัดเรื่องอะไรบ้าง ซึ่งเขาบอก % ที่ออกของ exam เลย ขออนุญาติสรุปโดยย่อจากเว็บอีกทีเพื่อให้เห็นภาพ

Designing Data Processing System (~22% of exam)

  • Security (Cloud IAM, encryption and key management, Cloud DLP)
  • Prepare data (Dataprep, Dataflow, Data Fusion)
  • Data Migration (BigQuery Data Transfer Service, Transfer Appliance, Datastream, Cloud Networking)
  • etc

Ingest and process data (~25% of exam)

  • Building pipeline (Dataflow, Apache Beam, Dataproc, BigQuery, Pub/sub, Spark, Kafka)
  • transformation (windowing, late arriving data)
  • etc

Storing Data (~20% of exam)

  • choosing managing service (Bigtable, Cloud Spanner, Cloud SQL, Cloud Storage, Firestore, Memorystore)
  • Design Data model

Using Data for analysis (~15% of exam)

  • IAM, Analytics Hub, Connection to tools, Data Discovery etc.

Maintain pipeline (~18% of exam)

  • Cloud composer, Scheduling jobs, troubleshooting error messages, fault tolerance, etc.

ซึ่งทำให้เรารู้ว่าต้องไปทำความเข้าใจ service ไหนบ้าง, service ไหนเป็น service ที่เราใช้อยู่แล้วหรือไม่เคยใช้บ้าง

เช่น เราไม่เคยใช้ Bigtable, Cloud Spanner, หรือ Dataplex มาก่อน เราก็จะไปลงรายละเอียดใน official GCP document หรือในคอร์ส Acloudguru อีกที (ซึ่งจะเล่าต่อในส่วนถัดไป)

หรือ บาง service มีไส้ในจาก open source อะไร เหมาะกับงานแบบไหน เช่น Dataflow คือ Apache Beam เหมาะกับ processing streaming data, Cloud Composer คือ Airflow, Dataproc ข้างในคือ Spark, Hadoop เหมาะกับ processing batch data, Pub/sub คล้ายๆ Kafka แต่ไม่ต้อง maintain infra

เพื่อทำให้แมปภาพในหัวได้ว่าแก่นแท้ของมันคืออะไร service เหล่านี้เกิดมาเพื่ออะไรเหมาะกับงานแบบไหน พอเป็น managed service แล้วมันมีข้อดีอะไรบ้าง แก้ปัญหาอะไรได้บ้าง

แล้วชื่อแต่ละอย่างจำสับสนมากจริงๆ

Dataform, Dataplex, Data fusion, Dataprep, Dataproc, Dataflow, Data Catalog, Datastream

คุยกับ Kamolphan Lewprasert ว่า service ชื่อเหมือนกันอะไรหนักหนา เลยจับทำมีมซะเลย

2. ** แนะนำ ** ปูพื้นฐานด้วยคอร์ส Acloudguru Google Certified Professional Data Engineer by Tim Berry

ถึงแม้ว่างานหลักเราจะได้ใช้ Google Cloud แต่มันก็ยากมากที่จะใช้ทุก service ที่เขามีบนนั้น

อย่างบาง service เช่น Bigtable, Cloud Spanner, Dataproc, Dataflow เราไม่เคยใช้ หรือถึงแม้จะเคยใช้แล้ว เช่น Pub/sub, BigQuery เราก็ต้องกลับไปจำ default config และ key feature ที่สอดคล้องกับงาน Data engineer เพราะมันต้องใช้มุมการ maintain data pipeline ด้วย

อันนี้เราก็ปูพื้นฐานด้วยการเรียนเบสิคจาก Acloudguru จากอาจารย์ Tim Berry ผู้มีพระคุณ

ซึ่งเราก็ต้องเข้าใจว่า storage แบบไหน เหมาะกับงานอะไร อันนี้ก็สำคัญ

3. ** Optional ** สำหรับคนที่ไม่ค่อยจับ Google Cloud เท่าไร แนะนำให้ทำ Cloud Skill Boost

สำหรับเราไม่ได้เลือกทำ Cloud Skill Boost เพราะใช้เวลาค่อนข้างเยอะ อีกอย่างคือเราพอใช้ Google Cloud ในงานหลักพอสมควร ซึ่งหากบาง service ไม่ได้ใช้จริง แค่ดูคลิปใน demo ของ Acloudguru ก็เพียงพอ

แต่ถ้าหากใครไม่ค่อยได้จับ Google Cloud มากนัก การลงมือจะช่วยเสริม เพราะเรื่อง IAM, permission, security, การวาง service ใน region อะไรพวกนี้ไม่เหมาะใช้จำเพื่อสอบเท่าไร แต่สามารถจำได้จากการลงมือทำ

4. ** สำคัญ *** การทำข้อสอบเก่า

เมื่อกี้เราบอกว่า ข้อสอบชุดใหม่ไม่เหมือนกับชุดเก่า แต่การทำข้อสอบเก่าจะช่วยให้เราเก็ตสไตล์การถาม เราจะคุ้นเคยกับโจทย์ยาวๆ ชอบเล่า scenario ยาวๆแล้วถามว่าเป็นเราจะทำยังไง ตัวอย่างจากเว็บ official

official sample questions

ซึ่งตัวอย่างข้อสอบเขาจะไม่ช่วยให้เรารู้ความยากง่ายของข้อสอบ (ส่วนใหญ่ของจริงยากกว่านี้555) แต่พอให้เห็น format ซึ่งเราต้องจับจุดให้ได้ว่าข้อสอบต้องการอะไรจากเรา

*คำแนะนำคือต้องฝึกตัดช้อยส์ เพราะข้อสอบยาวมากแล้วมันถ่วงเวลาค่อนข้างเยอะ

สามารถหาตัวอย่างข้อสอบได้ที่

5. **ระวัง** หนังสือเก่าๆจะ outdated แล้ว เนื้อหามันไม่ครอบคลุม tech ใหม่ๆ เพราะข้อสอบก็เพิ่งอัพเดท

Question: ใช้เวลาเตรียมตัวนานแค่ไหน

ทั้งหมดเราใช้เวลาเตรียมตัว 2 สัปดาห์ก่อนไปสอบ เนื่องจาก schedule มันรัดตัวมาก 🥹 ทั้งงานหลักและงาน community

ก็ตามสไตล์คนทำงานประจำเลย เราตื่นมาอ่านหนังสือเช้าก่อนทำงาน ~1.30 ชม. กับหลังทำงานเสร็จ อ่านตอนดึกๆอีก ~2–3 ชม. บางวันก็ทำแค่เช้าหรือดึก เอาเท่าที่ไหว

สภาพโต๊ะคือเต็มไปด้วยชีทและโน้ต

คำแนะนำก่อนสอบ

  1. ถ้าอยากเลื่อนสอบ สามารถเลื่อนได้ฟรีแต่ต้องก่อนกำหนดสอบ 72 ชม. (3 วัน) ไม่งั้นต้องจ่ายเพิ่ม
  2. ก่อนวันสอบ พยายามทำใจโล่งๆ ปลงมากๆ บอกตัวเองว่าเราอ่านเต็มที่แล้ว เป็นไงเป็นกัน
  3. หากสอบที่ test-center ให้พยายามไปก่อนเวลาสอบ เพราะรถติดมาก
  4. เตรียมเสื้อกันหนาวไปเผื่อ หากเป็นคนขี้หนาว

คำแนะนำตอนสอบ

  1. เลือกเวลาสอบตอนสมองโล่งๆ เพราะอ่านเยอะมาก
  2. 50 ข้อใน 2 ชม. และช้อยส์ทั้งหมด อย่าคิดว่ามีเวลาเยอะเพราะข้อสอบยาวมาก ใช้เวลาอ่านเยอะ
  3. บางครั้งช้อยส์จะใกล้เคียงกันมากเพื่อหลอกเรา พยายามตัดช้อยส์ให้ได้
  4. รอบแรกข้อไหนทำไม่ได้ให้ข้ามไปก่อน ด้วยการ mark review หรือ ถ้าเลือกคำตอบแล้วแต่ไม่มั่นใจก็กดเลือกช้อยไปและกด mark review ด้วย, แล้วค่อยกลับมา review ทีหลัง
  5. ห้ามเอาอะไรเข้าห้องสอบ หากสอบที่ test-center เขาจะมีตู้ locker ให้
  6. ระยะเวลาในข้อสอบ จะบอกเวลาในระบบเลยแบบนับถอยหลัง
  7. หากเวลาใกล้หมด พยายามอย่า freak out ตั้งสติไว้ให้มั่น เพราะข้อสอบยาว (อีกแล้ว) เดี๋ยวหลุด
  8. อย่าเผลออ่านออกเสียงในห้องสอบ ไม่งั้นฟาวล์
  9. สอบเสร็จจะรู้ผลทันที ผลสอบจะตัวเล็กมาก บอกแค่ pass หรือ fail แต่ไม่บอกคะแนน

ความรู้สึกตอนที่เรารู้ผล เราก็ช็อคกับหน้านั้นไปหลายนาที เพราะงงว่ามันจบแล้วเหรอ 2 ชม.มันผ่านไปไวมากจริงๆ นี่เราตอบถูกหรือผิดนะ จำคำตอบไม่ค่อยได้เท่าไรเพราะช้อยส์ก็ยาวมากเหลือเกิน 555555

ของรางวัล

หลังสอบเสร็จ

  1. จะมีอีเมลล์ตามมาทีหลังว่าเราได้ Digital Badge และ certification

2. เข้าร่วมภาคี Google Cloud Certified Directory โดยเราต้องไปเปิด profile ให้เป็น public

3. ได้ claim ของรางวัลจากเว็บ certmetrics

ซึ่งเราจะได้ voucher มา สามารถไป claim เป็นสิ่งของได้

โดยเราเลือกเป็นกระเป๋ามา เพราะชอบ Timbuk2

“You worked hard and you deserve the best”

ความเห็นส่วนตัว

การสอบ certification เป็นตัวเลือกที่ optional มากๆในความคิดเห็นเรา เพราะการสอบผ่านหรือไม่ผ่าน ไม่ได้วัดผลว่าเราจะเป็น Data Engineer ที่ดีไม่ได้ หรือทำงานไม่เก่ง

เรามองว่าข้อสอบก็ค่อนข้างยากและอาศัยประสบการณ์ระดับนึงเพื่อ come up with solution ที่เหมาะสมกับสิ่งที่เขาต้องการ ทั้งเล่า scenario ที่ค่อนข้างยาวแต่บังคับให้เลือกว่าตัวเลือกไหนเข้าท่าที่สุด

ยิ่งข้อสอบนี้แตกต่างจากข้อสอบเก่าพอสมควร ส่วนตัวว่ายากกว่าที่มีใน internet มากๆ ดังนั้นการมีเบสิคความเข้าใจในเครื่องมือและพื้นฐานต่างๆควรแน่นมาแล้ว

ดังนั้นถ้าใครสอบผ่านหรือไม่ผ่าน ไม่ต้องเป็นกังวลเลยค่ะ ไม่ต้องกดดันตัวเอง เพราะว่าพูดตามตรงแล้ว certification นี้ ไม่ได้ช่วยทำให้เราได้งาน แต่การอ่านหนังสือพวกพื้นฐาน ตัวอย่างเช่น ไล่เก็บความรู้ใน roadmap https://github.com/datastacktv/data-engineer-roadmap

อ่านหนังสือ, เขียนบล็อกและแชร์ ทำให้เราได้งานและได้ส่งมอบงานที่ดีขึ้นค่ะ อันนี้พูดจากใจและประสบการณ์ส่วนตัว

แล้วถามว่าไปสอบทำไม คิดว่ามันเป็นการชาเลนจ์ตัวเองมากกว่า ว่าเราได้อัพเดทความรู้เทคโนโลยี และเลือกใช้เครื่องมือที่เขามีให้บน Google Cloud ได้อย่างไร เหมือนกลับมาเติมความรู้ตัวเองอีกครั้งเพื่อเพิ่มความมั่นใจยิ่งขึ้น

ส่วนตัวมองว่าควรลงสมัครสอบเมื่อพร้อมจะชาเลนจ์กับตัวเองค่ะ เพิ่มอดรีนาลีนความเป็นนักเรียนอีกครั้ง 555

ทิ้งท้าย

ปี 2021 เรียนจบจน course แต่สุดท้ายไม่ได้ไปสอบ จนปี 2023 reset course นี้เป็นศูนย์แล้วเริ่มทวนใหม่

อันนี้จริงเราเคยตั้งเป้าจะสอบตั้งแต่ปี 2021 แล้ว เรียนปูพื้นฐานจนจบคอร์สเลยนะ แต่ไม่ได้ไปสอบสักที :) 5555 ตอนนั้นไอดอลคือพี่ฝน Kamolphan Lewprasert นี่แหล่ะ คนอะไรเก่งชะมัด มี certification ตั้ง 7–8 อัน แอบมองไกลๆแบบปลื้มๆ5555

จนกระทั่งเราอ่านหนังสือและเขียนบล็อกเรื่อยๆ เกร็ดความรู้ที่ได้จากงานก็เอามาเขียนบล็อก จนกระทั่งพี่ฝนนี่แหล่ะมาเห็น แล้วชวนมาทำ community และ Women Techmakers เลยมารู้จักกันและสนิทกัน สุดท้ายเราดันได้โอกาสจะสอบอีกครั้ง และก็มีพี่ฝนให้คำแนะนำในครั้งนี้ เป็นเรื่องตลกดีจากไอดอลสู่เพื่อน5555 ขอบคุณพี่ฝนมากๆสำหรับแรงบันดาลใจและแรงฮึด ฮ่าๆ

และสิ่งหนึ่งที่เรารู้เลยว่าตอนนี้เราพร้อมกว่าตอนนั้นมากๆ เทียบจากการเรียนในคอร์ส Acloudguru ตอนปี 2021 กับปี 2023 สมัยนั้นเรายังไม่ค่อยรู้ว่า horizontal/vertical scale คืออะไร เหมาะกับงานไหน, การ design pipeline เหมาะกับงานไหน ควรใช้อะไร, ACID/ CAP theorem คืออะไร, สมัยนั้นยังไม่เคยจับ spark พอเราไม่รู้ ไม่เคยจับ มันก็ดูเยอะไปหมด เครียด5555

แต่เมื่อเราใช้เวลา 2 ปีที่ผ่านมาสั่งสมพื้นฐานมากขึ้น เรียนรู้ประสบการณ์ design จากการทำงาน ความเร็วในการเรียนในปี 2023 สามารถสปีดได้มากขึ้น ท่องจำน้อยลงและเน้นเข้าใจเป็นหลัก

เราจึงเชื่อมากๆว่าการมีพื้นฐานจะช่วยต่อยอดไปสู่การสอบที่สำเร็จได้ 😉

--

--

Burasakorn Sabyeying
Mils’ Blog

Data engineer at CJ Express. Women Techmakers Ambassador. GDG Cloud Bangkok team. Moved to Mesodiar.com