แชร์ประสบการณ์ Professional Machine Learning Engineer และแนวทางการสอบฉบับอัพเดทปี 2024

Thakorn
Google Cloud Thailand
7 min readNov 28, 2023

เมื่อพูดถึงการรับรองทักษะวิชาชีพด้าน IT แล้วก็หนีไปพ้นเรื่องของการมี Certificate ใช่ไหมครับ ไม่ว่าจะเป็นด้าน Infrastructure, Architect, Networking รวมถึงงานด้าน Data Engineering, Data Scientist ในหลากหลาย Industry ด้วย แต่ละผู้ให้บริการก็ออก Cerificate ให้กับผู้เชี่ยวชาญที่มีทักษะความรู้ใน Software หรือ Service ของตน ซึ่งในบทความนี้เราจะมาชวนคุยใน Certifcate ตัวนึงที่รับรองทักษะสำคัญในการเป็น Machine Learning Engineer กับ Google Cloud กันครับ

รู้จักกับ Google Cloud certification กันก่อน

Google Cloud certification คือการรับรองในความรู้, ความสามารถและความเชี่ยวชาญในการใช้เทคโนโลยี Google Cloud กับธุรกิจต่าง ๆ ซึ่ง Gartner คาดการณ์ว่า 85% ของธุรกิจต่าง ๆ จะอยู่ในรูปแบบ cloud-native ในปี 2025 ซึ่งเรียกว่า Cloud มีความสำคัญไม่น้อย และการรับรองจาก Google ก็เป็นหนึ่งในข้อพิสูจน์ว่าบุคลากรนั้น ๆ มีความสามารถที่แท้จริง ที่จะนำองค์กรของเราสู่ความสำเร็จ

Google Cloud มี certification ที่หลากหลาย domain เช่น Network Engineer, Security Engineer, Database Engineer และ Data Engineer เป็นต้น โดยการรับรองแบ่งเป็น 3 ระดับดังนี้

  1. Foundational certification เป็นระดับพื้นฐานที่เข้าใจแนวความคิดของ cloud รวมถึง products, services ต่างๆ บน Google Cloud โดยไม่จำเป็นต้องมี techincal skill เหมาะกับทีม Sales, Planning, Product Manager ที่ต้องทำงานควบคู่กับทีม Engineers ที่มากความสามารถในสาขาต่างๆ ซึ่งใบรองรับใน level นี้คือ Cloud Digital Leader
  2. Associate certification เป็นกลุ่มที่มีประสบการณ์และสามารถใช้ Google Cloud ได้อย่างคล่องแคล่ว มีความรู้ในภาพรวม เช่น การ maintain หรือ deploy งานต่าง ๆ บน cloud ซึ่งใบรองรับใน level นี้คือ Assocaite Cloud Engineer
  3. Professional certification เป็นระดับสูงสุดที่แตกออกตามสาขาที่มีความเชี่ยวชาญโดยตรง เช่น ด้าน DevOps, ด้าน Machine Learning สามารถออกแบบและจัดการงานต่าง ๆ รวมถึงการนำ best practices มาใช้ เพื่อให้การดำเนินงานด้วยเทคโนโลยี Google Cloud มีประสิทธิภาพสูงสุด

ทำอย่างไรถึงจะได้รับ Google Cloud certification

ถ้าตอบแบบง่ายที่สุดก็คือไปสอบที่ศูนย์สอบที่รับรองในประเทศครับ โดยเราจะ register ผ่าน portal ของ webassessor ที่ลิงค์นี้ครับ https://webassessor.com/googlecloud แต่ก่อนที่จะไปสอบต้องมีความรู้สามารถและความเข้าใจ Google Cloud product ในสาขาที่สนใจเสียก่อน ซึ่งเราสามารถเลือกดูข้อมูลว่าทาง Google Cloud จะวัดผลองค์ความรู้ใดบ้างตามสาขาในหน้า Google Cloud Certification ครับ

โดยจะมี Journey ในเรียนรู้ทักษะบน Google Cloud ดังนี้ครับ

  1. Learn อาจจะไปลงคอร์สต่าง ๆ บน Coursera, Edx หรือที่ผู้เขียนแนะนำจะเป็นบน Cloud Skills Boost ที่มี lab ให้เล่นจริง เป็น environment บน Google Cloud จริง ๆ เพื่อเพิ่มความเข้าใจได้มากขึ้น และมี learning path ในเทคโนโลยี cloud ที่ครบถ้วนครับ
  2. Practice เมื่อมีทักษะแล้ว ก็อาจจะลองฝึกกับ Google Cloud project ของตัวเอง หรือทำ quiz บน Cloud Skills Boost ก็ได้ เมื่อผ่านก็จะมี badges ต่าง ๆ ประดับ profile ครับ
  3. Prepare คราวนี้ก็เตรียมตัวสอบ ก็อาจจะลองดูพวก sample questions หรือ guide ต่างๆ บน Google Cloud Certification เพื่อทบทวนครับ จากนั้นก็เลือกศูนย์สอบกันได้เลยที่ Webassessor ได้เลย
  4. Certify ไปสอบกันครับ จริง ๆ สามารถสอบได้ทั้ง online และที่ศูนย์สอบครับ แต่ผู้เขียนชอบสอบที่ศูนย์มากกว่าเพราะอยู่ในสภาพแวดล้อมทีค่อนข้างมีสมาธิ หลังสอบเสร็จเราก็จะทราบผลเลยครับ
  5. Ongoing Learning ถ้าสอบผ่านแล้วก็อย่าลืมลับคมอยู่เสมอ อาจจะวางแผนสอบ cer ที่เกี่ยวข้องต่อครับ

Journey ที่ใช้เรียนรู้ได้กับทุก certificate ครับ ซึ่งผู้เขียนจะมาลงรายละเอียดกับ Professional Machine Learning ให้ผู้อ่านที่สนใจ domain นี้เห็นภาพกันมากขึ้นครับ

Professional Machine Learning Engineer คืออะไร?

Certificate นี้จะเป็นด้าน ML Engineer โดยตรงที่ทำ AI, Machine Learning บน Google Cloud หลายคนอาจจะเคยสอบ Professional Data Engineer กันมาแล้ว เนื้อหาก็จะมีลงการทำ AI อยู่บ้าง ด้วย BigQuery ML, AutoML แต่หลัก ๆ จะเป็น part การทำ Data Management ในการ ingest data, orchestration และพ่วงเรื่อง model มากกว่า แต่ Professional Machine Learning Engineer จะเน้นหนักเรื่อง MLOps, การวัดผล model และการ optimized ให้เหมาะสมในแต่ละธุรกิจหรือ use case ครับ

ใครที่จะสอบ certificate นี้ต้องมีความรู้พื้นฐานด้าน Data Science อยู่แล้ว ในการทำ Machine Learning, Deep Learning และประกอบกับ AI Infrastructure ด้วย เช่น การตั้งเครื่อง VM ที่มี GPU, TPU, การ served model ให้ทีมอื่น ๆ ไปใช้งานต่อ และการทำ Workflow Orchestration เพื่อเป็น concept ในการทำ MLOps ครับ ผู้เขียนคิดว่าควรมีพื้นฐานของ Professional Data Engineer ก่อนจะทำให้การสอบ Professional Machine Learning Engineer ง่ายขึ้นครับ

เพราะ ML Engineering จะมีการผสมผสานระหว่าง Data Engineering และ App Engineering กล่าวคือขาข้างหนึ่งก็ต้องมีความเข้าใจในด้าน Data Foundation และขาอีกข้างก็ต้องมีความเข้าใจใน Application ว่าจะไปใช้งานต่อให้เกิดประโยชน์กับ business อย่างไรและ integrate เข้าด้วยกันอย่างไร

เทคนิคการสอบ Machine Learning Engineer

ในหัวข้อนี้จะเป็นไกด์ที่ผู้เขียนใช้สอบครับ ขออนุญาตเริ่มที่รายละอียดของการสอบก่อนว่าวัดผลเนื้อหาอะไรแล้วค่อยย้อนกลับไปเรื่องการเรียนรู้หรือทบทวนกันนะครับ

หากเข้าไปที่เว็บ https://cloud.google.com/learn/certification/machine-learning-engineer จะมีรายละเอียดการสอบบอกว่า ระยะเวลาการสอบ 2 ชั่วโมง, ค่าสอบ $200 ชุดข้อสอบเป็นภาษาอังกฤษทั้งหมดและจะมีข้อสอบประมาณ 50–60 ข้อ เป็นทั้งแบบตัวเลือก choice เดียวหรือตอบได้หลาย choice ซึ่งชุดข้อสอบจะสุ่มมาครับ บางคนไปสอบวันเดียวกัน ก็อาจจะได้ชุดข้อสอบที่ไม่เหมือนกัน

สำหรับผู้เขียนลงทะเบียนสอบในช่วงปลายเดือนตุลาคม 2023 เป็นช่วงเวลาที่ Google อัพเดท Machine Learning Exam กับ Data Engineer Exam พอดี ดังนั้นข้อสอบจะทันสมัยมากขึ้น (หรืออาจจะยากขึ้นตามสไตล์ Google ก็ได้นะครับ 😛) เราจะเรียกชุดข้อสอบใหม่ที่นำมาทดสอบว่า Beta Certification Exams คือชุดข้อสอบจริงที่เตรียมปล่อยก่อนจะไป GA (General Available)

คนที่ลง Beta Exams จะเป็นกลุ่มคนแรกที่ได้ทำข้อสอบใหม่ก่อนใครในโลก และมีค่าสอบที่ถูกลง 40% จาก $200 ก็เหลือ $120 แต่ต้องทำข้อสอบครบทุกข้อซึ่งมีประมาณ 120 ข้อ และใช้เวลานั่งในห้องสอบถึง 4 ชั่วโมงครับ คะแนนการสอบว่าผ่านหรือไม่ผ่านนั้น จะไม่ทราบผลทันที ต้องใช้เวลาอีก 1 เดือนโดยประมาณถึงจะทราบผล เรียกว่าสอบไปครึ่งวันแล้วต้องลุ้นผลกันอีกครับ ซึ่ง Google ก็จะนำไปประมวลผลอีกทีเพื่อมาจัดเป็นชุดข้อสอบที่เป็นเวอร์ชัน GA ให้เราได้สอบกัน

การลงทะเบียนสอบ

หากเมื่อพร้อมสอบเราสามารถลงทะเบียนได้ที่ https://webassessor.com/googlecloud ครับ สมัครสมาชิกให้เรียบร้อยจะขึ้นปุ่ม REGISTER FOR AN EXAM ให้กดเข้าไปครับ

เลื่อนมาล่างสุดจะพบ Google Cloud Certified — Professional Machine Learning Engineer (English) ในที่นี้ผู้เขียนจะเลือกแบบ Onsite Proctored ครับ กด Buy Now ได้เลย (ถ้าใครเคยสอบ Google Cloud มาแล้วไม่ผ่านจะมีระยะเวลารอคอย 14 วันเป็นต้นไป ถึงจะขึ้นปุ่ม Buy Now อีกทีได้ครับ)

เลือกศูนย์สอบที่เราสะดวก, เลือกวันและเวลาสอบและสุดท้ายคือชำระเงินตามราคาสุทธิครับ

เลือกศูนย์สอบในประเทศตามที่สะดวก
เลือกวันและเวลาที่สะดวก
หน้าสรุปและการชำระเงิน

หลังจากชำระเงินแล้วเราจะ email confirm การสมัคร เราก็พิมพ์เมล์นั้นไปที่ศูนย์สอบในวันเวลาดังกล่าวได้เลยครับ ในการสอบนั้นจะไม่อนุญาตให้นำเครื่องมือสื่อสารเข้าไปนะครับ ไปแต่ตัวกับหัวใจล้วน ๆ ทำตัวสบาย ๆ ให้สมองปลอดโปร่งและทำข้อสอบครับ

ทริคในการไปสอบแบบสั้นๆ

  • นอนให้เต็มที่ ออกจากบ้านเช้า ๆ ไปก่อนเวลาเผื่อรถติดครับ ถ้าไปสายเกินอาจหมดสิทธิ์ในการสอบ
  • โจทย์ข้อสอบอาจจะยาวมาก เหมือนอ่านเรียงความ เราจะมีเวลาในการตอบเฉลี่ยข้อละ 2 นาที ต้องรีบอ่านรีบตอบครับ บางครั้งอาจจะอ่านจากท้ายโจทย์ก่อนว่าถามอะไร แล้วค่อยอ่านโจทย์แบบจับใจความครับ
  • เรื่องการตัด choice อาจจะยากหน่อย เพราะข้อสอบ Google อ่านแล้วส่วนใหญ่เหมือนถูกทุกข้อครับ ข้อนี้ก็ถูก ข้อนั้นก็ทำได้ ดังนั้นขอให้เลือกตอบข้อที่ถูกที่สุดครับ
  • ข้อไหนไม่มั่นใจอย่าเสียเวลางมครับ กด mark as review ไว้ เดี๋ยวกลับมาดูทีหลังก่อนส่งข้อสอบก็ได้ครับ แต่จริง ๆ เวลามีค่อนข้างจำกัด ดังนั้น เราอาจพึ่งศักดิ์สิทธิ์ที่นับถือและเดาจิ้มไปก่อนที่มีแนวโน้มจะถูกเผื่อกลับมารีวิวไม่ทันครับ

เนื้อหาในการสอบ

เมื่อเรารู้แล้วว่าจะสมัครสอบยังไง ทีนี้มารีวิวเนื้อหาที่หน้า Machine Learning Engineer Certification กันครับ ให้เลื่อนมาที่ Step 2 จะมี See current exam guide อยู่ สามารถกดที่ลิงค์ดังกล่าวได้เลยครับ

ในไกด์จะบอกภาพรวมว่าต้องมีความรู้ด้านใดบ้าง ซึ่งเป็นเนื้อหางานของ Machine Learning Engineer ครับ

ให้เราเลื่อนมาดูรายละเอียดแต่ละ section จะมีทั้งหมด 6 sections ครับ ซึ่งผู้เขียนขอสรุปให้ดังนี้

Section 1: Architecting low-code ML solutions

การประยุกต์การทำ ML ในแบบฉบับ low-code ครับ เพราะว่าบางโมเดลเราไม่จำเป็นต้องลง effort ถึงขั้นเริ่มโค้ด Python หรือ import Tensorflow มาใช้ เราเน้นการใช้ products ที่ low-code ก็ได้ผลลัพธ์เหมือนกัน เช่น BigQuery ML ดังนั้นควรสร้าง model ต่าง ๆ จาก BigQuery ML เป็น ทำ feature engineering และ prediction ด้วย BigQuery ML ได้

การรู้ว่า use case ควรสร้าง model หรืออันไหน ควรใช้ ML APIs เลยจะได้ไม่ต้อง train data เช่น Cloud Vision API, NLP API, Speech API, Document AI, Retail API เพื่อให้ทีม Application นำไปใช้ใน production app ของตัวเองได้ครับ

สุดท้ายเป็นการใช้ AutoML ในการทำ use case พวก Tabular, Image, Text และที่สำคัญควรทราบว่าจะ deploy model ที่ได้จาก AutoML เป็น endpoints ได้อย่างไรด้วยครับ

เทคนิคในหัวข้อนี้คือ โจทย์ที่ดูแล้วไม่จำเป็นต้อง customized model มา สามารถหยิบจับ products ข้างต้นมาได้ ก็แนะนำให้เลือก service ข้างต้นมาใช้ ทำให้ประหยัด cost ทั้งเวลาและ manday ครับ ใน section นี้อยากให้เก็บคะแนนให้ครบเพราะโจทย์มีความซับซ้อนน้อยที่สุดครับ

Section 2: Collaborating within and across teams to manage data and models

การทำงานร่วมกันภายในทีมเพื่อบริหารจัดการโมเดล กล่าวคือเราเป็น ML Engineer เราทำงานกันเป็นทีมอาจจะร่วมกับทีมอื่นอีก จะมีการพูดถึง การ explore และ preprocessing data ด้วย BigQuery, Apache Spark, PySpark, Hadoop ที่มี concept lake เข้ามาเกี่ยวข้อง อาจมี SparkML มาเกี่ยวข้อง แต่ข้อที่เกี่ยวกับ Spark อาจจะน้อยเมื่อเทียบกับการ preprocessing ด้วย TensorFlow Extended (TFX) และ BigQuery ครับ

การบริหารจัดการ dataset ให้ทีมอื่นพร้อมใช้ เช่น การใช้ Vertex AI Feature Store และการควบคุม policy เช่น PII หรือ PHI data ครับ

การทำ model prototype บน Jupyter Notebook ด้วย service บน Vertex AI Workbench อาจมีลงโค้ด TensorFlow, PyTorch, Scikit-learn, Spark หลังจากนั้นก็ tracking model ด้วย Vertex AI Experiment, Vertex AI Pipelines, Kubeflow ครับ ตรงนี้อาจมีพ่วงเรื่องการ validate model ด้วยว่าเอา model ไหนดี หรือเอาอันไหนเตรียมเป็น final model คือคุยเรื่อง model ล้วน ๆ ครับ

Section 3: Scaling prototypes into ML models

หลังจาก model prototypes มาก็มา build model บน architecture แบบไหนดี framework ไหนดี แล้วก็ training กับข้อมูลจริงที่ใหญ่ ๆ ด้วย Vertex AI custom training หรือ Kubeflow ใช้เครื่องแบบไหน train ดี แนบ GPU ไปด้วยดีไหม ถ้า fail จะ troubleshoot ยังไง โจทย์อาจจะมีตัวอย่าง error มาให้แก้ครับ ที่สำคัญอยากให้อ่านเรื่อง Distributed training น่าจะมีออกแน่นอนอย่างน้อย 1–2 ข้อ ในเรื่อง Reduction Server

Section 4: Serving and scaling models

เมื่อเราได้ final model มาหลังจากการ training ที่เสร็จสมบูรณ์ก็ต้องคำนึงถึงการ serving model ให้ทีมต่าง ๆ ได้ใช้ จะ served แบบไหนดี เป็น batch หรือ online prediction ในรูปแบบ APIs ซึ่งโจทย์อาจมีการใช้ BigQuery ML แล้วนำ model ไปเก็บบน Vertex AI Registry แล้วค่อย deploy เป็น endpoints ก็ได้ครับ หรือการ prediction ต้องมีการใช้ hardware พิเศษไหม เช่น เพิ่ม GPU, TPU เข้าไป

บาง model อาจไม่ต้อง deploy เป็น endpoint อาจ export ออกมาและ deploy รูปแบบ edge เช่นเป็น container ครับ ซึ่งฟังดูอาจจะต้องมีความรู้ด้าน DevOps CI/CD หน่อย ๆ แต่ในเนื้องาน Machine Learning ก็จะเรียกเป็นลักษณะ MLOps ครับ

และปิดท้ายด้วยการ tuning ML models ในการ train หรือ served model ใน production ให้มี performance ที่เหมาะสมในเรื่อง latency, memory, throughput ต่าง ๆ ครับ

โจทย์หัวข้อนี้อาจจะต้องดู keyword ด้วยว่า เขาอยากให้ minimized อะไร เช่น เวลา หรือ ค่าใช้จ่าย ต้องยึด objective ในการ optimized สิ่งเหล่านั้นเป็นหลักครับ

Section 5: Automating and orchestrating ML pipelines

กระบวนการข้างต้นอาจยังไม่ auto ทั้งหมด ตัว Machine Learning Engineer ควรออกแบบให้มัน auto ฉบับ MLOps ด้วยการจัดการ ML pipeline ตั้งแต่การดูด data มา feature engineering และมา train และออกแบบ model version ใหม่ที่ endpoint นั้น ๆ ดังนั้นต้องรู้จักการมีตัว trigger ไปยัง Cloud Build, Cloud Run ช่วย provisioning ต่าง ๆ หรือใช้ Kubeflow, Vertex AI pipelines หรือ Composer ใน orchestration ต่าง ๆ ครับ เช่น จะ retrain model จะต้องเป็น pipeline ยังไง รวมถึงการดู meta data ของ model artifacts ครับ ดูที่ Vertex AI Experiments หรือ Vertex ML Metadata ขึ้นอยู่กับที่โจทย์ถามครับ

Section 6: Monitoring ML solutions

Section สุดท้ายคือการ monitoring model ครับว่าถึงจุดที่ต้อง retrain หรือยัง เพราะ bug ใน software dev เราทราบเพราะมี error แต่ในการทำ ML อาจจะไม่มี error เราก็ต้องอาศัยการ monitoring ว่า training data แต่ละชุดที่มาใหม่ skew ไหม feature attribution drift หรือเปล่า ตรงนี้ออกแน่นอนครับ

โจทย์อาจจะมีถามความถี่ในการ retrain ด้วยเป็น schedule ไหมหรือควรได้รับ trigger แบบไหนถึง retrain เราอาจจะต้องอธิบาย model ได้ ถึง model risk เช่น ชุดข้อมูลมี bias ก็อาจจะต้องทำความเข้าใจหรือใช้พวก XAI ในการทำ Model explain ครับ

สรุปทั้ง 6 Sections

ทั้งหมด 6 หัวข้อเมื่อเชื่อมโยงกันมันก็จะรวมเป็นเรื่อง MLOps ครับ ซึ่งถ้าเราเคยใช้ Tensorflow และเข้าใจ AI Architecture บน Vertex AI ก็สามารถทำข้อสอบได้เกินครึ่งนึงแล้วครับ ทั้งนี้ Google แนะนำว่าควรมีประสบการณ์ด้าน AI อย่างน้อย 3 ปี เคยออกแบบและจัดการ solutions เหล่านี้บน Google Cloud อย่างน้อย 1 ปี ก็น่าจะสามารถทวนเนื้อหาแล้วไปสอบได้เลยครับ

แต่ถ้ายังไม่เคยมีประสบการณ์ครบตามไกด์แนะนำให้ลงเรียนใน Cloud Skills Boots หัวข้อ Machine Learning ครับ เป็นการทั้งเริ่มต้นและทวนไปในตัวได้ดีเยี่ยม https://www.cloudskillsboost.google/paths/17

Google Cloud ML and AI learning path

ทำข้อสอบซ้อมมือกัน!

หลังจากที่ความรู้แน่นแล้ว ลองเลื่อนมาข้างล่างทำแนวข้อสอบใน Step 3 กันครับ ผู้อ่านสามารถคลิกที่ Review sample questions ได้เลย

จะอยู่ในรูปแบบ Google Forms ซึ่งทำเสร็จจะมีเฉลยให้เราลองทบทวนได้ครับ

หลังจากสอบ Professional Exams

เราจะทราบผลทันทีหลังจากสอบเสร็จครับ หลังจากนั้น 1 อาทิตย์จะมีผลสอบอย่างเป็นทางการมาให้ ซึ่ง certificate ของเราจะถูก verify ในระบบ Blockchain ของ Accredible ครับ

ในอีเมล์จะมี guide สำหรับนำ certificate ที่เราได้ แปะโปรไฟล์ linkedin หรือลงทะเบียนใน Google Cloud Certified Directory ที่สามารถ explore certificate ต่าง ๆ ของเพื่อน ๆ ได้ครับ

และจะมีอีเมล์อีกฉบับที่มอบ Perk/Swags หรือของขวัญต้อนรับครอบครัว Google Cloud อาจจะเป็นกระเป๋า, เสื้อฮู้ด หรือแก้วน้ำครับ ซึ่งของขวัญก็จะเวียนกันไปแต่ละรอบ

Google Merchandise Store
เลือกได้ 1 ชิ้นจากหน้านี้ครับ

Conclusion

ผู้เขียนหวังว่าทุกท่านจะมีความเข้าใจใน Professional Machine Learning Engineer มากขึ้นและสามารถนำความรู้ความสามารถไปพัฒนางานด้าน Data Analytics & AI และทีม Google Cloud by Tangerine ขอเป็นอีกหนึ่งพลังที่ช่วยขับเคลื่อนองค์กรของทุกท่านสู่ความสำเร็จนะครับ

หากมีคำถามใด ๆ สามารถติดต่อทีมงานได้ทันทีครับ เรามีผู้เชี่ยวชาญที่มีการรับรองในทุก ๆ สาขาพร้อมให้คำปรึกษาครับ

ขอให้ทุกท่านโชคดีในการสอบครับ 🎉

--

--

Thakorn
Google Cloud Thailand

✨ Solution Engineering Google Cloud Partner All-star 2023 🍊 Google Cloud by Tangerine