What is AutoML and how it helps organizations take advantage of machine learning

Suraphan Laokondee
SCB TechX
Published in
2 min readMay 29, 2023
Photo by Andrea De Santis on Unsplash

Automate the boring stuff

What is AutoML

Automated machine learning (AutoML) เป็นกระบวนการที่ช่วยให้การสร้าง Machine learning โมเดลเป็นไปได้ง่ายและรวดเร็วขึ้น โดยไม่ต้องทำงานที่ซ้ำซ้อนในกระบวนการพัฒนาโมเดลตั้งแต่การจัดการกับข้อมูล (Data preprocessing) เลือกโมเดล (Model selection) ปรับแต่งพารามิเตอร์ (Hyper-parameter tuning) และการนำโมเดลไปใช้งานจริง (Model deployment)
นักวิทยาศาสตร์ข้อมูล (Data scientist) สามารถลดภาระการทำงานแบบซ้ำซ้อนหรืองานที่ต้องทำแบบ Manual task ให้ลดลงและเน้นการทำงานที่สำคัญต่อไป เช่น การเข้าใจความต้องการของธุรกิจ (Business requirement) การสำรวจข้อมูล (Data exploration) และการตีความโมเดล (Model interpretation) หรือแม้กระทั่งบุคลากรในองค์กรที่ไม่ใช่ผู้เชี่ยวชาญในการทำ Machine learning หรือไม่มีความชำนาญในการเขียนภาษาโปรแกรมเช่น Python สามารถเริ่มต้นพัฒนาโมเดลได้ง่ายๆ ผ่านการใช้ User Interface (UI) อย่างง่ายดาย เพื่อให้การพัฒนาโมเดลเข้าถึงได้ง่ายและกว้างขึ้นในระดับองค์กร

How does AutoML help organizations?

AutoML ช่วยให้องค์กรใช้ประโยชน์จาก Machine learning ได้อย่างมีประสิทธิภาพในหลายด้าน โดยเฉพาะอย่างยิ่งช่วยให้องค์กรสามารถสร้างและใช้งาน Machine learning ได้เร็วกว่าวิธีแบบเดิม นอกจากนี้ AutoML ยังช่วยให้องค์กรสามารถเริ่มต้นใช้ Machine learning เพื่อปรับปรุงการดำเนินงานในธุรกิจได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้น

Key benefits of AutoML

AutoML เป็นโซลูชั่นที่มีความสามารถในการช่วยลดภาระการทำงานของนักวิเคราะห์ข้อมูลและนักพัฒนาโมเดล โดย AutoML สามารถสร้างโมเดลและเลือกโมเดลที่ดีที่สุดให้กับผู้ใช้ได้อย่างง่ายดาย ไม่ว่าจะเป็นงานด้านการทำนาย (Forecasting), Churn prediction, Recommendation engines หรือนำไปใช้กับงาน BI และ Data analytics ในการหารูปแบบ (Pattern) และทำนายผลจากข้อมูล

Increased efficiency and focus effort on higher impact work

การใช้ AutoML ช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถสร้างโมเดลพื้นฐาน (Baseline model) ได้อย่างรวดเร็วและง่ายดาย โดยไม่ต้องใช้เวลาในการทำ Data preprocessing, Trial and error และ Hyper-parameter tuning ต่างๆ ซึ่งช่วยลดเวลาและทำให้สามารถโฟกัสไปที่งานที่มีผลกระทบและซับซ้อนสูงขึ้นได้

นอกจากการสร้างโมเดลพื้นฐานแล้ว นักวิทยาศาสตร์ข้อมูลยังสามารถนำผลลัพธ์ที่ได้จาก AutoML มาพัฒนาโมเดลที่ดีและซับซ้อนขึ้นได้อีกด้วยโดยไม่ต้องใช้เวลาเยอะในการทดลองและปรับแต่งโมเดลด้วยตัวเอง

ดังนั้น การใช้ AutoML เป็นเครื่องมือสำคัญที่ช่วยเพิ่มความมีประสิทธิภาพและโฟกัสไปที่งานที่มีผลกระทบสูงขึ้นได้ ส่งผลให้การทำงานเป็นไปอย่างมีประสิทธิภาพและดีกว่าเดิม

Machine learning for non-expert, quickly apply machine learning across your organization.

AutoML ช่วยให้การสร้างโมเดลเพื่อตอบโจทย์ทางธุรกิจได้อย่างง่ายดายโดยไม่ต้องเป็นผู้เชี่ยวชาญด้าน Machine learning ผ่านการใช้งาน UI ที่ออกแบบมาให้ใช้งานได้ง่าย โดยช่วยแนะนำขั้นตอนต่างๆในกระบวนการสร้างโมเดล ทำให้สามารถเรียนรู้และสร้างโมเดลได้อย่างรวดเร็วและมีประสิทธิภาพ

นอกจากนี้ AutoML ใช้แนวทางที่ดีที่สุดในการพัฒนา Machine learning โมเดลอยู่แล้ว ทำให้เราสามารถเริ่มต้นด้วยกระบวนการที่ดีและเหมาะสม และช่วยให้เราสามารถเรียนรู้และปรับปรุง Model ได้อย่างรวดเร็ว โดยไม่จำเป็นต้องมีความเชี่ยวชาญด้าน Machine learning มากนัก

How does AutoML work?

AutoML ประกอบไปด้วยขั้นตอนหลายๆ ขั้นตอนตั้งแต่เริ่มกระบวนการเตรียมข้อมูลไปจนถึงจบกระบวนการด้วยการนำโมเดลไปใช้งาน โดยกระบวนการทั้งหมดนั้นจะเป็นอย่างอัตโนมัติ

Auto-generate training pipeline
  1. Data preprocessing โดยผู้ใช้งานจะเตรียม Data set ที่จะใช้ในการสร้างโมเดลและ AutoML จะช่วย Preprocessing ให้ข้อมูลอยู่ในรูปแบบที่สามารถนำไปใช้กับ Machine learning อัลกอลิธึมได้
  2. Model selection หลังจากที่ข้อมูลถูก Preprocessing แล้วขั้นต่อไปจะเป็นขั้นตอนในการเลือกโมเดลที่จะนำมาใช้งาน AutoML จะทดลองกับหลายอัลกอลิธึมเพื่อให้ได้โมเดลที่ทำงานได้ดีที่สุดกับข้อมูลของเราโดยโมเดลเป็นไปได้ตั้งแต่โมเดลพื้นฐานแบบง่ายๆ ไปจนถึงโมเดลที่มีความซับซ้อนและในแต่ละอัลกอลิธึมก็จะมีการทำ Hyper-parameter tuning เพื่อทดลอง Hyper-parameter ของแต่ละอัลกอลิธึมให้ได้ผลลัพท์การทำนายที่ดีที่สุดสำหรับโมเดลนั้น ๆ ในขั้นตอนนี้จะมีการเก็บ Parameter ที่ใช้งานในการทดลองรวมทั้งโมเดลที่ถูกสร้างขึ้นมา
  3. แสดงผลลัพธ์ของโมเดลต่าง ๆ และให้ Code/Notebook เพื่อใช้ในการปรับปรุงหรือแก้ไขเพิ่มเติม โดยหลังจากที่เราได้โมเดลที่ดีที่สุดแล้ว เราสามารถที่จะนำโมเดลนั้นไปใช้งานหรือ Deploy จริงได้เลย หรือถ้านักวิทยาศาสตร์ข้อมูลต้องการที่จะปรับปรุงโมเดลให้ดีขึ้นก็จะมี Code/Notebook ที่ AutoML สร้างขึ้นมาให้นำไปใช้งานต่อได้
  4. Model deployment AutoML ออกแบบมาเพื่อช่วยลดความซับซ้อนและยุ่งยากในการพัฒนาโมเดลรวมถึงการนำโมเดลไปใช้งานจริง ในขั้นตอนสุดท้ายนี้เราสามารถที่จะเลือกโมเดลที่ดีที่สุดที่เราเก็บไว้ ทั้งจากในขั้นตอนที่ 2 และ 3 นำไปใช้งานได้เลย โดยเมื่อเราเลือกโมเดลที่จะใช้งานได้แล้ว AutoML ก็จะช่วยสร้าง REST API ที่เราสามารถให้โปรแกรมต่าง ๆ ของเรามาเรียกใช้โมเดลได้
The final result is sorted by selected metric (f1 score)
Data scientists can use generated notebooks to adjust the training code as needed.

Conclusion

AutoML เป็นชุดเครื่องมือและเทคนิคที่มีความอัตโนมัติสามารถช่วยให้งานที่ซับซ้อนในกระบวนการสร้างและนำโมเดลไปใช้งานง่ายขึ้นได้
เทคนิคนี้จะช่วยให้องค์กรที่ยังไม่มีผู้เชี่ยวชาญในกาสร้างโมเดล Machine learning เริ่มต้นได้เร็วขึ้น ใช้ค่าใช้จ่ายต่ำลงและสำหรับองค์กรที่มีผู้เชี่ยวชาญอยู่แล้วก็สามารถใช้ประโยชน์ได้เช่นกันในมุมของการนำเอา AutoML มาใช้สร้างโมเดลพื้นฐานเพื่อนำมาเปรียบเทียบและพัฒนาต่อยอดได้ไวขึ้น

ในขณะที่การนำ Machine learning มาใช้งานเพื่อตอบโจทย์ทางธุรกิจยังคงเติบโตอย่างรวดเร็วและต่อเนื่อง การใช้ AutoML จึงเป็นสิ่งสำคัญที่สุดสำหรับองค์กร ในการนำ Machine learning ไปใช้ประโยชน์ เพื่อช่วยให้งานที่เกี่ยวข้องเป็นไปได้อย่างมีประสิทธิภาพ หากคุณกำลังมองหา AutoML Tools
SCB TechX พร้อมให้คำปรึกษาและบริการด้าน Data Platform แบบครบวงจร จากผู้เชี่ยวชาญมืออาชีพผู้มีประสบการณ์ด้าน Data ให้แก่บริษัทชั้นนำมากมาย สนใจสอบถามข้อมูลเพิ่มเติมโปรดส่งรายละเอียดมาได้เลยที่ contact@scbtechx.io 😊

#scbtechx #datascience #technology

--

--