Programming

Open AI Gym คืออะไร? ทำไมฮอตฮิต ในหมู่นักพัฒนา AI

🤖 OpenAI คืออะไร ?

Achieve.Plus
Achieve Space

--

ก็คือ หน่วยงานกลางที่พัฒนา AI ที่ไม่หวังผลกำไร ก่อตั้งโดย Elon Musk แห่ง Tesla Motors และ Sam Altman ซีอีโอของบริษัทลงทุนชื่อดัง Y Combinator ที่เปิดให้ทุกคนเข้าถึงได้แทน รวมถึงยกสิทธิบัตรให้เป็นของสาธารณะด้วย เพื่อศึกษาวิจัยด้านปัญญาประดิษฐ์และเพื่อเป็นสมบัติของมนุษยชาติ ซึ่ง OpenAI ก็มีผลงานเป็นของตัวเองหลายชิ้น เช่น OpenAI Gym เครื่องมือสำหรับพัฒนา AI ที่ใช้งานง่าย เหมาะสำหรับผู้ที่สนใจจะนำ AI ไปใช้ในด้านต่างๆ

🤖 OpenAI Gym คืออะไร?

ก็คือ เครื่องมือสำหรับพัฒนาและเปรียบเทียบ Reinforcement Learning Algorithm โดยเฉพาะ เพื่อใช้สอน Agent ให้ทำสิ่งต่างๆ ได้มากมาย ไม่ว่าจะเป็นการเดิน หรือแม้แต่การเล่นหมากล้อม ซึ่ง OpenAI Gym เป็น tool ที่ใช้เทรน AI ของเราในโลกเสมือนจริง จึงทำให้เราเข้าใจ และเอา Algorithm ไปปฎิบัติจริงได้ เเละยังรองรับการใช้งานบน Python ด้วย โดยจะแบ่งเป็น 2 ส่วนสำคัญ คือ
(1) Gym library ก็คือ test suite
(2) OpenAI Gym service คือ เว็บที่ให้ผู้ใช้ได้ส่ง AI ของตนมาประชันความเจ๋งกัน ก็คล้ายๆกับ Kaggle ครับ แต่ทางนี้จะโฟกัสแค่ Reinforcement Learning เท่านั้น โดยส่วนใหญ่เเล้ว ตัวระบบมันจะมีความซับซ้อนสูง OpenAI เลยขอรับบทเป็นผู้รวบรวม test suite ทั้งหมดและทำให้มันมีมาตราฐานกลาง เพื่อลดปริมาณงานของนักวิจัย ให้พวกเขาลงแรงกับการพัฒนาตัว algorithm เพียงอย่างเดียว ผมว่าดีงามมาก
‍‍‍‍‍‍‍
🤖 เเล้ว Reinforcement Learning (RL) คืออะไร?
คือ 1 ใน 4 ปัญหาหลักของ Machine Learning (ML) นั่นเอง ได้รับแรงบันดาลใจมาจากการเรียนรู้แบบ Try-and-Error ในศาสตร์ของ Behaviorist Psychology โดยสนใจว่า เราจะทำอย่างไรได้บ้างที่สามารถทำให้โปรแกรม (Agent) สามารถสังเกตและเลือกกระทำการใดๆ (Action) กับสภาพแวดล้อมภายนอกรอบตัว (Environment) เพื่อให้ได้รางวัล (Reward) โดยตัว Agent สามารถเรียนรู้ได้ด้วยตนเองเพื่อให้ได้รางวัลด้านบวกมากที่สุด
‍‍‍‍‍‍‍
🤖 เพื่อให้เห็นภาพชัดเจนยิ่งขึ้น ลองนึกถึงภาพว่าเราสร้าง robot Agent (ผู้เรียนรู้) หรือ (โปรเเกรม) ขึ้นมาตัวหนึ่งจากนั้นจับไปปล่อยกลางเขาวงกต (Environment) แล้วออกคำสั่งว่าจงหาทางออกจากเขาวงกตให้ไวที่สุด (Reward คือ ทำคำสั่งสำเร็จหรือไม่ และเวลาที่ใช้ในการทำ) หลักๆ แล้ว RL มักจะเกี่ยวข้องกับ Control theory และ Game theory หรือแม้แต่ปัญหา Supervised learning ที่เกี่ยวข้องกับลำดับขั้นตอนและโครงสร้าง จริงๆเเล้ว Dota2 Jukebox ก็ใช้ OpenAI นะครับ เเต่เดี๋ยวเอาไว้เล่าในคอนเทนต์ถัดไป
‍‍‍‍‍‍‍
🐍 ใครที่สนใจงานด้าน AI เเละมีพื้นฐาน Python หรือเขียนภาษาอื่นเป็นอยู่เเล้ว มาฝึกวิเคราะห์โจทย์เอง + เขียนเองใน Attacking the Real World with Python อัดเเน่น 10 ชั่วโมง กับ 8 Python Projects !! นอกจากจะได้เรียนรู้ OpenAI Gym เเล้ว คุณยังจะได้เรียนรู้การนำไพธอนไปประยุกต์ใช้กับธุรกิจเเละเหตุการณ์ต่างๆในชีวิตประจำวันได้หลากหลายขึ้น

ขอบคุณข้อมูลจาก:
medium@thebear19
techtalkthai

--

--

Achieve.Plus
Achieve Space

Achieve Plus มุ่งที่จะสร้างสรรค์สังคมแห่งการเรียนรู้ในยุคดิจิทัลเพื่อคนไทย และ เพื่อการพัฒนา Thailand 4.0