Yeni Başlayanlar İçin Reinforcement Learning -1

samethalici
Dec 13, 2020 · 2 min read

Üniversitede sınavlar için ders notu hazırlarken tek bakışta tüm konuyu anlayabileceğim “1 sayfada tek ders tek dönem” içerikli ders notu hazırlardım. Bu yüzden Reinforcement Learning nedir? ya da Pekiştirmeli Öğrenme nedir? diye araştıran kişilerin tek bakışta temelini anlayabileceği bir kaynak oluşturmaya çalışıyorum. Tabi kağıda sıkıştırarak yazmak gibi olmuyor burada fakat olabildiğince detaylı özetleyeceğim. Ve RL hakkındaki kişisel fikrim; henüz çok taze ve gelişmemiş bir konu. Herkes RL kullanmıyor. Dünya’da kullanım alanları da henüz çok fazla değil.

Reinforcement Learning, RL olarak kısaltılmıştır. Türkçe literatürde Pekiştirmeli Öğrenme ya da Takviyeli Öğrenme olarak kullanılmaktadır.

Makine öğrenmesinin denetimli öğrenme veya denetimsiz öğrenme yaklaşımlarından farklı olarak RL’de model, kendi kendine öğrenir.

Şekil-1 : Makine öğrenmesinin alt dalları
Şekil-1 : Makine öğrenmesinin alt dalları

RL hakkında konuşurken sıkça 5 temel terimden bahsedeceğiz. Bunların detaylı anlatımına Yeni Başlayanlar İçin Reinforcement Learning -2 yazım üzerinden erişebileceksiniz.(Yakında)

1-Environment: Agent’ın etkileşimde bulunduğu ortam, reward değerini ve yeni state’i gerçekleştirdiği etkileşim ile öğrenir. Çevre ya da ortam da denir.
2-Agent: Öğrenir ve karşılaştığı durumlara tepki verir. Environment içinde hareket eder. Environment’a belirli bilgiler gönderip alır. Ajan ya da çalışan da denir. Agent’ın öğrenmesi ve doğru aksiyonları alır hale gelmesi için gereken ortamı hazırlamak da bize düşüyor.
3-State: Agent’ın environment içinde nerede olduğu bilgisini state’den alırız.
4-Action: Agent’ın yapabileceği hareketi belirtir.
Örneğin; ileri git, sağa dön, sola dön ve geri git gibi 4 farklı action’dan oluşan bir action setimiz olabilir. Şekil-2'deki büyük A harfi action seti ifade eder.
5-Reward: Agent’ın amacı environment’da en optimum koşullar içerisinde reward’ı en büyük değere ulaştırabilmektir. Reward; hem ödül hem de ceza anlamında kullanılır. Reward için; Agent’ın amacı da diyebiliriz.

Şekil-2 : Agent ve Environment arasındaki etkileşim
Şekil-2 : Agent ve Environment arasındaki etkileşim
Şekil-2 : Agent ve Environment arasındaki etkileşim
Reinforcement Learning Turkiye

All things Reinforcement Learning including model based , model free, robotics, genetic algorithms, custom environments, agents, RLtoSimulation and more !

samethalici

Written by

Multi-Camera Processes, Video Summarization, Reinforcement Learning

Reinforcement Learning Turkiye

All things Reinforcement Learning including model based , model free, robotics, genetic algorithms, custom environments, agents, RLtoSimulation and more !