Cómo hacer un robot rastrero con aprendizaje reforzado — Q-learning es un algoritmo de aprendizaje reforzado basado en el cambio de estados y la retroalimentación, comúnmente usados para la resolución de laberintos en su más básica implementación. Si deseas profundizar más acerca del tema, antes de empezar el proyecto, te invito a que puedas leer el siguiente articulo: Introduction to Q-Learning
Imagine yourself in a treasure hunt in a maze . The game is as follows :towardsdatascience.com