5. Evaluación de políticas con Monte Carlo

Acceso abierto al capítulo 5 del libro Introducción al aprendizaje por refuerzo profundo

https://TORRES.AI/aprendizaje-por-refuerzo

Otro de los métodos clásicos de aprendizaje por refuerzo es el método Monte Carlo, que permite una solución aproximada al aprendizaje basada en el muestreo estadístico a partir de la experiencia. A diferencia de la programación dinámica, este…

--

--

--

El objetivo de esta publicación es ser una guía para los lectores y lectoras que quieran iniciarse en los conceptos teóricos del aprendizaje por refuerzo profundo y al mismo tiempo facilitarles un conocimiento práctico con la programación de los principales algoritmos.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
Jordi TORRES.AI

Jordi TORRES.AI

Professor at UPC Barcelona Tech & Barcelona Supercomputing Center. Research focuses on Supercomputing & Artificial Intelligence https://torres.ai @JordiTorresAI

More from Medium

Uncertainty in Forecasts, Weather and Other, Part 2: Commune With Ensembles

Thermal Modeling of Buildings using Physics Informed Neural Networks

The first RL approach to control blood glucose without requiring meal announcements.

How to Track Space Objects on Orbit