5. Evaluación de políticas con Monte Carlo
Acceso abierto al capítulo 5 del libro Introducción al aprendizaje por refuerzo profundo

Otro de los métodos clásicos de aprendizaje por refuerzo es el método Monte Carlo, que permite una solución aproximada al aprendizaje basada en el muestreo estadístico a partir de la experiencia. A diferencia de la programación dinámica, este…