10. Métodos policy-based: REINFORCE
Acceso abierto al capítulo 10 del libro Introducción al aprendizaje por refuerzo profundo

En este capítulo presentaremos una familia de algoritmos, llamados policy-based, que nos permiten aproximar directamente una función de política en lugar de una función de valor. Es decir, en lugar de entrenar una red neuronal para que genere los valores…