3. Funciones de valor y la ecuación de Bellman
Acceso abierto al capítulo 3 del libro Introducción al aprendizaje por refuerzo profundo

En el capítulo anterior hemos visto que el agente necesita de una política para realizar la tarea encomendada. En este capítulo presentaremos las funciones de valor y la ecuación de Bellman, elementos principales de los algoritmos de…