9. Métodos value-based: Deep Q-Network
Acceso abierto al capítulo 9 del libro Introducción al aprendizaje por refuerzo profundo

En la primera parte del libro hemos visto que el algoritmo Q-Learning se puede usar para un entorno simple implementando la función Q como una tabla o matriz de valores (la llamada Q-table). Pero esta aproximación resulta inviable cuando hay millones…