Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 5: Programación dinámica — Parte 2: Implementación en…En la parte anterior de este capítulo vimos la teoría detrás de los algoritmos de programación dinámica en aprendizaje por refuerzo. En…Dec 19, 2023Dec 19, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 5: Programación dinámica — Parte 1: TeoríaY llegamos al quinto capítulo sobre programación dinámica.Dec 19, 2023Dec 19, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 4: Min-Max y Alpha-Beta Pruning — Parte 3: Implementación…En la dos partes anteriores de esta capítulo vimos los algoritmos de Min-Max y Alpha-Beta Pruning, analizamos un ejemplo y realizamos la…Dec 7, 2023Dec 7, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 4: Min-Max y Alpha-Beta Pruning — Parte 2: Alpha-Beta…En la parte anterior explicamos el algoritmo Min-Max como una estrategia de simular todas las posibles jugadas para seleccionar la que…Dec 7, 2023Dec 7, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 4: Min-Max y Alpha-Beta Pruning — Parte 1: Min-MaxArrancamos el cuarto capítulo de esta serie sobre aprendizaje por refuerzo.Dec 7, 2023Dec 7, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 3: Multi-armed bandit — Parte 3: Implementación en PythonY llegamos a la ultima parte de este capítulo. En las partes anteriores vimos como funcionan diferentes estrategias para resolver el…Dec 6, 2023Dec 6, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 3: Multi-armed bandit — Parte 2: UCB, Softmax y muestreo…Arrancamos este segunda parte del capítulo de Multi-armed bandit donde vamos a ver las estrategias de Upper Confidence Bound, Softmax y…Dec 6, 2023Dec 6, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 3: Multi-armed bandit— Parte 1: Epsilon-greedy y…Bienvenidos al tercer capítulo de esta serie sobre aprendizaje por refuerzo.Dec 6, 2023Dec 6, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 2: Introducción — Parte 3: Funciones de valorBienvenidos a la tercer y última parte de este capítulo donde nos vamos a centrar en las funciones de valor, que evalúan la utilidad de…Dec 5, 2023Dec 5, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 2: Introducción — Parte 2: Recompensas, retornos y MarkovY continuamos el segundo capitulo sobre aprendizaje por refuerzo.Dec 5, 2023Dec 5, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 2: Introducción — Parte 1: ¿Qué es el aprendizaje por…Bienvenidos a la primera parte de este segundo capítulo de la serie sobre aprendizaje por refuerzo.Dec 5, 2023Dec 5, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 1: Historia del aprendizaje por refuerzo — Parte 3…Bienvenidos a la ultima parte de este capítulo sobre la historía del aprendizaje por refuerzo.Dec 5, 2023Dec 5, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 1: Historia del aprendizaje por refuerzo — Parte 2…Bienvenidos a la segunda parte de la historia del aprendizaje por refuerzo.Dec 4, 2023Dec 4, 2023
Joan CerretaniAprendizaje por refuerzo (RL) — Capítulo 1: Historia del aprendizaje por refuerzo — Parte 1…Bienvenidos al primer capítulo dedicado al tema del aprendizaje por refuerzo o también conocido como Reinforcement Learning (RL). En este…Dec 4, 2023Dec 4, 2023