Yuki Minai – Medium

Yuki Minai

Yuki Minai

A taxonomy of RL algorithms

In previous blogs, I’ve introduced various reinforcement learning (RL) algorithms such as Deep Q-Learning, Actor-Critic, and Proximal…

Aug 4

A taxonomy of RL algorithms

Aug 4

Yuki Minai

MuZero: Model-based RL (part3)

In part 1, we learned Monte Carlo Tree Search to collect training data. In part 2, we covered the deep learning models used in MuZero. In…

Jun 21

MuZero: Model-based RL (part3)

Jun 21

Yuki Minai

MuZero: Model-based RL (part2)

This is a series of blog posts to learn Muzero, which is a popular model-based reinforcement learning algorithm.

Jun 21

Jun 21

Yuki Minai

MuZero: Model-based RL (part1)

In previous posts, I introduced various Reinforcement Learning (RL) methods such as Q-learning, Deep Q-learning, and Actor-Critic. These…

Jun 21

MuZero: Model-based RL (part1)

Jun 21

Yuki Minai

Create a gymnasium custom environment (Part 2)

gymnasium packages contain a list of environments to test our Reinforcement Learning (RL) algorithm. For example, this previous blog used…

Mar 4

Mar 4

Yuki Minai

Create a gymnasium custom environment (Part 1)

Introduction

Mar 4

Mar 4

Yuki Minai

Proximal Policy Optimization Tutorial

From REINFORCE with baseline to Proximal Policy Gradient

Jan 25

Proximal Policy Optimization Tutorial

Jan 25

Yuki Minai

Policy gradient methods: From REINFORCE to Actor Critic

The reinforcement learning methods we learned in previous articles such as Monte Carlo Methods, TD-learning, and Deep Q-learning learn…

Dec 15, 2023

Policy gradient methods: From REINFORCE to Actor Critic

Dec 15, 2023

Yuki Minai

Deep Q-learning (DQN) Tutorial with CartPole-v0

In this series of articles, I have introduced various policy iteration algorithms to solve Markov Decision Processes (MDPs) such as Dynamic…

Dec 15, 2023

Deep Q-learning (DQN) Tutorial with CartPole-v0

Dec 15, 2023

Yuki Minai

Find an optimal policy with Finite Markov Decision Process: Part3 TD-learning

In this series of blogs, we will delve into various methods for finding an optimal policy within the context of Finite Markov Decision…

Nov 20, 2023

Find an optimal policy with Finite Markov Decision Process: Part3 TD-learning

Nov 20, 2023

Yuki Minai

Yuki Minai

Ph.D. student in Neural Computation and Machine Learning at Carnegie Mellon University, Personal webpage: http://yukiminai.com

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams