Yuki Minai – Medium

Yuki Minai

Yuki Minai

A taxonomy of RL algorithms

In previous blogs, I’ve introduced various reinforcement learning (RL) algorithms such as Deep Q-Learning, Actor-Critic, and Proximal…

Aug 4

A taxonomy of RL algorithms

Aug 4

Yuki Minai

Create a gymnasium custom environment (Part 2)

gymnasium packages contain a list of environments to test our Reinforcement Learning (RL) algorithm. For example, this previous blog used…

Mar 4

Mar 4

Yuki Minai

Create a gymnasium custom environment (Part 1)

Introduction

Mar 4

Mar 4

Yuki Minai

Find an optimal policy with Finite Markov Decision Process: Part3 TD-learning

In this series of blogs, we will delve into various methods for finding an optimal policy within the context of Finite Markov Decision…

Nov 20, 2023

Find an optimal policy with Finite Markov Decision Process: Part3 TD-learning

Nov 20, 2023

Yuki Minai

Find an optimal policy with Finite Markov Decision Process: Part2 Monte Carlo Methods

In this series of blogs, we will delve into various methods for finding an optimal policy within the context of Finite Markov Decision…

Nov 20, 2023

Find an optimal policy with Finite Markov Decision Process: Part2 Monte Carlo Methods

Nov 20, 2023

Yuki Minai

Find an optimal policy with Finite Markov Decision Process: Part1 Dynamic Programming

In this series of blogs, we will delve into various methods for finding an optimal policy within the context of Finite Markov Decision…

Nov 20, 2023

Find an optimal policy with Finite Markov Decision Process: Part1 Dynamic Programming

Nov 20, 2023

Yuki Minai

Exploring Multi-Armed Bandit Problem: Epsilon-Greedy, Epsilon-Decreasing, UCB, and Thompson…

To tackle the multi-armed bandit problem, we will learn well-established algorithms such as Greedy algorithm, UCB, and Thompson Sampling

Nov 20, 2023

Exploring Multi-Armed Bandit Problem: Epsilon-Greedy, Epsilon-Decreasing, UCB, and Thompson…

Nov 20, 2023

Yuki Minai

Yuki Minai

Ph.D. student in Neural Computation and Machine Learning at Carnegie Mellon University, Personal webpage: http://yukiminai.com

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams