Tagged in

OpenAI

aureliantactics

Blogging about Reinforcement Learning and Machine Learning. Github repo at: https://github.com/AurelianTactics

More information

Followers

105

Elsewhere

More, on Medium

OpenAI

AurelianTactics in aureliantactics

Feb 3, 2019

Trust Region-Guided Proximal Policy Optimization

AurelianTactics in aureliantactics

Jan 31, 2019

Custom Models with Baselines: IMPALA CNN, CNNs with Features, and Contra 3 Hard Mode

1 response

AurelianTactics in aureliantactics

Jan 11, 2019

Beating Contra III on Easy Mode with Reinforcement Learning — Part 3 Discussion

AurelianTactics in aureliantactics

Jan 11, 2019

Beating Contra III on Easy Mode with Reinforcement Learning — Part 2: Experiment

1 response

AurelianTactics in aureliantactics

Jan 11, 2019

Beating Easy Mode on Contra III with Reinforcement Learning — Part 1: Introduction

2 responses

AurelianTactics in aureliantactics

Dec 30, 2018

Basic TRFL Usage: Q-Learning and Double Q-Learning

AurelianTactics in aureliantactics

Dec 13, 2018

Understanding PPO Plots in TensorBoard

OpenAI Baselines and Unity Machine Learning have TensorBoard integration for their Proximal…

3 responses

AurelianTactics in aureliantactics

Dec 8, 2018

Retro Gym with Baselines: 4 Basic Usage Tips

A short summary and code example followed by explanations.

AurelianTactics in aureliantactics

Oct 26, 2018

Tensorflow Implementation of TD3 in OpenAI Baselines

When I’m looking for new research papers to read, it’s often hard to tell what is worth reading. How reproducible are the results? Will this paper actually have a lasting impact in the field of Reinforcement Learning (RL)? With those…

AurelianTactics in aureliantactics

Aug 5, 2018

Using Joint PPO with Ray

Joint PPO is a modification of Proximal Policy Optimization (PPO). Joint PPO was used by the winner of OpenAI’s Retro Contest. Joint PPO in a few lines:

During meta-training, we train a single policy to play every level in the training set. Specifically, we…

3 responses