Javier Abellán Abenza – Medium

Javier Abellán Abenza

Javier Abellán Abenza
in
Neurosapiens

Loss functions

Regression

Feb 18, 2019

Loss functions

Feb 18, 2019

Javier Abellán Abenza
in
Neurosapiens

CUDA index

Learn CUDA path

Jan 18, 2019

CUDA index

Jan 18, 2019

Javier Abellán Abenza
in
Neurosapiens

9. Oject detection

fast.ai DL2 Lesson 9: Single Shot Detection detailed walkthrough

Jan 13, 2019

9. Oject detection

Jan 13, 2019

Javier Abellán Abenza
in
Neurosapiens

11. Multi Agent RL

Monte Carlo Tree Search (MCTS)

Jan 5, 2019

11. Multi Agent RL

Jan 5, 2019

Javier Abellán Abenza
in
Neurosapiens

10. Actor Critic Methods

Deep Deterministic Policy Gradients (DDPG)

Jan 5, 2019

10. Actor Critic Methods

Jan 5, 2019

Javier Abellán Abenza
in
Neurosapiens

9. Policy Gradient Methods

Generalized Advantage Estimation (GAE), Trust Region Policy Optimization (TRPO) and Proximal Policy Optimization (PPO).

Jan 5, 2019

9. Policy Gradient Methods

Jan 5, 2019

Javier Abellán Abenza
in
Neurosapiens

8. Policy Based Methods

Evolutionary algorithms, stochastic policy search, and REINFORCE algorithm.

Jan 5, 2019

8. Policy Based Methods

Jan 5, 2019

Javier Abellán Abenza
in
Neurosapiens

7. Value Based Methods

Deep Q-Network (DQN), along with Double-DQN, Dueling-DQN, and Prioritized Replay.

Jan 5, 2019

7. Value Based Methods

Jan 5, 2019

Javier Abellán Abenza
in
Neurosapiens

5. RL in Continuous Spaces

Learn how to adapt traditional algorithms to work with continuous spaces. Discretization. Tile Coding

Jan 5, 2019

5. RL in Continuous Spaces

Jan 5, 2019

Javier Abellán Abenza
in
Neurosapiens

4. Temporal-Difference Learning

Learn the difference between the Sarsa, Q-Learning, and Expected Sarsa algorithms.

Jan 5, 2019

4. Temporal-Difference Learning

Jan 5, 2019

Javier Abellán Abenza

Javier Abellán Abenza

M.S. Computer Science student interested in deep learning

Following

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams