Esse post é a continuação de uma introdução ao assunto de reinforcement learning, leia a primeira parte aqui.