【強化学習】書籍:これからの強化学習は1.4.2で挫折した。

takkii
Music and Technology
1 min readSep 19, 2017

下記の本を友人と1節2時間ずつぐらいかけて輪読してたのだが、1.4.2で挫折した。

方策勾配に基づくアルゴリズムについての具体的なアルゴリズムについて、数式を求めて説明されているところなのだが、その数式を理解するための前提知識がないため、理解が及ばなくなった。

そもそも僕たちに、確率密度関数や共分散行列といった、比較的簡単な線形代数、確率の知識が足りてないことが問題。

ので、次回以降の輪読会ではその辺をやる予定。

それにしても強化学習は、DeepLearningなどと比べて実装例が少ないため、コードで理解する、ということが難しいように感じる。だからこそ、今この分野を勉強することが、強みになるのかもしれないけれど。

--

--

takkii
Music and Technology

Competitive Programming, MachineLearning, Manga, Music, BoardGame.