【強化学習】書籍：これからの強化学習は1.4.2で挫折した。

Published in

Music and Technology

1 min readSep 19, 2017

--

下記の本を友人と1節2時間ずつぐらいかけて輪読してたのだが、1.4.2で挫折した。

これからの強化学習

Amazonで牧野貴樹, 澁谷長史, 白川真一, 浅田稔, 麻生英樹, 荒井幸代, 飯間等, 伊藤真, 大倉和博, 黒江康明, 杉本徳和, 坪井祐太, 銅谷賢治, 前田新一, 松井藤五郎, 南泰浩, 宮崎…

amzn.to

方策勾配に基づくアルゴリズムについての具体的なアルゴリズムについて、数式を求めて説明されているところなのだが、その数式を理解するための前提知識がないため、理解が及ばなくなった。

そもそも僕たちに、確率密度関数や共分散行列といった、比較的簡単な線形代数、確率の知識が足りてないことが問題。

ので、次回以降の輪読会ではその辺をやる予定。

それにしても強化学習は、DeepLearningなどと比べて実装例が少ないため、コードで理解する、ということが難しいように感じる。だからこそ、今この分野を勉強することが、強みになるのかもしれないけれど。

Reinforcement Learning

プログラミング

takkii

Written by takkii

Editor for

Music and Technology

Competitive Programming, MachineLearning, Manga, Music, BoardGame.

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams