Sign in Get started

Tagged in

Reinforcement Learning

Music and Technology

Composition,Programming,Data Analysis and Tech

More information

Followers

22

Elsewhere

More, on Medium

Reinforcement Learning

takkii in Music and Technology

強化学習とQuoridor

Quoridorというボードゲームがある。1対1で駒を動かすか、壁を作って相手を妨害しながら、相手より先に向かい側まで到達する、というゲームだ。

takkii in Music and Technology

株の売り買いを深層強化学習

GMOさんの資料が上がっていた。

さすがにゼロから作ったわけではないだろうと思い、調べて見たところ、2017年にポートフォリオマネジメントを強化学習で行う論文が出ていたようだ。

それを元にOpenAI Gymで実装したものが見つかった。

来週末までに見て友人に共有する予定。

takkii in Music and Technology

【強化学習】書籍：これからの強化学習は1.4.2で挫折した。

下記の本を友人と1節2時間ずつぐらいかけて輪読してたのだが、1.4.2で挫折した。

takkii in Music and Technology

【強化学習】これからの強化学習 1.3.3. Sarsaの実装

これからの強化学習を読んでいる。1.3.3. にてSarsaというアルゴリズムが紹介されていたので、参考記事を一部修正する形で実装した。

takkii in Music and Technology

【強化学習】書籍『これからの強化学習』は面白いけど読み進めるのに時間がかかる

takkii in Music and Technology

【強化学習】「これからの強化学習」 1.1 の読書メモ

友人と、「これからの強化学習」の読書会をしている。