Quoridorというボードゲームがある。1対1で駒を動かすか、壁を作って相手を妨害しながら、相手より先に向かい側まで到達する、というゲームだ。
さすがにゼロから作ったわけではないだろうと思い、調べて見たところ、2017年にポートフォリオマネジメントを強化学習で行う論文が出ていたようだ。
それを元にOpenAI Gymで実装したものが見つかった。
来週末までに見て友人に共有する予定。
下記の本を友人と1節2時間ずつぐらいかけて輪読してたのだが、1.4.2で挫折した。
これからの強化学習を読んでいる。1.3.3. にてSarsaというアルゴリズムが紹介されていたので、参考記事を一部修正する形で実装した。
友人と、「これからの強化学習」の読書会をしている。