Hou Yi-tong深入淺出Inverse Reinforcement Learning 第三課(上)Maximum Entropy Inverse Reinforcement LearningMar 21, 2019Mar 21, 2019
Hou Yi-tong3.4 分節式任務與連續式任務統一表示法(Unified Notation for Episodic and Continuing Tasks)一、前言Feb 11, 2019Feb 11, 2019
Hou Yi-tong3.3.2回報( Returns)何謂目光淺短?又如何稱作有遠見?該如何用數學式表達?想知道的話就點進來看吧!此章節將討論3.3.1這樣設計的瑕疵與修正。Feb 3, 2019Feb 3, 2019
Hou Yi-tong3.3.1回報( Returns)同樣將3.3節拆成兩個區塊3.3.1討論回報的定義跟分節式的任務,3.3.2討論這樣設計的瑕疵與修正。Feb 2, 2019Feb 2, 2019