Ivan LeeinChange The World With TechnologyLinear Neural Networks for Classification, Generalization and Distribution Shift本文介紹 Dive into Deep Learning 的第四章節,如果對線性模型不熟,推薦可以翻第三章節的東西,這篇我們介紹一下從純回歸模型拓展到分類模型的過程,以及在第三章的基礎上,並討論模型的泛化性,以及一些部屬模型在實物的分佈轉移的問題與解決方案。Apr 28, 2023Apr 28, 2023
Ivan LeeinChange The World With TechnologyExploration: part 2該篇延續Exploration part1,使用文筆的方式介紹。Feb 25, 2021Feb 25, 2021
Ivan LeeinExploration by Ivan教育是場軍備競賽最近在看彭明輝的研究生完全求生手冊,發現說許多教育都與「競爭」掛鈎,你會覺得說:「喔不是嗎?」,但這競爭的體現在於國家意志上。例如之前聽得到的精英日課提到,為什麼各國會開設物理系,是各國領導見識到核子彈的強大。鐵血宰相卑斯麥提到:「想知道德意志的強大,看看我們的小學就知道」。有份…Feb 3, 2021Feb 3, 2021
Ivan LeeinChange The World With TechnologyTransfer and Multi-Task Learning今天來分享cs285的第十六章節Transfer and Multi-task…Dec 5, 2020Dec 5, 2020
Ivan LeeinChange The World With TechnologySHARE RESEARCH過去各個平台的線上研究分享,包含論文翻譯、論文整理與知識分享Oct 23, 2020Oct 23, 2020
Ivan LeeinChange The World With TechnologyValue Function Methods這章分享價值函數,內容會圍繞有A2C後,怎直接做價值評估。藉由推導估計與迭代方法,我們會得到著名已久的Q-learning。Apr 11, 2020Apr 11, 2020
Ivan LeeinChange The World With TechnologyPolicy Gradient這章節介紹reinforcement learning中,policy的模型,以此為基礎,發展出後續的PPO、A2C算法。Mar 7, 2020Mar 7, 2020
Ivan LeeinChange The World With TechnologyFinite Markov Decision Processes 有限馬爾科夫鏈照著Sutton第三章節做的內容分享。對初始的RL學習來說,了解符號,以及狀態、動作、跟獎勵之間的關係非常重要,我們來先從馬爾科夫鏈說起。Feb 8, 2020Feb 8, 2020
Ivan LeeinExploration by Ivan關於「不正確答案」這件事兒今天在看「學習如何學習這本書」,第二章講解專注與集中模式兩件事情,尾巴最後的測試是用1–4的正三角形去解題,題目是,用把這個三角形尖端跟底部顛倒過來,但具體只能移動三個,以下是自子的思路歷程:Jul 21, 2019Jul 21, 2019