Ivan Lee – Medium

Ivan Lee

Ivan Lee
in
Change The World With Technology

Linear Neural Networks for Classification, Generalization and Distribution Shift

本文介紹 Dive into Deep Learning 的第四章節，如果對線性模型不熟，推薦可以翻第三章節的東西，這篇我們介紹一下從純回歸模型拓展到分類模型的過程，以及在第三章的基礎上，並討論模型的泛化性，以及一些部屬模型在實物的分佈轉移的問題與解決方案。

Apr 28, 2023

Linear Neural Networks for Classification, Generalization and Distribution Shift

Apr 28, 2023

Ivan Lee

Rust: Hello World!

今天這篇教學要分享Rust，以及安裝與操作等步驟

Dec 12, 2021

Rust: Hello World!

Dec 12, 2021

Ivan Lee
in
Change The World With Technology

Exploration: part 2

該篇延續Exploration part1，使用文筆的方式介紹。

Feb 25, 2021

Exploration: part 2

Feb 25, 2021

Ivan Lee
in
Exploration by Ivan

教育是場軍備競賽

最近在看彭明輝的研究生完全求生手冊，發現說許多教育都與「競爭」掛鈎，你會覺得說：「喔不是嗎？」，但這競爭的體現在於國家意志上。例如之前聽得到的精英日課提到，為什麼各國會開設物理系，是各國領導見識到核子彈的強大。鐵血宰相卑斯麥提到：「想知道德意志的強大，看看我們的小學就知道」。有份…

Feb 3, 2021

Feb 3, 2021

Ivan Lee
in
Change The World With Technology

Transfer and Multi-Task Learning

今天來分享cs285的第十六章節Transfer and Multi-task…

Dec 5, 2020

Transfer and Multi-Task Learning

Dec 5, 2020

Ivan Lee
in
Change The World With Technology

SHARE RESEARCH

過去各個平台的線上研究分享，包含論文翻譯、論文整理與知識分享

Oct 23, 2020

Oct 23, 2020

Ivan Lee
in
Change The World With Technology

Value Function Methods

這章分享價值函數，內容會圍繞有A2C後，怎直接做價值評估。藉由推導估計與迭代方法，我們會得到著名已久的Q-learning。

Apr 11, 2020

Value Function Methods

Apr 11, 2020

Ivan Lee
in
Change The World With Technology

Policy Gradient

這章節介紹reinforcement learning中，policy的模型，以此為基礎，發展出後續的PPO、A2C算法。

Mar 7, 2020

Policy Gradient

Mar 7, 2020

Ivan Lee
in
Change The World With Technology

Finite Markov Decision Processes 有限馬爾科夫鏈

照著Sutton第三章節做的內容分享。對初始的RL學習來說，了解符號，以及狀態、動作、跟獎勵之間的關係非常重要，我們來先從馬爾科夫鏈說起。

Feb 8, 2020

Finite Markov Decision Processes 有限馬爾科夫鏈

Feb 8, 2020

Ivan Lee
in
Exploration by Ivan

關於「不正確答案」這件事兒

今天在看「學習如何學習這本書」，第二章講解專注與集中模式兩件事情，尾巴最後的測試是用1–4的正三角形去解題，題目是，用把這個三角形尖端跟底部顛倒過來，但具體只能移動三個，以下是自子的思路歷程：

Jul 21, 2019

Jul 21, 2019

Ivan Lee

Ivan Lee

Following

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams