Jimmy Hsieh – Medium

Jimmy Hsieh

Jimmy Hsieh

Convergence of Reinforcement Learning(RL) & Large Language Models(LLMs)

1. RL與LLMs這兩個領域的結合一直有著巨大的潛力，特別是 LLMs 可以進一步從 RL 框架中受益，許多人都在研究如何更好使用這些技術和觀念來衍生出更好的效能

Dec 15, 2023

Convergence of Reinforcement Learning(RL) & Large Language Models(LLMs)

Dec 15, 2023

Jimmy Hsieh

RL : Q-Learning— CS筆記

目錄

Oct 26, 2023

RL : Q-Learning— CS筆記

Oct 26, 2023

Jimmy Hsieh

Paper筆記1 — Adversarial attack

Adversarial attack是一種在機器學習和AI中使用的技術，是人為的惡意攻擊，讓系統誤認目標，混淆視聽，或是將特定的A判別為B，目的都是要讓系統的判斷產生錯誤，尤其是神經網絡。對抗性攻擊的目標是創建看似正常的輸入，但當模型處理時，會導致不正確或意外的結果。

Oct 22, 2023

Paper筆記1 — Adversarial attack

Oct 22, 2023

Jimmy Hsieh

Next.js 學習心得1 : 介紹Next和SSR、SSG

一、自我簡介(可跳過)

Sep 7, 2022

Next.js 學習心得1 : 介紹Next和SSR、SSG

Sep 7, 2022

Jimmy Hsieh

Jimmy Hsieh

我是一個碩士生，接觸AI與數據科學相關領域，而我寫medium的原因單純只是想要把我平常所學的知識和心得記錄下來，希望能和其他初學者和大佬們一起討論學習。

Following

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams