Jimmy HsiehConvergence of Reinforcement Learning(RL) & Large Language Models(LLMs)1. RL與LLMs這兩個領域的結合一直有著巨大的潛力,特別是 LLMs 可以進一步從 RL 框架中受益,許多人都在研究如何更好使用這些技術和觀念來衍生出更好的效能Dec 15, 2023Dec 15, 2023
Jimmy HsiehPaper筆記1 — Adversarial attackAdversarial attack是一種在機器學習和AI中使用的技術,是人為的惡意攻擊,讓系統誤認目標,混淆視聽,或是將特定的A判別為B,目的都是要讓系統的判斷產生錯誤,尤其是神經網絡。對抗性攻擊的目標是創建看似正常的輸入,但當模型處理時,會導致不正確或意外的結果。Oct 22, 2023Oct 22, 2023