Pinned曹灝翰〈論文研討〉BitNet: Scaling 1-bit Transformers for Large Language Models最近有時間來看一些有趣的論文,也一段時間沒有跟進關於LLM最新的發展,就發現了這一篇非常新,且是關於提高LLM運算效率與效能的論文,由微軟與清華大學的研究團隊共同發表,這篇文章的目的,是希望用中文以及容易理解的文字解析該論文,分享重點與其精華,細節若不夠詳盡請參考原論文。Feb 201Feb 201
曹灝翰〈論文研討〉EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks近來開始學習CV,雖然這些論文都已經是多年前的東西,現在的新技術與演算法進步飛速,但我還是決定從複習經典的論文開始,當作打好基本功,也多試一些簡單的模型實作,這些畢竟都是前人鋪好的路,走起來也不會太困難,又能夠讓我了解一路發展的過程,從一開始的 CNN 到 ResNet…Oct 31, 20231Oct 31, 20231
曹灝翰〈論文研討〉A Learned Performance Model For Tensor Processing Units最近在研究 Google 舉辦的 Kaggle 競賽- Google — Fast or Slow? Predict AI Model Runtime,因此查看了相關的原始論文,這篇論文是由 Samuel J. Kaufman…Sep 27, 2023Sep 27, 2023
曹灝翰〈論文研討〉Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models這篇文章將討論由微軟研究團隊發表的論文: Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language ModelsSep 6, 20231Sep 6, 20231
曹灝翰〈論文研討〉Real-time Personalization using Embeddings for Search Ranking at Airbnb (上)因為最近工作剛好頻繁接觸到 embedding 以及公司客戶有飯店業,在查資料的時候又看到這篇論文,覺得挺有趣,就想要紀錄一下,這篇文章將討論由 Airbnb 在 KDD2018 發表的論文: Real-time Personalization using…Aug 28, 2023Aug 28, 2023
曹灝翰〈論文研討〉Gorilla: Large Language Model Connected with Massive APIs這篇文章將討論由 UC Berkerly 與Microsoft 發表的論文: Gorilla: Large Language Model Connected with Massive APIsAug 18, 20231Aug 18, 20231
曹灝翰〈論文研討〉Retentive Network: A Successor to Transformer for Large Language Models這篇文章將討論由微軟研究團隊與清華大學共同發表的論文: Retentive Network: A Successor to Transformer for Large Language ModelAug 11, 2023Aug 11, 2023
曹灝翰〈論文研討〉LONGNET: Scaling Transformers to 1,000,000,000 Tokens這篇文章將討論由微軟研究團隊最新發表的論文: LONGNET: Scaling Transformers to 1,000,000,000 Tokens,希望用中文以及容易理解的文字解析論文,分享重點與其主要目標。Aug 8, 2023Aug 8, 2023