曹灝翰 – Medium

曹灝翰

Pinned

曹灝翰

〈論文研討〉BitNet: Scaling 1-bit Transformers for Large Language Models

最近有時間來看一些有趣的論文，也一段時間沒有跟進關於LLM最新的發展，就發現了這一篇非常新，且是關於提高LLM運算效率與效能的論文，由微軟與清華大學的研究團隊共同發表，這篇文章的目的，是希望用中文以及容易理解的文字解析該論文，分享重點與其精華，細節若不夠詳盡請參考原論文。

Feb 20

〈論文研討〉BitNet: Scaling 1-bit Transformers for Large Language Models

Feb 20

曹灝翰

〈論文研討〉Provably Powerful Graph Neural Networks for Directed Multigraphs

Dec 30, 2023

〈論文研討〉Provably Powerful Graph Neural Networks for Directed Multigraphs

Dec 30, 2023

曹灝翰

〈論文研討〉EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

近來開始學習CV，雖然這些論文都已經是多年前的東西，現在的新技術與演算法進步飛速，但我還是決定從複習經典的論文開始，當作打好基本功，也多試一些簡單的模型實作，這些畢竟都是前人鋪好的路，走起來也不會太困難，又能夠讓我了解一路發展的過程，從一開始的 CNN 到 ResNet…

Oct 31, 2023

〈論文研討〉EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

Oct 31, 2023

曹灝翰

〈論文研討〉A Learned Performance Model For Tensor Processing Units

最近在研究 Google 舉辦的 Kaggle 競賽- Google — Fast or Slow? Predict AI Model Runtime，因此查看了相關的原始論文，這篇論文是由 Samuel J. Kaufman…

Sep 27, 2023

〈論文研討〉A Learned Performance Model For Tensor Processing Units

Sep 27, 2023

曹灝翰

〈論文研討〉Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models

這篇文章將討論由微軟研究團隊發表的論文: Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models

Sep 6, 2023

〈論文研討〉Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models

Sep 6, 2023

曹灝翰

〈論文研討〉Real-time Personalization using Embeddings for Search Ranking at Airbnb (上)

因為最近工作剛好頻繁接觸到 embedding 以及公司客戶有飯店業，在查資料的時候又看到這篇論文，覺得挺有趣，就想要紀錄一下，這篇文章將討論由 Airbnb 在 KDD2018 發表的論文: Real-time Personalization using…

Aug 28, 2023

〈論文研討〉Real-time Personalization using Embeddings for Search Ranking at Airbnb (上)

Aug 28, 2023

曹灝翰

〈論文研討〉Gorilla: Large Language Model Connected with Massive APIs

這篇文章將討論由 UC Berkerly 與Microsoft 發表的論文: Gorilla: Large Language Model Connected with Massive APIs

Aug 18, 2023

〈論文研討〉Gorilla: Large Language Model Connected with Massive APIs

Aug 18, 2023

曹灝翰

〈論文研討〉Retentive Network: A Successor to Transformer for Large Language Models

這篇文章將討論由微軟研究團隊與清華大學共同發表的論文: Retentive Network: A Successor to Transformer for Large Language Model

Aug 11, 2023

〈論文研討〉Retentive Network: A Successor to Transformer for Large Language Models

Aug 11, 2023

曹灝翰

〈論文研討〉LONGNET: Scaling Transformers to 1,000,000,000 Tokens

這篇文章將討論由微軟研究團隊最新發表的論文: LONGNET: Scaling Transformers to 1,000,000,000 Tokens，希望用中文以及容易理解的文字解析論文，分享重點與其主要目標。

Aug 8, 2023

〈論文研討〉LONGNET: Scaling Transformers to 1,000,000,000 Tokens

Aug 8, 2023

曹灝翰

曹灝翰

AI Intern @GoFreight | Ex-Data Scientist Intern @Aiii.Ai

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams