Albert Chen – Medium

Albert Chen

Albert Chen

Distributed Computing for Training Large Models with AWS SageMaker

Introduction

Apr 22

Distributed Computing for Training Large Models with AWS SageMaker

Apr 22

Albert Chen

客製化的大型語言模型 (LLM) — 針對特定領域做 Continual pre-training

一般的大型語言模型在特定領域，比如醫療或金融，往往無法滿足行業需求。因此，各行業急需客製化的LLM，可以利用行業累積的文本數據來訓練，這也是業界相對於學界的優勢。

Jan 29

客製化的大型語言模型 (LLM) — 針對特定領域做 Continual pre-training

Jan 29

Albert Chen

大型語言模型的預訓練任務

ChatGPT…

Jan 4

大型語言模型的預訓練任務

Jan 4

Albert Chen

不同於以往的 pretraining — BloombergGPT

重點摘錄如下：

Dec 26, 2023

不同於以往的 pretraining — BloombergGPT

Dec 26, 2023

Albert Chen

LLM 時代下的繁體中文 Tokenization?

在預訓練語言模型（PLMs）中，斷詞是基礎性的工作。現有的中文PLMs分詞方法通常將每個字符視為不可分割的標記。然而，它們忽略了中文書寫系統的獨特特徵，即在字符級別以下存在額外的語言信息，也就是子字符級別。為了利用這些信息，在簡體中文的研究中，已有學者提出了子字符（簡稱SubCh…

Dec 24, 2023

LLM 時代下的繁體中文 Tokenization?

Dec 24, 2023

Albert Chen

Albert Chen

Senior Data Scientist at a US tech firm specializing in AI, Big Data, Deep Learning, NLP, and PySpark. Experienced in Transformer models.

Following

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams