Zain ul Abideen – Medium

Zain ul Abideen

Zain ul Abideen

Align Phi3 with CPO-SimPO

Align your LLM with less memory and speed efficient approach than DPO.

6d ago

Align Phi3 with CPO-SimPO

6d ago

Zain ul Abideen

Best LLM Inference Engine? TensorRT vs vLLM vs LMDeploy vs MLC-LLM

Benchmarking various LLM Inference Engines.

6d ago

Best LLM Inference Engine? TensorRT vs vLLM vs LMDeploy vs MLC-LLM

6d ago

Zain ul Abideen

MoE vs Dense vs Hybrid LLM Architectures

Train 600M MoE, Dense, Hybrid LLM Architectures.

Apr 29

MoE vs Dense vs Hybrid LLM Architectures

Apr 29

Zain ul Abideen

Schedule-Free Learning — A New Way to Train Models

Training 3 Llama models for comparison of Cosine Scheduled and Schedule-Free optimizer.

Apr 18

Schedule-Free Learning — A New Way to Train Models

Apr 18

Zain ul Abideen

Llama-Bitnet | Training a 1.58 bit LLM

What is 1 bit LLM and How to train 70M Llama-Bitnet?

Apr 4

Llama-Bitnet | Training a 1.58 bit LLM

Apr 4

Zain ul Abideen

ORPO Outperforms SFT+DPO | Train Phi-2 with ORPO

Train Phi-2 with ORPO with LazyOrpo

Mar 22

ORPO Outperforms SFT+DPO | Train Phi-2 with ORPO

Mar 22

Zain ul Abideen

Multi-GPU Training of 70B LLM with Deepspeed and FSDP+Qlora

Train 70–120B LLM on 4xA100s and 2xRTX3090s (Consumer-grade GPUs)

Mar 14

Multi-GPU Training of 70B LLM with Deepspeed and FSDP+Qlora

Mar 14

Zain ul Abideen

Weekly AI News | The Latest AI Updates| 3 Mar— 10 Mar

A quick dive into recent Generative-AI research, analyzing AI in business, and learn about this week’s recent AI tools.

Mar 11

Weekly AI News | The Latest AI Updates| 3 Mar— 10 Mar

Mar 11

Zain ul Abideen
in
Artificial Intelligence in Plain English

How to Train a 7B Coding Chat Model?

Fine-tuning Bigcode’s new Starcoder2–7B on 100k Glaive dataset.

Mar 10

How to Train a 7B Coding Chat Model?

Mar 10

Zain ul Abideen

Everything you need to know about Google’s new Gemma 7B and 2B Models

Also releasing Gemma-7B-Openhermes and Gemma-2B-Openhermes

Feb 29

Everything you need to know about Google’s new Gemma 7B and 2B Models

Feb 29

Zain ul Abideen

Zain ul Abideen

Machine Learning Engineer | I share what I learn. https://www.linkedin.com/in/zaiinulabideen/ | https://huggingface.co/abideen

Help
Status
About
Careers
Press
Blog
Privacy
Terms
Text to speech
Teams