Homepage
Open in app
Sign in
Get started
SqueezeBits Team Blog
SqueezeBits Team Blog
Team
Product
Tech Insight
Career
Follow
Latest
[vLLM vs TensorRT-LLM] #1. An Overall Evaluation
[vLLM vs TensorRT-LLM] #1. An Overall Evaluation
vLLM and TensorRT-LLM are two leading frameworks for efficiently serving Large Language Models (LLMs). vLLM is a fast, user-friendly…
Yeonjoon Jung
Sep 30
OwLite로 YOLOv5 모델 경량화하기 3/3 — QAT, Dynamic batch size 엔진 생성
OwLite로 YOLOv5 모델 경량화하기 3/3 — QAT, Dynamic batch size 엔진 생성
마지막으로, OwLite를 통해 경량화 모델을 학습시키는 QAT와 Dynamic batch size 엔진을 생성하는 과정을 소개합니다.
Sarang Kim
Sep 24
OwLite로 YOLOv5 모델 경량화하기 2/3 — Experiment 생성, Quantization option 적용하기
OwLite로 YOLOv5 모델 경량화하기 2/3 — Experiment 생성, Quantization option 적용하기
1편에 이어서, OwLite를 사용해 Experiment를 생성하고 Quantization option을 적용하는 과정을 소개합니다.
Sarang Kim
Sep 19
OwLite로 YOLOv5 모델 경량화하기 1/3 — OwLite 환경 세팅, Baseline 등록
OwLite로 YOLOv5 모델 경량화하기 1/3 — OwLite 환경 세팅, Baseline 등록
OwLite 도입의 첫 단계로, 사용 환경을 설정하고 Baseline을 등록하는 과정을 소개합니다.
Sarang Kim
Sep 12
스퀴즈비츠 브랜딩 가이드 구축기
스퀴즈비츠 브랜딩 가이드 구축기
최근 스퀴즈비츠 홈페이지가 리뉴얼된 것을 눈치채셨나요? 스퀴즈비츠의 상징이었던 주황색에 더해, 보라색이 추가된 그래픽으로 홈페이지가 한층 더 다채로워졌습니다.
Yeonjeong Lee
Sep 2
[EN] FP8 Quantization with OwLite
[EN] FP8 Quantization with OwLite
Introducing FP8 Quantization applied to OwLite.
Changjun Lee
Aug 4
[KR] OwLite와 함께하는 FP8 Quantization
[KR] OwLite와 함께하는 FP8 Quantization
OwLite에 적용된 FP8 Quantization을 소개해드립니다.
Changjun Lee
Jul 28
About SqueezeBits Team Blog
Latest Stories
Archive
About Medium
Terms
Privacy
Teams