[IT소식] GPU 가격 부담 낮췄다, KT클라우드, AI 인프라서비스 실시

코드크레인 Codecrain
CodeCrain
Published in
2 min readOct 19, 2023

KT클라우드는 슬라이싱 기술을 GPU(그래픽처리장치)에 적용한 AI(인공지능) 추론 전용 인프라 서비스 ‘AI SERV’를 출시했다고 16일 밝혔다.​

AI SERV는 AI 개발, 학습을 마치고 AI 서비스를 제공 중인 AI 전문기업, 스타트업 등이 고성능 GPU 인프라를 각 서비스에 필요한 만큼만 분할 해 최적의 양을 사용할 수 있는 것이 특징이다. 또 비용 효율성뿐 아니라 성능, 호환성 등 추론 영역에서 가장 중요한 조건까지 갖추고 있어 추론형 AI 인프라 시장의 혁신을 이끌 것으로 기대된다.​

KT클라우드의 AI SERV에 적용된 슬라이싱 기술은 기존에 한 장으로 제공되던 GPU 서비스를 5분할 해 0.2장 단위로 제공한다. 최소 사용 가능한 GPU 단위가 작아진 만큼 필요한 때 필요한 만큼의 인프라를 사용할 수 있어 가격 부담이 줄어들고, 다양한 상황에 맞춰 탄력적이고 가변적인 활용이 가능하다.​

더불어 기존의 슬라이싱 기술은 분할된 단위의 GPU에서 성능 열화가 발생할 수 있다는 단점이 있었지만, AI SERV는 슬라이싱 분할에도 성능 열화 없이 인프라를 100% 활용할 수 있다는 강점까지 갖췄다. AI SERV는 타사의 유사 서비스 대비 성능 및 호환성 측면에서도 강점을 보인다. 엔비디아 A100 칩을 활용, 경쟁사의 최신 추론형 인프라 서비스와 비교해도 최소 두 배 빠른 연산 속도를 자랑한다. 엔비디아 쿠다(CUDA) 아키텍처 기반의 높은 호환성과 확정성도 강점이다.​

KT클라우드는 향후 AI SERV에 사용자의 손쉬운 인프라 확장 지원을 위한 모니터링 및 컨테이너 이미지 클로닝(Cloning)기능 등을 추가하고, 부하 발생 시 인프라를 자동 확장시키는 ‘오토 스케일링’ 기능을 도입하는 등 서비스를 지속적으로 고도화해 나갈 계획이다.​

출처: 머니투데이, 김승한 기자

▶ 기사 원문 보러가기

▶앱개발, 웹개발, 플랫폼 구축, AI기반 댓글관리 문의하기

▶코드크레인 홈페이지

--

--