為 AI 開發者打造的 MLOps 開發容器平台 — Gemini AI Console

Tim
Gemini Open Cloud 雙子星雲端

--

在傳統一體化架構下,應用程式的更新與部署至關重要,因為新增的功能與測試綁定在一起,層層功能堆疊使得架構非常複雜,隨著時間的推演,系統架構的 耦合性 太高難以彈性開發,更會造成新功能的部署與維運越來越困難。若不小心哪個環節中出了差錯,就會導致牽一髮而動全身的窘境。在這樣的系統下,連專業的 IT 人員都會覺得維運上綁手綁腳,更何況是非 IT 人員呢?

容器化系統獲得認可,企業開始轉型成微服務 (Microservice) 架構

在2013年發展出 Container (容器) 技術,讓微服務概念開始盛行,主要目的是把龐大的系統架構拆解成部分功能運行在 Container 中,以解決上述前言所提到的問題。

舉例來說,現在非常火紅的 Machine Learning (ML) 或 MLOps 議題,流程又可以拆解成許多步驟,如:資料的收集、模型訓練、模型部署、模型監控,每一項步驟都能以 Container 型式存在,每個 Container 只需要負責運行單一服務,如此一來,其中每個環節需要維護就不需要擔心會影響其他正在運行的服務。

相對來說,傳統的 VM 常需要追求高規格,在基礎設施與運維 (Ops)上需要花費非常多的時間和心力。以下是 VM 與 Container 所做的比較。

從上表可以容易看出 Container 所帶來的好處與便利,但呼應一下本篇文章的主題:非 IT人員是否能自主建立 Container 服務?答案:有的,接下來將介紹如何讓非 IT 人員方便建立容器服務的平台,甚至能搭建有系統性的MLOps 流程在 Gemini AI Console 上。

什麼是 Gemini AI Console?

有效的管理底層硬體資源為 Gemini AI Console 的主要核心價值,能管理來自雲端或是客戶端的硬體資源,讓 IT 人員或是資料科學家無後顧之憂的使用硬體資源,打造自己的設計藍圖,無須煩惱底層硬體架構的設計與維護問題。

平台上擁有多種應用程式讓使用者能直接使用,像是 ML Tool:Tensorflow、Pytorch、Caffe2、Triton Service…等等,若是系統上沒有自己想要的應用程式也能自行彈性擴充,應用程式服務能選擇運行在雲端上(Google Cloud Platform、Linode) 或地端都可以依開發者決定。

在 Gemini AI Console 上所建立的應用程式服務是以 Container (容器) 型式存在,系統是以微服務概念運行,當 Container 數量多就會面臨到管理上的問題。因此 Gemini AI Console 導入 Kubernetes (K8s) 技術來幫我們管理 Containers,若服務無意中掛點,K8s 能幫我們重啟,龐大的系統不需要隨時有人 Stand By 照料,維運人員也能睡得安穩,相關技術細節不在此談論。

透過 Gemini AI Console 部署 AI 開發環境的好處

以上淺談了 Gemini AI Console 功能,究竟 AI Console 又帶來了何種程度上的便利呢?我們把問題聚焦在現在火紅的 MLOps 流程上。

許多企業紛紛導入 ML 技術,試圖提升公司的產值與盈利,但對 ML 工程師來說,要建立一道 MLOps 流程似乎不是容易的事,我們都知道 Data Engineer (DE,資料工程師) 主要職責為籌劃 MLOps 流程與施工,但在這基礎下需要有硬體基礎建設,若是團隊不是相當龐大的公司,可能基礎建設、系統施工與維運部分也會落在 DE 工作任務上,那麼怎能有足夠的心力專注在本業的 MLOps 上呢?

Gemini AI Console 強大之處是管理底層硬體資源的平台,資料工程師只需要把心力放在 MLOps 流程籌劃與建制,平台上提供友善視覺畫的操作介面與搭配監控資源使用平台,對於資料工程師來說肯定能達到事半功倍的效果。下圖為導入 AI Console 前後的工作任務對照。

實際使用情境

以下圖為例,圖的下方為實際在 Gemini AI Console 的操作,而上方是開發者透過在 AI Console 所創建的容器開發環境執行的內容。Machine Learning Model 開發者整理好資料後,將資料上傳至儲存空間。開發 ML Model 的工程師,可根據自己的需求很快速的時間內得到適合的開發環境 ( ex: Jupyter + Tensorflow ),進而設計與調整適合的參數與模型。

亦可搭配 Gemini AI Console 內建的 Pipeline 流程設計,將固定繁瑣性質的操作轉成系統上自動化控制。而準備好的 ML Model 更可以與推論服務串接,讓你開發出來的服務將帶有人工智慧的引擎,並很快速的上架到雲平台上運行,立即對外提供您的 AI 人工智慧服務!

Gemini AI Console 已發布最新版本,歡迎各界有興趣的朋友跟我們索取最新的產品資訊,也可以 立刻預約 Demo,我們的產品顧問將向您示範,並免費提供線上的試用!

雙子星雲端為 CNCF 會員,是 CNCF 所認證的 Kubernetes 服務提供商,在雲端技術擁有十多年以上的經驗,為台灣雲端技術早期領先者。目前為國家級 AI 雲的軟體及 Kubernetes 技術與服務提供商,更是諸多企業與單位導入容器與管理平台的最佳夥伴。

References:

  1. https://www.gushiciku.cn/pl/geVD/zh-tw
  2. https://ithelp.ithome.com.tw/articles/10238498

--

--

Tim
Gemini Open Cloud 雙子星雲端

軟體工程師,多年來從事ML相關研究與開發,對於新的知識充滿好奇與學習的動力。目前在Geminiopencloud從事雲端工作,期盼在雲上能早日迎向燦爛的曙光。