征服 Kubernetes (K8S) :企業維運面臨的挑戰與因應策略

Jamie Wu
Brobridge - 寬橋微服務
5 min readAug 8, 2023
Photo by @luckystep on Freepik

近年來 Kubernetes (K8S) 的整個 Eco-system 已經越來越成熟,不管是在安裝、維運或是安全性上,都已經達到了企業基本以上的需求。尤其是 Cloud 上的 K8S 越來越成熟,讓 K8S 維運更為輕鬆,讓使用者可以專注在開發上。

以往會採用 Kubernetes 的公司,比較偏向大型企業 (on-prem) 或新創 (cloud)。隨著 Kubernetes Eco-system 的日漸成熟,維運成本降低,學習曲線下降,願意嘗試與部署的 Kubernetes 的企業會越來越多。而當市場開始成熟時,企業產品會開始往 Open source project 不足的地方開始發展。對於企業用戶來說,可以付費購買更周全更容易使用的工具,但企業版本通常會有一些獨門的元件是在其他版本中缺乏的,造成某種程度上的 Vendor locking;若有成熟的人力時可以選擇繼續使用 Open source project ,可以更有彈性的進行管理或維運。

導入 Kubernetes 後的維運挑戰

在 Kubernetes 本身以及維運方式日漸成熟的情況下,最大的挑戰包含如下

  1. 提高服務的品質 (SLO) : Kubernetes 提供一些機制 (self-healing、health checking、hpa) 來提供高可用且穩定的服務,但仍然有許多細節需要處理來提供更好的服務品質,包含 app 本身開發時要注意及搭配的地方。
  2. 資料的處理:Kubernetes 主要在處理服務的部署與維運機制,在資料方面做到服務與資料的解耦 (storageClass、PVC),以及備份機制 (snapshot),但仍需要更好的資料處理機制,讓 app 可以更彈性與安全的使用資料。
  3. 與 app 開發的協同作業:包含安全性、流量管理、監控等方面,讓 app 可以更安全與彈性的部署和除錯,這部分目前有 service mesh 與 openTelemetry 等相關領域可以強化這部分。
  4. 缺乏監控的能力,會增加維運的成本,而缺乏自動化的能力,會無法降低維運的成本。導入 service mesh 與 openTelemetry 可強化 app 在 kubernetes 部署與管理、除錯的優勢,現階段雖然還不是必要的,但之後勢必會成為形成競爭優勢的條件。

整體而言,Kubernetes 的技術層面跟過往傳統的 IT 架構有很多不同,資訊人員首先面臨的是新知識的學習與養成,面對眾多的雲原生工具,一開始會有點手足無措,這需要我們花點時間入門,更重要的還是新觀念思維的轉變。

如何解決維運的挑戰

監控與自動化是強化維運的主要方式,尤其多叢集 (multiple cluster) 已經是現行的趨勢,如果無法降低單叢集的維運成本,會很難走向多叢集。因此我們自動化的配置監控相關面向 (metrics、log、tracing),加強客製化以及自動化的能力,並且以單叢集為基礎,對多叢集進行更集中與自動化的管理。
其次是隨時保持重要技術的跟進,例如 service mesh (istio)、openTelemetry (grafana tempo) 與 OPA (open policy agent) 等,讓整個 Kubernetes Eco-system 都盡可能維持可以符合客戶廣泛的需求。

尋求解決Kubernetes維運挑戰的企業可參考以下建議

  1. 培養企業自己的維運人才
    要在導入階段,甚至導入前,就開始逐步建置相關的團隊。
  2. 尋找專業的顧問
    依據自身團隊現有能力,尋找有能力且可以搭配的顧問團隊,來強化自身團隊能力。
  3. 首次建置交由有經驗的團隊
    有經驗的團隊,可以經由需求訪談,建置符合需求的叢集,並提供合適的配套建置,例如監控、安全性、稽核等機制,並可以規劃階段來協助導入 Service mesh、OpenTelemetry 等較進階的議題。
  4. 開發團隊需要一起參與其中
    開發團隊將是主要使用 Kubernetes 的人員,如何充分發揮 Kubernetes 的功能、避開可能發生問題的地方,以及對於監控、除錯的需求等,都需要開發團隊一起參與討論。

若您的企業正在尋找 Kubernetes (K8S) 的維運廠商,寬橋是您的最佳選擇。

寬橋(Brobridge)在 Kubernetes 和微服務領域深耕多年,,已取得 Kubernetes 各項專業認證(CKA、CKS、CKAD),並榮獲 Kubernetes官方組織 CNCF 認可之 KCSP (Kubernetes Certified Service Partner)國際認證,團隊成員曾參與 Google Doc 系統開發並貢獻 LXDE 系統於 Raspberry Pi,全球用戶超過 2500 萬;並曾參與各式大型雲端建置,台灣各大型私有雲及雲端系統管理專案,並擁有多個客戶場景的維運經驗。如果您也有相關問題或需求,歡迎 與我們直接聯繫

--

--