Kubernetes Autoscaling

更新於 發佈於 閱讀時間約 10 分鐘

介紹

Autoscaling 的目的是當有大量請求時,系統可以自動的增加運算資源,處理當下的大量請求;也可以根據當下資源使用率低時,自動降低運算資源,達到省錢的目的。這篇文章會說明在 Kubernetes 怎麼做 Autoscaling。

Kubernetes 內建 Autoscaling pipeline,可根據指標(CPU, Memory 使用率等等)的高低自動調整 Deployment.replicas 的數量,根據資源不足事件調整 Kubernetes Worker Node 的數量。大致上運作會牽涉到以下項目:

  1. 用 Metrics Server 取出指標,比如可以根據 CPU、Memory 的使用率調整。
  2. 用 HPA CRD 告知 Kubernetes 要根據什麼指標調整 Deployment.replicas 的數量。
  3. 用 CA CRD 告知 Kubernetes 當 Worker Node 資源不足時(Worker Node 沒有足夠的 CPU, Memory 可以運行 Pod),新增 Worker Node。

註 - 指標可以是 CPU, Memory 使用率,也可以是自己客製化的指標,比如請求延遲(Request Latency)、請求數量等等。

Metrics Server

第一件事情是安裝 Metrics Server,讓 Kubernetes 可以取到 CPU, Memory 使用率的指標。

安裝 metrics-server:

helm repo add metrics-server https://kubernetes-sigs.github.io/metrics-server/
helm upgrade --install metrics-server metrics-server/metrics-server

當安裝成功後,可以用 kubectl top 檢視 Metrics Server 收集的指標:

❯ kubectl top node
NAME CPU(cores) CPU% MEMORY(bytes) MEMORY%
gke-default-pool-4d64e7e1-o5h7 158m 16% 2029Mi 77%
❯ kubectl top pod
NAME CPU(cores) MEMORY(bytes)
haproxy-ic-kubernetes-ingress-7ddcc5db-kkjdl 5m 109Mi
haproxy-ic-kubernetes-ingress-default-backend-56844d87f8-gjfbz 0m 2Mi
haproxy-ic-kubernetes-ingress-default-backend-56844d87f8-r2vmm 0m 2Mi

註 - GKE 預設會安裝 Metrics Server。

註 - Metrics Server 不是設計給監控系統使用。

Reference:

https://github.com/kubernetes-sigs/metrics-server/blob/master/charts/metrics-server/README.md

https://github.com/kubernetes-sigs/metrics-server/blob/master/charts/metrics-server/values.yaml

Pod Resource Request

Pod 的規格(spec)必須要加上 spec.containers[].resources.requests.cpu, spec.containers[].resources.requests.memory,否則 HPA 無法正常運行。

apiVersion: v1
kind: Pod
metadata:
name: frontend
spec:
containers:
- name: app
image: images.my-company.example/app:v4
resources:
requests:
memory: "64Mi"
cpu: "250m"
limits:
memory: "128Mi"
cpu: "500m"

Reference:

https://kubernetes.io/docs/concepts/configuration/manage-resources-containers/

HorizontalPodAutoscaler(HPA)

HPA 可以根據 CPU, Memory 使用率調整 Deployment replicas 的數量。

以下是 HorizontalPodAutoscaler 的範例:

  1. scaleTargetRef - 對哪個 Deployment 調整 replicas 參數。
  2. minReplicas, maxReplicas - Pod 的數量範圍。
  3. metrics - 根據什麼指標做調整,這個範例是當全部 Pod 累計的 CPU 使用率超過 80% 時,增加 Pod 的數量。
apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
name: my-hpa
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: my-deployment
minReplicas: 1
maxReplicas: 10
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 80

以下是 VerticalPodAutoscaler 的範例:

apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
name: my-app-vpa
spec:
targetRef:
apiVersion: "apps/v1"
kind: Deployment
name: my-app
updatePolicy:
updateMode: "Auto"

Reference:

https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/

https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/

Cluster Autoscaling(CA)

Cluster Autoscaling 是 Kubernetes Cluster 的設定,Kubernetes 會自動的調整 Worker Node 的數量,觸發的時機點是 Kubernetes Scheduler 安排 Pod 到 Worker Node 時發現「CPU or Memory 不足」,此時就會新增新的 Worker Node。

以 GKE 來說,相關的設定是 cluster_autoscaling 和 node_pools 的 autoscaling, min_count, max_count。

https://registry.terraform.io/modules/terraform-google-modules/kubernetes-engine/google/latest

module "gke" {
source = "terraform-google-modules/kubernetes-engine/google"
version = "~>17.1.0"

...

cluster_autoscaling = {
enabled = true
min_cpu_cores = 1
max_cpu_cores = 20
min_memory_gb = 3
max_memory_gb = 20
gpu_resources = []
}

node_pools = [
{
...
autoscaling = true
min_count = 1
max_count = 10
},]
}
留言
avatar-img
留言分享你的想法!
avatar-img
C# 工匠的 DevOps 旅程
5會員
12內容數
專注於 C#, DevOps 的工程師
2024/09/23
本文探討 C# 非同步程式設計時應注意的幾個要點,包括全面採用非同步模式、避免混用同步與非同步程式碼、勿使用async void、以及正確使用CancellationToken等。這些建議不僅有助於提升程式的效能,也可以減少Deadlock等問題,讓開發者更有效地處理異常情況,確保應用程式的穩定性.
Thumbnail
2024/09/23
本文探討 C# 非同步程式設計時應注意的幾個要點,包括全面採用非同步模式、避免混用同步與非同步程式碼、勿使用async void、以及正確使用CancellationToken等。這些建議不僅有助於提升程式的效能,也可以減少Deadlock等問題,讓開發者更有效地處理異常情況,確保應用程式的穩定性.
Thumbnail
2024/06/24
Code Coverage 是什麼? 程式碼覆蓋率(Code Coverage)是一種軟體測試指標,用百分比表示,數值越高越好。
Thumbnail
2024/06/24
Code Coverage 是什麼? 程式碼覆蓋率(Code Coverage)是一種軟體測試指標,用百分比表示,數值越高越好。
Thumbnail
2024/04/08
本文介紹瞭如何在C#專案中建立和使用packages.lock.json檔案,以確保每次執行dotnet restore時都可以獲得相同的packages集合。我們還討論了dotnet restore抓取不同packages的原因,並提供了相關的解決方案。
Thumbnail
2024/04/08
本文介紹瞭如何在C#專案中建立和使用packages.lock.json檔案,以確保每次執行dotnet restore時都可以獲得相同的packages集合。我們還討論了dotnet restore抓取不同packages的原因,並提供了相關的解決方案。
Thumbnail
看更多
你可能也想看
Thumbnail
家中修繕或裝潢想要找各種小零件時,直接上網採買可以省去不少煩惱~看看Sylvia這回為了工地買了些什麼吧~
Thumbnail
家中修繕或裝潢想要找各種小零件時,直接上網採買可以省去不少煩惱~看看Sylvia這回為了工地買了些什麼吧~
Thumbnail
👜簡單生活,從整理包包開始!我的三款愛用包+隨身小物清單開箱,一起來看看我每天都帶些什麼吧🌿✨
Thumbnail
👜簡單生活,從整理包包開始!我的三款愛用包+隨身小物清單開箱,一起來看看我每天都帶些什麼吧🌿✨
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
安裝環境需求 64位元Linux,核心版本為3.1以上,且能滿足Ducker安裝環境。 機器之間要能夠互通。 外部存取權限。 硬體資源:兩核心CPU、8G記憶體、硬碟30GB以上。 安裝Kubeadm與Ducker Kubeadm是Kubernetes的一鍵部署工具。 增加Kube
Thumbnail
安裝環境需求 64位元Linux,核心版本為3.1以上,且能滿足Ducker安裝環境。 機器之間要能夠互通。 外部存取權限。 硬體資源:兩核心CPU、8G記憶體、硬碟30GB以上。 安裝Kubeadm與Ducker Kubeadm是Kubernetes的一鍵部署工具。 增加Kube
Thumbnail
引言 在當今的技術世界中,Kubernetes 已成為容器化應用的領導平台。作為一個高效的容器編排系統,它不僅管理著容器的部署和擴展,還提供了必要的自動化支持,以保證應用的高可用性和性能。在這個框架中,自動擴展功能起著至關重要的作用,特別是在面對不斷變化的負載和需求時。
Thumbnail
引言 在當今的技術世界中,Kubernetes 已成為容器化應用的領導平台。作為一個高效的容器編排系統,它不僅管理著容器的部署和擴展,還提供了必要的自動化支持,以保證應用的高可用性和性能。在這個框架中,自動擴展功能起著至關重要的作用,特別是在面對不斷變化的負載和需求時。
Thumbnail
本文將說明關於Local volume 與hostPath二種類型的差異與一些注意事項。
Thumbnail
本文將說明關於Local volume 與hostPath二種類型的差異與一些注意事項。
Thumbnail
本文針對Kubernetes內最基本的資源(cpu, ram, disk)的計算單位與一些實務操作,分享給自已與大家做參考。
Thumbnail
本文針對Kubernetes內最基本的資源(cpu, ram, disk)的計算單位與一些實務操作,分享給自已與大家做參考。
Thumbnail
宣告式管理是一種管理方法,其中您描述系統或資源的期望狀態,而不必關心實際如何達到該狀態。kubectl apply 命令在 Kubernetes 中實現了這種宣告式管理方式,以下是執行指令時的運作流程...
Thumbnail
宣告式管理是一種管理方法,其中您描述系統或資源的期望狀態,而不必關心實際如何達到該狀態。kubectl apply 命令在 Kubernetes 中實現了這種宣告式管理方式,以下是執行指令時的運作流程...
Thumbnail
什麼是 Kubernetes Deployment? 一樣先來個官網解說 A Deployment provides declarative updates for Pods and ReplicaSets. You describe a desired state in a Deployment,
Thumbnail
什麼是 Kubernetes Deployment? 一樣先來個官網解說 A Deployment provides declarative updates for Pods and ReplicaSets. You describe a desired state in a Deployment,
Thumbnail
什麼是Kubernetes Service? 先來個官網的解說 A Kubernetes Service is an abstraction which defines a logical set of Pods and a policy by which to access them. 白話文就是
Thumbnail
什麼是Kubernetes Service? 先來個官網的解說 A Kubernetes Service is an abstraction which defines a logical set of Pods and a policy by which to access them. 白話文就是
Thumbnail
Kubernetes是現代應用程序開發和部署的重要技術,而Pod是Kubernetes中最小的部署單位。Pod是一個或多個container的集合,它們共享一個網路命名空間和一個網路接口。Pod不僅提供了一個簡單而強大的container環境,還可以用於實現多種container編排方案,例如負載平
Thumbnail
Kubernetes是現代應用程序開發和部署的重要技術,而Pod是Kubernetes中最小的部署單位。Pod是一個或多個container的集合,它們共享一個網路命名空間和一個網路接口。Pod不僅提供了一個簡單而強大的container環境,還可以用於實現多種container編排方案,例如負載平
Thumbnail
👨‍💻簡介 有時候修改掛載的config檔,無法即時更新,需要重啟pod才會生效,為了解決這個問題,k8s-reloader因此而誕生,透過觀察掛載的configmap或是secret的變化自動對掛載的物件做滾動更新。 以下為在minikube環境下,透過掛載nginx-config檔並搭配re
Thumbnail
👨‍💻簡介 有時候修改掛載的config檔,無法即時更新,需要重啟pod才會生效,為了解決這個問題,k8s-reloader因此而誕生,透過觀察掛載的configmap或是secret的變化自動對掛載的物件做滾動更新。 以下為在minikube環境下,透過掛載nginx-config檔並搭配re
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News