MetalLB 簡單解說：如何增進您 K8S 叢集的網路負載平衡效能！

超健忘閒人

發佈於kubernetes怕忘記

2024/12/06 更新2023/12/07 發佈閱讀 10 分鐘

今天跟大家分享在地端資料中心內建立Kubernetes叢集之後，如何針對網路進行更進一步的優化。除了CNI（容器網路接口）的設定，實務上我還會再另行建立Loadbalancer的機制。

至於為什麼要這樣做呢，就在這篇文章中透過對MetalLB的功能說明，相信您也可以理解為什麼這樣做在實務上是較好的做法之一。

網路流量進來後，如何平均分配

本文的測試環境是選擇地端LoadBalancer常使用的MetalLB，先說明相關的基本觀念，並且重點說明最基礎的Layer 2模式(另一個是BGP模式)，後續將會再針對建置實務再做分享，項目如下：

MetalLB是什麼？
L2模式的運作流程
L2模式的運作模式
結論

1.MetalLB是什麼?

官網說明：

Provides a network load-balancer implementation. In short,it allows you to create Kubernetes services of type LoadBalancer 

in clusters that don’t run on a cloud provider, and thus cannot simply hook 

into paid products to provide load balancers.

提供在地端實現網絡負載均衡器的方式。簡而言之，
它允許您在非運行雲端提供商上的叢集中創建類型為LoadBalancer的Kubernetes的服務。

因為地端的K8S原生並沒有實作LoadBalancer的功能，所以只能在公有雲IaaS平台才能直接使用LoadBalancer類型的service。除此之外就只能用NodePort or externalIP來暴露服務。但一般來說建議還是使用LoadBalancer類型較好。

以下幾點說明使用MetalLB的優點：

簡單設定：簡化了負載均衡器的配置過程，使其易於設置和管理。它不需要太多的複雜配置，並提供了一個簡單的方式來將外部IP地址分配給Kubernetes服務。
無雲端依賴：對於那些不使用雲端提供的負載均衡服務的用戶來說，MetalLB是一個理想的解決方案。它可以在本地資料中心或私有雲中運作，無需依賴雲端供應商的特定產品或服務。
節省成本：使用MetalLB可以節省成本，因為它不需要訂閱付費的雲端負載均衡器服務。這對於預算有限的組織或個人來說尤其有吸引力。
可擴展性：MetalLB可以根據需求擴展，並處理不同類型的負載均衡需求。它能夠動態地調整IP地址的分配，以應對流量增長，因此非常適用於具有變化需求的環境。
與Kubernetes整合：MetalLB與Kubernetes緊密整合，允許您使用Kubernetes服務類型LoadBalancer，使其與其他Kubernetes元件無縫協作。這樣可以實現更高的自動化和自我修復性。

2.L2模式的運作流程

運作流程 (From: http://timd.cn/k8s/metallb/)

當外部想要找K8S內的某個服務，透過發送ARP，由Leader節點用MAC address回應。外部主機就會將回應存在本地的ARP table，下次就可以直接從本地取得。當請求已到達節點之後，節點就會再透過kube-proxy將請求轉到負載平衡的目標Pod。

(注意：此處在節點內還是用kube-proxy來提供服務的負載平衡)

(1) 主要任務：

Task 1 — IP 位址分配 : 當建立LoadBalancer類型時，MetalLB自動從預先定義的IP Pool中分配IP位址出來，刪除Service之後，IP就會歸還Pool。
Task 2 — 對外廣播：配好IP後，還要讓Cluster外的網路知道這個位址的存在。

L2模式下，IPv4使用ARP ; IPv6使用NDP。

=> ARP: 從IP取得MAC的TCP/IP protocol
=> NDP: 取代ARP, ICMP，用來跟踪鄰居狀態、重復地址檢測、路由器發現、重導向

(2) 組成元件：

Controller : 以deployment的方式實現，用來監聽Service的變動、分配/回收IP。
Speaker : 用來實現對外廣播，以daemonset方式實現，對外廣播Service IP。

(3) 元件的工作任務：

Step1. Controller監聽Service的變動、分配/回收IP，監聽到Service設定為Loadbalancer模式時，就從IP Pool分配一個對應的IP，並且在刪除Service時(或改成其他模式)回收IP
Step2. Speaker根據選擇的Protocol進行對應的廣播與回應，當流量透過TCP/UDP到達指定的Node時，由Node上的Kube-Proxy元件處理流量，分發到對應的Pod。

3.L2模式的運作模式

這裡簡單說明一下這個模式下是怎麼運行，以及L2模式的缺點。

L2 Speaker是DaemonSet，故在每個節點都會有一個Pod。幾個Pod間會自我投票選出Leader。而Leader speaker大致上是用以下方式選擇出來：

選出一個Leader，由它來回應請求

選舉機制：預設情況下，Speaker 通過 API 服務（例如 Kubernetes API Server）來進行選舉。Speaker 會向 API 服務發送Lock的請求，並獲得競選 Leader Speaker 的權利。
選舉結果：當 Speaker 發送選舉請求後，API 服務會選擇其中一個 Speaker 作為 Leader Speaker，並通過 API 服務的回應通知其他 Speaker 誰是 Leader Speaker。Leader Speaker 將在 API 服務中註冊一個具有特殊標識的 ConfigMap，以表明它是 Leader Speaker。

3. Leader Speaker 負責 ARP 代理：一旦 Leader Speaker 被選出，它將成為 ARP 代理的主要負責者。只有 Leader Speaker 會回應外部設備發送的 ARP 請求，這有助於確保在集群中只有一個 Speaker 負責處理 ARP 請求。

失效處理：如果 Leader Speaker 在某些情況下變得不可用，例如由於故障或網絡問題，則選舉機制將再次觸發，以選擇一個新的 Leader Speaker，以確保系統的可用性。

#-----------------------------------------------
# S3-1. 每個node都有一個speaker
#-----------------------------------------------
[lb01]# kubectl get pod -o wide 

說明：Leader Pod會取得所有LB類型的Service，將已分配的IP綁到目前主機網卡上。
Leader也會回應對External IP的ARP/NDP請求。因此Speaker所在的機器會有多個IP。

#-----------------------------------------------
# S3-2. 確認ARP MAC
#-----------------------------------------------
[lb01]# kubectl get pod -o wide
[lb01]# kubectl get svc
[lb01]# arp 10.107.88.90

以上說明LoadBalance IP的MAC與worker02的MAC相同，也就是說Pod是運行在worker02之上，所以當Request發起時，會由worker02上的speaker來回應，流量就會導至worker02節點。

在節點內，kube-proxy會將收到的流量傳播到對應Service後端的Pod。在這個層面上，L2模式其實並沒有真的實作Loadbalance，而是實作了一個failover機制，當Leader節點出問題時，可以自動接管服務。

※ L2模式的缺點：

單節點局限：因為會選某一個節點上的Pod成為Leader Pod，故所有的頻寬會被這個節點的頻寬限制住。L2比較像是故障轉移，而非負載均衡，因為同一時間只能在某一台節點負責接收資料。
故障轉移慢：可實現自動故障轉移，目前是透過memberlist，當其他節點檢測到Leader故障後會自選出新的Leader。新的Leader會自動接管所有External IP並發送大量的L2封包來通知客戶端(其他節點)ExternalIP的MAC. (官網說通常10秒內會轉完)

4.結論

MetalLB 主要分為 Controller 和 Speaker二個部分，Controller 負責IPAM，Speaker 則負責 IP 通告。這二個元件就可以實現MetalLB的全部功能了。有二種模式可依實際環境配合使用：

L2模式：(通用、容易使用，沒有限制、但局限性大)

=> 優點：通用性好，適合任何網路環境，不需要特殊硬體

=> 缺點：單節點瓶頸和故障轉移慢

BGP模式：

=> 優點：可以在多節點間負載平衡、沒有單節點瓶頸、故障轉移快

=> 缺點：使用BGP就需要支援硬體路由器設備

※ 建議：

BGP是比較理想的實作。L2模式是基礎實現，完整功能建議還是要使用BGP模式。
能用BGP就用BGP，不知道要用什麼模式就先用L2模式

本篇先針對MetalLB的基本概念先進行說明，接下來會分享如何在Kubernetes Cluster上進行MetalLB的部署工作，敬請期待後續，也感謝您的觀看，下期再見!!!

References:

超健忘閒人的沙龍kubernetes怕忘記

留言

留言分享你的想法！

超健忘閒人的沙龍

15會員

40內容數

記錄IT社畜的自我學習筆記，如同專題名稱，主要是怕自已忘記自已做過什麼、學到什麼。索性就分享我自已在學習Kubernetes這條路上的各種測試、學習心得。

超健忘閒人的沙龍的其他內容

2024/05/08

GitLab Runner 搭建指南：打造流暢的 CI/CD 工作流程

本文將介紹如何在Gitlab上部署和註冊runner，以進行CI/CD測試。透過Docker-compose方式進行部署，同時注意安裝時的一些注意事項。建議學習者至少掌握一種以上的Pipeline工具，以滿足實務上的需求。

2024/05/08

GitLab Runner 搭建指南：打造流暢的 CI/CD 工作流程

2024/04/19

實現MySQL master-slave架構在K8S平台內的部署與功能驗證

上一篇說明了如何在Kubernetes上建立基本的MySQL standalone，並加入phpmyadmin(PMA)來進行圖形化的管理，本篇就再進階一步，實作MySQL replication架構(master-salve)，並進行驗證是否成功。

2024/04/19

實現MySQL master-slave架構在K8S平台內的部署與功能驗證

2024/04/09

Kubernetes 環境下 MySQL 單機部署與 phpMyAdmin 管理

本文記錄如何在Kubernetes環境下，部署Standalone架構的MySQL Database，並透過phpmyadmin進行管理。這篇文章將分成MySQL部署在K8S內的優勢、部署MySQL DB standalone、部署PhpMyAdmin (PMA)、結論四個部分進行說明與實作的流程。

2024/04/09

Kubernetes 環境下 MySQL 單機部署與 phpMyAdmin 管理

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

#懶人料理#食譜#健康甜點

2025/10/15

hello maple

從負載平衡到 API：新手也懂的現代網路基礎

在現代網路與雲端架構中，負載平衡（Load Balancer）、橫向擴展（Scale Out）、以及 API 溝通機制是不可或缺的基礎。本文帶你快速理解負載平衡如何分散流量、系統如何透過擴展應對成長需求，以及 API 在不同服務間扮演的溝通角色。

#學習#伺服器#電腦

2025/04/29

hello maple

從負載平衡到 API：新手也懂的現代網路基礎

#學習#伺服器#電腦

2025/04/29

呢喃貓商學院：你的加密貨幣領航員

0 成本埋伏融資額 2,350 萬美元且幣安參投的 Layer1 全鏈賽道空投！

Particle Network 是一個創新的模塊化 Layer1 區塊鏈，提供用戶跨鏈操作的便利性，並簡化了區塊鏈的使用方式。透過單一地址來進行多鏈的交互，用戶可自在地管理資產，並可利用各種代幣支付 Gas 費。本文詳細介紹了 Particle Network 的功能及如何參與其測試網空投。

#NFT#區塊鏈#購買

2024/08/08

呢喃貓商學院：你的加密貨幣領航員

0 成本埋伏融資額 2,350 萬美元且幣安參投的 Layer1 全鏈賽道空投！

#NFT#區塊鏈#購買

2024/08/08

超健忘閒人的沙龍

MetalLB 簡單解說：如何增進您 K8S 叢集的網路負載平衡效能！

#Kubernetes#Linux#container

2023/12/07

超健忘閒人的沙龍

MetalLB 簡單解說：如何增進您 K8S 叢集的網路負載平衡效能！

#Kubernetes#Linux#container

2023/12/07

Alan的開發者天地

Kubernetes RBAC Overview：賦予安全與彈性的管理

👨‍💻簡介在當今的雲計算時代，容器化和微服務架構成為了重要趨勢。Kubernetes，作為領先的容器編排平台，提供了強大的功能來管理和部署應用程式。然而，隨著應用程式和用戶的增加，有效管理誰可以對 Kubernetes 集群執行何種操作變得至關重要。

#Kubernetes#角色管理#rbac

2023/11/25

Alan的開發者天地

Kubernetes RBAC Overview：賦予安全與彈性的管理

#Kubernetes#角色管理#rbac

2023/11/25

Marcos的方格子

關於著陸區(Landing Zone) | Google Cloud

💡 什麼是登陸區(Landing Zone)?這是一種模塊化與可擴展的配置，讓組織可以因應商業需要動態使用Google Cloud。

#GCP#GoogleCloud#LandingZone

2023/11/16

Marcos的方格子

關於著陸區(Landing Zone) | Google Cloud

💡 什麼是登陸區(Landing Zone)?這是一種模塊化與可擴展的配置，讓組織可以因應商業需要動態使用Google Cloud。

#GCP#GoogleCloud#LandingZone

2023/11/16

加密媽咪的沙龍

解決Web3用戶互操作難題的零層協議 LayerZero

區塊鏈技術面臨的最大挑戰之一就是互操作性（interoperability）。目前大多數的區塊鏈都是獨立運作的，這使得在不同區塊鏈之間傳輸數據、資產和信息變得非常困難。然而隨著越來越多的區塊鏈出現，它們之間的通訊和交易變得越來越重要。而LayerZero就是為了解決各區塊鏈之間戶操作性而生的新技術。

2023/09/23