模型伺服框架

更新 發佈閱讀 2 分鐘

TensorFlow Serving 是 Google 推出的高性能模型服務系統,最初針對 TensorFlow 模型優化,但也支持擴展至其他模型,提供 gRPC 和 HTTP API,支持多版本模型管理和高效推理,適合生產環境。

TorchServe 是 PyTorch 官方的模型部署工具,自帶管理和推理 API,支持多模型註冊和批量推理,能方便地將 PyTorch 模型打包成 .mar 檔部署到服務中,支持 CPU/GPU 和多種雲端環境。

Nvidia Triton Inference Server 是 Nvidia 開源的推理服務器,支持多種深度學習框架(如 TensorRT、PyTorch、ONNX 等),並能在多種硬體(Nvidia GPU、CPU、ARM)上運行,強調高效能推理和多模型部署。

Seldon Core 是一個專為 Kubernetes 設計的機器學習模型服務架構,支持將多種主流 ML 框架模型容器化並作為微服務部署,支持服務治理、指標監控、追踪與擴展,方便複雜生產環境下的模型管理。

KServe(原 KFServing)是基於 Kubernetes 的機器學習模型推理平台,支援多框架,強調彈性擴展、無伺服器架構與高可用,具備自動擴縮、canary 發佈、模型管線等先進功能,適合規模化生產應用。

各系統比較:

raw-image

簡言之,選擇時若專注TensorFlow,可以選 TensorFlow Serving;PyTorch生態則可考慮 TorchServe;追求跨框架效能和多硬體支持則 Nvidia Triton 是首選;如果基於 Kubernetes 架構進行大規模模型部署與管理,則 Seldon Core 和 KServe 是更適合的現代化解決方案.

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
19會員
495內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/09/14
Grafana與Prometheus常常搭配使用,構成強大的監控與可視化解決方案。 Prometheus簡介 一個開源的分布式系統監控和告警工具,專門收集時序數據(metrics)。 支援多種數據收集方式,尤其適合雲原生環境和容器監控。 通過拉取(scrape)方式定期從被監控目標獲取數據,
2025/09/14
Grafana與Prometheus常常搭配使用,構成強大的監控與可視化解決方案。 Prometheus簡介 一個開源的分布式系統監控和告警工具,專門收集時序數據(metrics)。 支援多種數據收集方式,尤其適合雲原生環境和容器監控。 通過拉取(scrape)方式定期從被監控目標獲取數據,
2025/09/14
Evidently AI 是一個開源的 Python 庫和平台,專門用於機器學習(ML)模型的評估、測試及監控,支持從實驗階段到生產環境的全生命周期管理。它能幫助數據科學家和ML工程師自動化地檢測數據漂移(Data Drift)、模型性能變化、數據質量問題等,從而保障ML系統的穩定和準確性。 Ev
2025/09/14
Evidently AI 是一個開源的 Python 庫和平台,專門用於機器學習(ML)模型的評估、測試及監控,支持從實驗階段到生產環境的全生命周期管理。它能幫助數據科學家和ML工程師自動化地檢測數據漂移(Data Drift)、模型性能變化、數據質量問題等,從而保障ML系統的穩定和準確性。 Ev
2025/09/12
Kolmogorov-Smirnov檢定(簡稱K-S檢定)是一種基於累積分布函數(CDF)的無母數統計檢定方法,用來比較兩個經驗分佈是否相同,或比較樣本分布是否與某個理論分布(如常態分布、均一分布)一致。 K-S檢定作為分佈距離度量 K-S統計量 $$ D $$ 即為兩分布之間的最大距離(最大垂
2025/09/12
Kolmogorov-Smirnov檢定(簡稱K-S檢定)是一種基於累積分布函數(CDF)的無母數統計檢定方法,用來比較兩個經驗分佈是否相同,或比較樣本分布是否與某個理論分布(如常態分布、均一分布)一致。 K-S檢定作為分佈距離度量 K-S統計量 $$ D $$ 即為兩分布之間的最大距離(最大垂
看更多
你可能也想看
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
PyTorch 是一個開源的 Python 機器學習庫,基於 Torch 庫,底層由 C++ 實現,應用於人工智慧領域,如電腦視覺和自然語言處理等。 PyTorch 2.4 引入了多項新功能和改進,包括支援 Python 3.12、AOTInductor 凍結功能、新的高階 Python 自訂運算
Thumbnail
PyTorch 是一個開源的 Python 機器學習庫,基於 Torch 庫,底層由 C++ 實現,應用於人工智慧領域,如電腦視覺和自然語言處理等。 PyTorch 2.4 引入了多項新功能和改進,包括支援 Python 3.12、AOTInductor 凍結功能、新的高階 Python 自訂運算
Thumbnail
本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡(GNN),並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化,包括引入批量標準化和獨立的消息傳遞層,調整Dropout和聚合函數,顯著提高了模型的分類準確率。實驗結果表明,經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。
Thumbnail
本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡(GNN),並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化,包括引入批量標準化和獨立的消息傳遞層,調整Dropout和聚合函數,顯著提高了模型的分類準確率。實驗結果表明,經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文主要介紹,如何利用GAN生成對抗網路來訓練生成圖片。 利用tensorflow,中的keras來建立生成器及鑑別器互相競爭訓練,最後利用訓練好的生成器來生成圖片。 GAN生成對抗網路的介紹 它由生成網路(Generator Network)和鑑別網路(Discriminator Netwo
Thumbnail
本文主要介紹,如何利用GAN生成對抗網路來訓練生成圖片。 利用tensorflow,中的keras來建立生成器及鑑別器互相競爭訓練,最後利用訓練好的生成器來生成圖片。 GAN生成對抗網路的介紹 它由生成網路(Generator Network)和鑑別網路(Discriminator Netwo
Thumbnail
本文將延續上一篇文章,經由訓練好的VAE模型其中的解碼器,來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇 輸入產生的隨機雜訊,輸入VAE的解碼器後,生成的圖片
Thumbnail
本文將延續上一篇文章,經由訓練好的VAE模型其中的解碼器,來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇 輸入產生的隨機雜訊,輸入VAE的解碼器後,生成的圖片
Thumbnail
透過這篇文章,我們將瞭解如何使用PyTorch實作圖神經網絡中的訊息傳遞機制,從定義消息傳遞的類別到實作消息傳遞過程。我們也探討了各種不同的消息傳遞機制,並通過對單次和多次傳遞過程的結果,可以看到節點特徵如何逐步傳遞與更新。
Thumbnail
透過這篇文章,我們將瞭解如何使用PyTorch實作圖神經網絡中的訊息傳遞機制,從定義消息傳遞的類別到實作消息傳遞過程。我們也探討了各種不同的消息傳遞機制,並通過對單次和多次傳遞過程的結果,可以看到節點特徵如何逐步傳遞與更新。
Thumbnail
牽涉到的工具:wsl2 + anaconda + jupyter-nootbook
Thumbnail
牽涉到的工具:wsl2 + anaconda + jupyter-nootbook
Thumbnail
當我們在開發一個AI應用服務時, 常常會需要載入大模型, But… 我們總不可能每一次的請求就載入一次模型吧! 這樣太沒有效率了, 也非常的浪費資源, 因此我們通常會希望應用程式啟動時就能夠載入模型, 之後每一次的請求只要讓模型進行運算即可, 那麼在FastAPI的框架中究竟要如何使用呢? 首
Thumbnail
當我們在開發一個AI應用服務時, 常常會需要載入大模型, But… 我們總不可能每一次的請求就載入一次模型吧! 這樣太沒有效率了, 也非常的浪費資源, 因此我們通常會希望應用程式啟動時就能夠載入模型, 之後每一次的請求只要讓模型進行運算即可, 那麼在FastAPI的框架中究竟要如何使用呢? 首
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News