模型伺服框架

2025/09/14 更新2025/09/14 發佈閱讀 2 分鐘

TensorFlow Serving 是 Google 推出的高性能模型服務系統，最初針對 TensorFlow 模型優化，但也支持擴展至其他模型，提供 gRPC 和 HTTP API，支持多版本模型管理和高效推理，適合生產環境。

TorchServe 是 PyTorch 官方的模型部署工具，自帶管理和推理 API，支持多模型註冊和批量推理，能方便地將 PyTorch 模型打包成 .mar 檔部署到服務中，支持 CPU/GPU 和多種雲端環境。

Nvidia Triton Inference Server 是 Nvidia 開源的推理服務器，支持多種深度學習框架（如 TensorRT、PyTorch、ONNX 等），並能在多種硬體（Nvidia GPU、CPU、ARM）上運行，強調高效能推理和多模型部署。

Seldon Core 是一個專為 Kubernetes 設計的機器學習模型服務架構，支持將多種主流 ML 框架模型容器化並作為微服務部署，支持服務治理、指標監控、追踪與擴展，方便複雜生產環境下的模型管理。

KServe（原 KFServing）是基於 Kubernetes 的機器學習模型推理平台，支援多框架，強調彈性擴展、無伺服器架構與高可用，具備自動擴縮、canary 發佈、模型管線等先進功能，適合規模化生產應用。

各系統比較：

簡言之，選擇時若專注TensorFlow，可以選 TensorFlow Serving；PyTorch生態則可考慮 TorchServe；追求跨框架效能和多硬體支持則 Nvidia Triton 是首選；如果基於 Kubernetes 架構進行大規模模型部署與管理，則 Seldon Core 和 KServe 是更適合的現代化解決方案.

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記AI技術系統集成與部署

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

31會員

495內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 (初級) AWS Certified AI Practitioner (AIF-C01) 經濟部 iPAS AI應用規劃師數據分析 (中級)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/09/14

Grafana與Prometheus

Grafana與Prometheus常常搭配使用，構成強大的監控與可視化解決方案。 Prometheus簡介一個開源的分布式系統監控和告警工具，專門收集時序數據（metrics）。支援多種數據收集方式，尤其適合雲原生環境和容器監控。通過拉取（scrape）方式定期從被監控目標獲取數據，

2025/09/14

Grafana與Prometheus

2025/09/14

Evidently AI

Evidently AI 是一個開源的 Python 庫和平台，專門用於機器學習（ML）模型的評估、測試及監控，支持從實驗階段到生產環境的全生命周期管理。它能幫助數據科學家和ML工程師自動化地檢測數據漂移（Data Drift）、模型性能變化、數據質量問題等，從而保障ML系統的穩定和準確性。 Ev

2025/09/14

Evidently AI

2025/09/12

Kolmogorov-Smirnov檢定（簡稱K-S檢定）

Kolmogorov-Smirnov檢定（簡稱K-S檢定）是一種基於累積分布函數（CDF）的無母數統計檢定方法，用來比較兩個經驗分佈是否相同，或比較樣本分布是否與某個理論分布（如常態分布、均一分布）一致。 K-S檢定作為分佈距離度量 K-S統計量 $$ D $$ 即為兩分布之間的最大距離（最大垂

2025/09/12

Kolmogorov-Smirnov檢定（簡稱K-S檢定）

看更多

你可能也想看

Celine 寫在這裡

香氛藝術家 sunkronizo perfume︱以香氛同步日常節奏的台灣獨立調香師品牌

嶄新的台灣獨立調香師品牌Sunkronizo ，這個名稱源自希臘語「同步」的意思。讓香氛不單純只是氣味調製，更是個人風格的展現與靈魂意志延伸的一種溝通語言。很適合接下來年底聖誕佳節送禮的試香組，以一星期中的日子來為全系列香氛產品命名，是品牌創立後首個推出全系列概念作品...

#香水#香水評論#試香

2025/11/25

Celine 寫在這裡

香氛藝術家 sunkronizo perfume︱以香氛同步日常節奏的台灣獨立調香師品牌

#香水#香水評論#試香

2025/11/25

awwrated的沙龍

【編輯現場】當世界都想看台灣故事：VOD 串流如何引爆下一個「台流」？

根據美國電影協會（MPA）主辦的「串流服務如何推動臺灣創意經濟」論壇內容，深入探討串流平臺對臺灣影視產業的影響、數據分析、政府政策建議、內容國際化策略，以及臺灣與「韓流」的差距。文章提出 awwrated 在串流生態系中的潛在角色，強調數據、策略與自信是臺灣影視產業發展的關鍵。

#awwrated#Netflix#NETFLIX影集

2025/11/21

awwrated的沙龍

【編輯現場】當世界都想看台灣故事：VOD 串流如何引爆下一個「台流」？

#awwrated#Netflix#NETFLIX影集

2025/11/21

月刊龍貓大王通信

進入串流大戰第二階段！台灣影視作品如何透過全球VOD平台對外發聲？這是來自美國電影協會的觀察

本文探討串流平臺（VOD）如何徹底改變好萊塢和臺灣影視產業的生態。從美國電影協會（MPA）的數據報告，揭示串流服務在臺灣的驚人普及率與在地內容的消費趨勢。文章分析國際作品如何透過在地化元素開拓新市場。同時，作者也擔憂政府過度監管可能扼殺臺灣影視創新自由，以越南為鑑，呼籲以開放態度擁抱串流時代的新機遇

#電影產業#全球在地化#串流平台

2025/11/24

月刊龍貓大王通信

進入串流大戰第二階段！台灣影視作品如何透過全球VOD平台對外發聲？這是來自美國電影協會的觀察

#電影產業#全球在地化#串流平台

2025/11/24

Chih-Yuan Yip的沙龍

人工智慧開源庫 PyTorch 2.4 發布

PyTorch 是一個開源的 Python 機器學習庫，基於 Torch 庫，底層由 C++ 實現，應用於人工智慧領域，如電腦視覺和自然語言處理等。 PyTorch 2.4 引入了多項新功能和改進，包括支援 Python 3.12、AOTInductor 凍結功能、新的高階 Python 自訂運算

#PyTorch#Pytorch#pytorch

2024/08/09

Chih-Yuan Yip的沙龍

人工智慧開源庫 PyTorch 2.4 發布

#PyTorch#Pytorch#pytorch

2024/08/09

Karen的沙龍

【邁向圖神經網絡GNN】Part5: 建構 GNN model 實作 Cora 資料集結點分類任務

本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡（GNN），並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化，包括引入批量標準化和獨立的消息傳遞層，調整Dropout和聚合函數，顯著提高了模型的分類準確率。實驗結果表明，經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。

#GNN#Graph#dropout

2024/07/28