【MLOps - MLflow】AI模型實驗管理的超入門簡介

2024/10/02 更新2024/10/02 發佈閱讀 2 分鐘

當我們在訓練各種模型時，難免會有許多實驗性的參數、產出的模型、不同的資料來源，隨著版本迭代越來越多，過了一段時間回頭看之後卻發現當初最好的某一個實驗參數到底是啥啊？模型去了哪裡？用的數據集是哪些？

我想上述這些問題都是模型訓練的過程難免會遇到的問題，除非我們有一套管理的SOP，比如說：雲端Excel， But…，經過我們「人」就很容易漏失掉記錄，為了避免這個問題，我們需要一套好工具或者友善的平台幫我們把模型訓練的過程好好的管理一番，而MLFlow就是其中一個好幫手，今天就讓我們來好好的認識一下吧！

核心組件

Tracking: 用於記錄和查詢實驗參數、程式碼、指標和模型的 API 和 UI。
Model Registry: 用於管理模型版本、階段和註釋的集中式存儲庫。
MLflow Deployments for LLMs: 提供標準化 API 以訪問 SaaS 和開源大型語言模型 (LLM) 的服務器。
Evaluate: 用於比較和評估傳統 ML 模型和 LLM 的工具集。
Prompt Engineering UI: 為 LLM 的提示工程提供實驗、測試和部署環境的 UI。
Recipes: 提供結構化 MLflow 專案的最佳實務指南，重點關注實際部署。
Projects: 用於打包和共享可重複使用 ML 程式碼的標準格式。

為什麼要使用？

簡單來說就是讓我們的實驗可以有憑有據，怎麼訓練出一個好的模型的過程都可以被記載，並且快速用於下次的實驗，試想我們過往在管理程式碼時，也是透過Git來幫我們追蹤程式碼的修改過程，對於協作來說非常的有幫助，而AI時代的平台就需要MLFlow這樣的角色來幫我們追蹤與管理了！這會讓我們有條有理的訓練與實驗，減少因為漏失掉的紀錄所耗費的時間，提昇模型產品化的效率。

開箱試試MLflow

概覽

大致上的模式就是啟動MLFlow的伺服器，並在各個模型訓練的腳本中埋入追蹤的client端程式。

安裝套件

pip install mlflow

啟動伺服器

 mlflow ui

啟動之後我們可以在 http://localhost:5000/ 看到這樣的畫面：

寫一隻Client端訓練程式

連接到伺服器

mlflow.set_tracking_uri("<http://localhost:5000>")

讓我們建立一個實驗

mlflow.set_experiment("check-localhost-connection")

with mlflow.start_run():
    mlflow.log_metric("foo", 1)
    mlflow.log_metric("bar", 2)

接著試跑看看這隻程式

python test.py

回到管理介面會看到上傳成功的記錄

結語

今天我們簡單的介紹一下MLflow可以為我們帶來哪些好處，並用一個簡單的範例來讓大家了解一下MLflow大致上的運作模式，相信親手操作過一次之後概念會更加清晰，歡迎動手做看看！

#mlops

#mlflow

#ai

阿Han的沙龍阿Han的軟體技術棧 💡AI

留言

留言分享你的想法！

阿Han的沙龍

141會員

307內容數

哈囉，我是阿Han，是一位 👩‍💻 軟體研發工程師，喜歡閱讀、學習、撰寫文章及教學，擅長以圖代文，化繁為簡，除了幫助自己釐清思路之外，也希望藉由圖解的方式幫助大家共同學習，甚至手把手帶您設計出高品質的軟體產品。

阿Han的沙龍的其他內容

2025/04/23

【🤖 cursor AI】如何使用MCP Server

我們在「【🤖 cursor AI】如何在ubuntu 24.04安裝」有分享如何在Ubuntu安裝cursro這套AI編輯器，使用起來大幅度的提昇開發效率，但仍有些問題點需要克服，比如說： LLM壓根不知道我們的數據庫長怎樣啊？怎麼分析結構呢？假設文檔又不足的狀況下更是艱辛，如果LLM

2025/04/23

【🤖 cursor AI】如何使用MCP Server

2025/03/12

【語音合成技術 - MeloTTS】如何建置API服務？

我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」分享了語音合成技術，該套GPT-SoVITS也非常的出色，但效能有點不是非常理想，加上需要GPU才能達到較佳的體驗，如此一來成本就會有點高了，因此我們找了另外一套MeloTTS，這一套強調CPU推理非常的快！

2025/03/12

【語音合成技術 - MeloTTS】如何建置API服務？

2025/03/05

【語音合成技術 - GPT-SoVITS】解析API版本

我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務，但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術，因此我們可能會需要將API退回舊版，在這裡我們也整理了早期版本api與api_v2的一些差異，期望幫助到正在面臨選

2025/03/05

【語音合成技術 - GPT-SoVITS】解析API版本

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15