從手機部署到多模態任務，一個 Phi‑3 就夠

2025/07/30 更新2025/07/30 發佈閱讀 3 分鐘

Phi‑3 系列以高品質與合成資料訓練，搭配 RLHF 與自動測試優化，實現可在手機上執行的高效語言模型，並推出支援圖像理解的多模態版本 Phi‑3‑Vision《Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone》，在推理、生成與感知任務上展現接近 GPT‑3.5 的能力。

劃時代的性能與小型化

Phi-3 小型語言模型（SLMs）使用高品質資料訓練

經過大量高品質資料訓練，包括人類反饋強化學習（RLHF）和自動化測試。
Phi-3 系列模型適用於各種語言理解、推理分析和生成任務。
在資源有限和低延遲需求的場景中表現突出，甚至部署於手機上(Phi-3-mini 4-bit)。

Phi-3 性能優於同等和更大尺寸模型

支持 4K / 8K 和 128K 的上下文長度，適用於不同場景需求。
在語言、推理、程式碼和數學等基準性能優於同等和更大尺寸模型，如 GPT-3.5T 和 Gemini 1.0 Pro。
使用 ONNX Runtime 優化模型
- 支持 Windows DirectML 和跨平台支援。
- 針對 NVIDIA GPU 和 Intel accelerators 進行優化。

Phi-3 模型大小與效果比較

安全性評估

遵循 Microsoft 負責任 AI 標準，包含六項原則：
- 問責制、透明度、公平性、可靠性和安全性、隱私和安全性、包容性。
經過嚴格安全測量和評估：
- 紅隊測試（red-teaming）、敏感用途審查（sensitive use review）。
使用高品質資料訓練
- 經過強化學習和多種危害類別的自動化測試和人工紅隊測試。

加入多模態

Phi-3 系列新增 Phi-3-vision 模型
- 結合語言和視覺能力，對於文本和圖像進行推理。
- 在視覺推理任務、OCR、表格和圖表理解任務中性能超過更大尺寸模型。

Phi-3-vision 圖表理解能力

選擇合適的模型

Phi-3-mini（3.8B） : 支援 128K, 4K 兩種上下文長度（context lengths）。
Phi-3-small（7B） : 在語言、推理、程式碼和數學測試中擊敗 GPT-3.5。

Phi-3-small（7B）

Phi-3-medium（14B） : 各項表現優於Gemini 1.0 Pro。

Phi-3-medium（14B）

Phi-3-vision（4.2B）: 適合需要圖文結合推理的任務，如 OCR 和圖表理解，優於 Claude-3 Haiku 和 Gemini 1.0 Pro V 等較大模型。

Phi-3-vision（4.2B）

AI 工程師的 LLM 筆記訓練大型語言模型的資料策略

留言

留言分享你的想法！

AI 工程師的 LLM 筆記

0會員

14內容數

聊一聊提示工程、模型調校與優化技巧，同時分享一路走來的挑戰與突破，作為提醒未來的自己：別忘初心，走得更踏實。

AI 工程師的 LLM 筆記的其他內容

2025/07/30

用合成資料打造的小而強模型：Phi-1.5

Microsoft Research 發表《Textbooks Are All You Need II: phi-1.5 technical report》，Phi-1.5 展現高品質合成資料（教科書等級）的潛力，以僅 1.3B 參數在常識推理與語言理解上媲美大型模型，挑戰「參數規模至上」的傳統觀點

2025/07/30

用合成資料打造的小而強模型：Phi-1.5

2025/07/28

不是資料太少，是太雜：phi-1 的啟示

微軟的研究論文《Textbooks Are All You Need》提出以高品質教科書資料訓練語言模型，開發出僅 1.3B 參數的 phi-1 模型，其效能在程式碼生成任務上媲美參數量更大的模型。此論文探討了高品質資料的重要性，包含資料過濾、合成教科書資料集的建立，以及模型架構與訓練過程。

2025/07/28

不是資料太少，是太雜：phi-1 的啟示

2025/07/28

使用 LLM 生成訓練語料：合成資料的實用性與挑戰

使用大型語言模型（LLM）生成合成資料作為訓練語料的可行性與實務應用。根據研究顯示，合成資料在某些任務上可達到與真實資料相近的效果，具備部分替代潛力。高品質訓練資料對模型表現的重要性，並討論合成資料的生成策略與評估方法。

2025/07/28

使用 LLM 生成訓練語料：合成資料的實用性與挑戰

看更多

你可能也想看

Oren

咖啡控的0元回血實驗：加入蝦皮分潤計畫後，我的1111購物車能回本嗎？

這篇文章是一位咖啡愛好者分享他在雙11前的購物規劃。他不僅推薦了自己喜愛的咖啡豆品牌（如李董、音樂家系列）與手沖器材，還分享了實用的挑豆技巧。同時，他記錄了一項個人實驗：剛加入「蝦皮分潤計畫」，想測試透過分享真心喜愛的商品，是否能為自己的咖啡開銷「回血」。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

Oren

咖啡控的0元回血實驗：加入蝦皮分潤計畫後，我的1111購物車能回本嗎？

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

吃喝玩樂皮丹媽媽(๑´ڡ`๑)

完整出國行李清單｜出國旅行必備物品＆蝦皮購物攻略

出國旅行時，準備充分的行李能讓旅程更加輕鬆愉快！本文整理了大人旅行的全方位行李清單，從護照、信用卡到各種旅行好物一應俱全。特別是防盜小物、瞬熱熱水壺和過濾蓮蓬頭等必備單品，讓你的旅行更舒適、安全。此外，還介紹了蝦皮分潤計劃，讓你在購物的同時還能輕鬆賺取分潤，無論是準備行李還是購物分享，都是不錯的選擇

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05