ArmoRM-Llama3-8B-v0.1：多面向LLM評估模型與使用教學

2025/08/06 更新2025/08/06 發佈閱讀 4 分鐘

論文《Interpretable Preferences via Multi‑Objective Reward Modeling and Mixture‑of‑Experts》中所提出的 ArmoRM‑Llama3‑8B‑v0.1 作為評分模型，能從多個可解釋維度（如誠實性、詳盡度、安全性等）對 LLM 生成的合成資料結果進行評估，並運用 Mixture‑of‑Experts 架構提升評分邏輯透明度與準確性。該模型在 RewardBench 評分基準上展現優異表現，已接近 GPT‑4 judge 水準，同時可避免 reward hacking 等隱藏風險。

從這裡可以取得 RLHF-Reward-Modeling 例程式與 ArmoRM-Llama3-8B-v0.1 模型下載，以下是重點整理與實際使用說明

架構說明

使用 ArmoRM-Llama3-8B-v0.1 做為評估模型

評分方式

輸入

Prompt：輸入的問題

'What are some synonyms for the word "beautiful"?'

Response：生成的答案

"Nicely, Beautifully, Handsome, Stunning, Wonderful, Gorgeous, Pretty, Stunning, Elegant"

messages：依據格式準備

messages = [{"role": "user", "content": prompt},
           {"role": "assistant", "content": response}]

輸出

支援 19 個項目評估

'helpsteer-helpfulness','helpsteer-correctness','helpsteer-coherence',
'helpsteer-complexity','helpsteer-verbosity','ultrafeedback-overall_score',
'ultrafeedback-instruction_following', 'ultrafeedback-truthfulness',
'ultrafeedback-honesty','ultrafeedback-helpfulness','beavertails-is_safe',
'prometheus-score','argilla-overall_quality','argilla-judge_lm','code-complexity',
'code-style','code-explanation','code-instruction-following','code-readability'

其中支援 HelpSteer dataset的五種評估

helpfulness, correctness, coherence, complexity, verbosity

範例

隨機抽取HelpSteer dataset做為範例

範例輸入

prompt = 'What are some synonyms for the word "beautiful"?'
response = "Nicely, Beautifully, Handsome, Stunning, Wonderful, Gorgeous, Pretty, Stunning, Elegant"

翻例輸出

# [helpfulness, correctness, coherence, complexity, verbosity]
標籤 : [3,3,4,2,2] 
模型 : [2.7812, 2.8398, 3.4844, 1.3945, 1.3262]

範例列表

AI 工程師的 LLM 筆記訓練大型語言模型的資料策略

留言

留言分享你的想法！

AI 工程師的 LLM 筆記

0會員

14內容數

聊一聊提示工程、模型調校與優化技巧，同時分享一路走來的挑戰與突破，作為提醒未來的自己：別忘初心，走得更踏實。

AI 工程師的 LLM 筆記的其他內容

2025/08/06

合成資料的隱私保護，針對品質三面向評估框架：SynEval

採用 SynEval 工具，從「隱私保護（Privacy preservation）」出發，同時兼顧「保真度（Fidelity）」與「實用性（Utility）」，確保在支持下游任務的前提下，不洩露敏感資訊。利用TSTR框架和MAE、準確率等指標評估實用性，透過推斷攻擊評估隱私保護效果。

2025/08/06

合成資料的隱私保護，針對品質三面向評估框架：SynEval

2025/07/30

合成資料生成流程大解密：深入解析 Nemotron‑4 340B 背後的 "資料生產線"

延續上篇所介紹的 Nemotron-4 340B Technical Report 細說合成資料集的流程，可以依據需要使用其中的步驟（流程），建置自己的合成資料生產線，最後附上範例 Prompt

2025/07/30

合成資料生成流程大解密：深入解析 Nemotron‑4 340B 背後的 "資料生產線"

2025/07/30

Nemotron‑4 340B：以超過 98% 合成高品質資料打造的開放式 LLM

由 NVIDIA 發表，包括 Base、Instruct 與 Reward 三個版本，在 alignment 過程中超過 98% 的微調資料來自合成資料生成流程，展現有效運用 synthetic data 發展對齊模型的能力。

2025/07/30

Nemotron‑4 340B：以超過 98% 合成高品質資料打造的開放式 LLM

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15