Bilingual Evaluation Understudy (BLEU)

iPAS AI應用規劃師學習筆記

發佈於AWS AIF-C01

更新於 2025/07/09發佈於 2025/07/08閱讀時間約 2 分鐘

Bilingual Evaluation Understudy（BLEU） 是一種自動化的評估指標，用於衡量機器翻譯（Machine Translation）或其他生成式文本與一個或多個人工參考翻譯之間的相似度。

主要原理

BLEU 透過比較機器產生文本與參考翻譯中的 n-gram（連續 n 個詞）重疊率 來評分。
計算不同長度的 n-gram（通常 n=1 到 4）的精確度，並結合「簡潔懲罰（brevity penalty）」以避免偏好過短的翻譯。
分數介於 0 到 1 之間，數值越接近 1 表示機器翻譯與人工翻譯越相似，品質越高。

特點

BLEU 是首個與人類評分高度相關的自動化翻譯評估指標，廣泛用於機器翻譯、文本摘要、影像說明生成等任務。
不考慮語法正確性或語意理解，只量化字詞重疊情況。
評分結果通常在同一語言對、相同測試集和模型間比較才有意義2。

應用範圍

神經機器翻譯（NMT）系統評估
統計機器翻譯（SMT）效果比較
影像與影片字幕生成評估
文本摘要品質評估（雖然 ROUGE 更常用於摘要）1

總結

BLEU 是一種基於 n-gram 重疊的自動化文本品質評估指標，透過與人工翻譯的比較，量化機器生成文本的準確度與相似度，是自然語言處理領域中廣泛使用的標準評估方法。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記AWS AIF-C01

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

9會員

261內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/07/08

WaveNet

WaveNet 是由 DeepMind 研發的一種深度卷積神經網路架構，專門用於生成高品質的原始音訊波形，最初設計目標是用於文字轉語音（Text-to-Speech, TTS）系統，能產生非常自然且逼真的人聲。主要特點與運作原理自回歸生成模型（Autoregressive Model） Wa

2025/07/08

WaveNet

2025/07/08

Residual neural network

殘差神經網路（Residual Neural Network，簡稱 ResNet）是一種深度神經網路架構，主要用於解決深層網路訓練時的「梯度消失」與「退化問題」，使得網路可以堆疊更多層數且仍能有效學習。主要概念殘差學習（Residual Learning） ResNet 引入了「殘差塊（R

2025/07/08

Residual neural network

2025/07/08

Support vector machine

支持向量機（Support Vector Machine，簡稱 SVM）是一種監督式機器學習演算法，主要用於分類和回歸任務。它的核心目標是找到一條（或多維空間中的一個超平面）最佳分隔線，將不同類別的資料點分開，並且最大化兩類之間的邊界（margin），以提升模型的泛化能力。 SVM 的主要特點：

2025/07/08

Support vector machine

看更多

你可能也想看

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 129 中說，Bidirectional Encoder Representations from Transformers (BER

#AI#ai#PromptEngineering

2024/08/13

Learn AI 不 BI

AI說書 - 從0開始 - 130 | Masked Language Modeling 訓練

#AI#ai#PromptEngineering

2024/08/13

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容，我們拿 Encoder 出來看：幾點注意如下： BERT 模型使用 M

#AI#ai#PromptEngineering

2024/08/11

Learn AI 不 BI

AI說書 - 從0開始 - 127 | BERT 和 Transformer 模型比較

#AI#ai#PromptEngineering

2024/08/11

Learn AI 不 BI

AI說書 - 從0開始 - 119 | 使用 GoogleTrans 進行翻譯

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 AI說書 - 從0開始 - 118 安裝完 googletrans，現在示範如何從英文翻譯成法文： import googletrans translator

#AI#ai#promptengineering

2024/08/08

Learn AI 不 BI

AI說書 - 從0開始 - 119 | 使用 GoogleTrans 進行翻譯

#AI#ai#promptengineering

2024/08/08

Learn AI 不 BI

AI說書 - 從0開始 - 112 | BLEU + Smoothing 方法

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 110 介紹了 BLEU 又在 AI說書 - 從0開始 - 111 介紹了 Smoothing 方法，現在我們來看怎麼何在一起：

#AI#ai#PromptEngineering

2024/08/03

Learn AI 不 BI

AI說書 - 從0開始 - 112 | BLEU + Smoothing 方法

#AI#ai#PromptEngineering

2024/08/03

Learn AI 不 BI

AI說書 - 從0開始 - 110 | BLEU 使用方式與邏輯介紹

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。以下提供範例說明 BLEU 怎麼使用： #Example 1 reference = [['the', 'cat', 'likes', 'milk'], ['cat

#AI#ai#PromptEngineering

2024/08/02

Learn AI 不 BI

AI說書 - 從0開始 - 110 | BLEU 使用方式與邏輯介紹

#AI#ai#PromptEngineering

2024/08/02

Learn AI 不 BI

AI說書 - 從0開始 - 83

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續 xxx 提到，既然提到訓練，就表示要有一套衡量基準供大家遵守，有鑑於此，以下繼續介紹幾類衡量方式： MCC：首先介紹 True (T) Positive (

#AI#ai#PromptEngineering

2024/07/11

Learn AI 不 BI

AI說書 - 從0開始 - 83

#AI#ai#PromptEngineering

2024/07/11

dab戴伯的沙龍

BERT與GPT: 自監督學習的大型模型

本文介紹自我監督學習的概念和訓練方式，以BERT和GPT為例，深入探討Masking Input及Fine-Tune的實際操作和可應用性。

#機器學習#深度學習#ChatGPT

2024/05/16

dab戴伯的沙龍

BERT與GPT: 自監督學習的大型模型

本文介紹自我監督學習的概念和訓練方式，以BERT和GPT為例，深入探討Masking Input及Fine-Tune的實際操作和可應用性。

#機器學習#深度學習#ChatGPT

2024/05/16

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News