Bilingual Evaluation Understudy (BLEU)

更新於 發佈於 閱讀時間約 2 分鐘

Bilingual Evaluation Understudy(BLEU) 是一種自動化的評估指標,用於衡量機器翻譯(Machine Translation)或其他生成式文本與一個或多個人工參考翻譯之間的相似度。

主要原理

  • BLEU 透過比較機器產生文本與參考翻譯中的 n-gram(連續 n 個詞)重疊率 來評分。
  • 計算不同長度的 n-gram(通常 n=1 到 4)的精確度,並結合「簡潔懲罰(brevity penalty)」以避免偏好過短的翻譯。
  • 分數介於 0 到 1 之間,數值越接近 1 表示機器翻譯與人工翻譯越相似,品質越高。

特點

  • BLEU 是首個與人類評分高度相關的自動化翻譯評估指標,廣泛用於機器翻譯、文本摘要、影像說明生成等任務。
  • 不考慮語法正確性或語意理解,只量化字詞重疊情況。
  • 評分結果通常在同一語言對、相同測試集和模型間比較才有意義2

應用範圍

  • 神經機器翻譯(NMT)系統評估
  • 統計機器翻譯(SMT)效果比較
  • 影像與影片字幕生成評估
  • 文本摘要品質評估(雖然 ROUGE 更常用於摘要)1

總結

BLEU 是一種基於 n-gram 重疊的自動化文本品質評估指標,透過與人工翻譯的比較,量化機器生成文本的準確度與相似度,是自然語言處理領域中廣泛使用的標準評估方法。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
9會員
261內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師
2025/07/08
WaveNet 是由 DeepMind 研發的一種深度卷積神經網路架構,專門用於生成高品質的原始音訊波形,最初設計目標是用於文字轉語音(Text-to-Speech, TTS)系統,能產生非常自然且逼真的人聲。 主要特點與運作原理 自回歸生成模型(Autoregressive Model) Wa
Thumbnail
2025/07/08
WaveNet 是由 DeepMind 研發的一種深度卷積神經網路架構,專門用於生成高品質的原始音訊波形,最初設計目標是用於文字轉語音(Text-to-Speech, TTS)系統,能產生非常自然且逼真的人聲。 主要特點與運作原理 自回歸生成模型(Autoregressive Model) Wa
Thumbnail
2025/07/08
殘差神經網路(Residual Neural Network,簡稱 ResNet) 是一種深度神經網路架構,主要用於解決深層網路訓練時的「梯度消失」與「退化問題」,使得網路可以堆疊更多層數且仍能有效學習。 主要概念 殘差學習(Residual Learning) ResNet 引入了「殘差塊(R
2025/07/08
殘差神經網路(Residual Neural Network,簡稱 ResNet) 是一種深度神經網路架構,主要用於解決深層網路訓練時的「梯度消失」與「退化問題」,使得網路可以堆疊更多層數且仍能有效學習。 主要概念 殘差學習(Residual Learning) ResNet 引入了「殘差塊(R
2025/07/08
支持向量機(Support Vector Machine,簡稱 SVM) 是一種監督式機器學習演算法,主要用於分類和回歸任務。它的核心目標是找到一條(或多維空間中的一個超平面)最佳分隔線,將不同類別的資料點分開,並且最大化兩類之間的邊界(margin),以提升模型的泛化能力。 SVM 的主要特點:
Thumbnail
2025/07/08
支持向量機(Support Vector Machine,簡稱 SVM) 是一種監督式機器學習演算法,主要用於分類和回歸任務。它的核心目標是找到一條(或多維空間中的一個超平面)最佳分隔線,將不同類別的資料點分開,並且最大化兩類之間的邊界(margin),以提升模型的泛化能力。 SVM 的主要特點:
Thumbnail
看更多
你可能也想看
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容,我們拿 Encoder 出來看: 幾點注意如下: BERT 模型使用 M
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 39 至 AI說書 - 從0開始 - 69 的第二章內容,我們拿 Encoder 出來看: 幾點注意如下: BERT 模型使用 M
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 118 安裝完 googletrans,現在示範如何從英文翻譯成法文: import googletrans translator
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 118 安裝完 googletrans,現在示範如何從英文翻譯成法文: import googletrans translator
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 110 介紹了 BLEU 又在 AI說書 - 從0開始 - 111 介紹了 Smoothing 方法,現在我們來看怎麼何在一起:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 110 介紹了 BLEU 又在 AI說書 - 從0開始 - 111 介紹了 Smoothing 方法,現在我們來看怎麼何在一起:
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 以下提供範例說明 BLEU 怎麼使用: #Example 1 reference = [['the', 'cat', 'likes', 'milk'], ['cat
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 以下提供範例說明 BLEU 怎麼使用: #Example 1 reference = [['the', 'cat', 'likes', 'milk'], ['cat
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 xxx 提到,既然提到訓練,就表示要有一套衡量基準供大家遵守,有鑑於此,以下繼續介紹幾類衡量方式: MCC: 首先介紹 True (T) Positive (
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 xxx 提到,既然提到訓練,就表示要有一套衡量基準供大家遵守,有鑑於此,以下繼續介紹幾類衡量方式: MCC: 首先介紹 True (T) Positive (
Thumbnail
本文介紹自我監督學習的概念和訓練方式,以BERT和GPT為例,深入探討Masking Input及Fine-Tune的實際操作和可應用性。
Thumbnail
本文介紹自我監督學習的概念和訓練方式,以BERT和GPT為例,深入探討Masking Input及Fine-Tune的實際操作和可應用性。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News