大型語言模型翻譯擂臺賽：GPT vs Gemini vs Claude vs Le Chat (2025版)

林楷庭（熊三飛彈）

發佈於科科科科科

2025/05/07 更新2025/04/24 發佈閱讀 11 分鐘

之前2024 1月時，嘗試過把各家幾個主流LLM都問了一遍相同的問題

那時候題目是這樣的:請翻譯這段(梵文的)Prompts

參加者有還和微軟同盟的OpenAI(GPT和Copilot),anthropic的Claude2,Google的Bard，以及場外嘉賓 Vivo的藍心。

而現在2025了，各家模型都有所迭代

Bard變成了Gemini，並且放出了使用者們等最久的模型更新 2.5Pro

GPT則是出了o系列與Mini版本、Claude變成了3.5/7

所以呢我們來看看當今在翻譯這塊各家有什麼樣的效果，並且這次翻譯擂台二彈標準與參戰者有調整(主要是Vivo封我號沒法開藍心了QwQ)。

第二屆加入了歐洲模型廠Mistral的Le chat這個全新的選手

規則照第一次做比較，一樣是一次對話但本次加測了開啟思考模式以及考驗視覺能力。

場地準備完成，觀眾也理解比賽規則了。

那麼，實驗開始!

關卡：在看清畫面上的文字並抓取出來後，送進模型並思考（也有測沒開思考）直譯,意譯與超譯三種版本。

GPT

首先開場，先來個熱門模型廠

GPT的熱度想必各位一定清楚，部分大眾甚至有了刻版印象

第一個呢，是開思考的o3-Mini

エンディング：「世界一カッコいい人」

o3給出了要求的直譯、意驛、與超驛的版本

結局：「世界上最帥氣的人」(直)

結尾：那個世界上最酷的人(意)

終幕：世界第一的超帥主角！(超)

再來是4o

4o在跑同樣要求時:

結局：「向著世界第一帥氣的人」(直)

尾聲：奔向「最帥的人」(譯)

最終章：成為我心中最閃耀的人(超)

在整個回應上面4o活潑很多

4o-Mini

給出來的結果該如何講，很像(部分圈內人)私底翻的版本。

大綱中文與日文詞彙交雜，但是是最好懂的

標題翻的差點意思，不是意境上面差一點

而是直、意、超譯的都一樣

只是多幾個字

匿名投票

最喜歡哪個版本

o3 mini

Gemini

2.0(帶思考與不帶思考的版本都測了，就文本最平衡的是帶思考的版本)

2.5Pro的能力在我們這個大綱內發揮的點主要在於

對於整個內容的綜觀與理解能力，例如我們的關卡是來自Bestdori的截圖

2.5P能夠看出來這是甚麼網頁，網頁是第三方建立的(你真的沒有偷開聯網嗎2.5P?)甚至看出了小Icon裡面的獎勵物是甚麼(2.0完全不行) 和之前提過的有沒有特化走差,Gemini2.0Flash thinking與特化版比較-生成圖逆向工程圖像特化版一樣，對於解釋它的行為是相當清楚。

2.0(不帶思考):

結局：エンディング：『世界一カッコいい人』へ (Ending: To 'The Coolest Person in the World')

故事 (Story): 燐子と共に下したあこの決断。それは、ステージで明かされる。 (亞子和燐子一同做出的決定。那將在舞台上揭曉。)

條件 (Condition): 55000イベントP達成 (Achieve 55000 Event Points)

報酬 (Reward): x1 〇〇 (角色或物品) x50 (可能是遊戲內的貨幣或點數)

直: The decision that Ako made together with Rinko. That will be revealed on the stage. Condition: Achieve 55000 Event Points. Reward: x1 〇〇, x50.

（不能算它錯，翻英文的確是直接清楚很多）

意: 亞子和燐子共同做出的決定。那個決定將會在舞台上公開。需要達成 55000 活動點數才能解鎖。獎勵是一個〇〇和 50 個某種資源。

（這翻譯很像移動怪獸（臺灣代理）在不用thinking的狀態下這個是第一名）

超: 在彼此的心意交織之下，亞子和燐子共同做出了重要的決定。那份羈絆的證明，那份對未來的期許，將在耀眼的舞台上，伴隨著激昂的旋律，向全世界揭開神秘的面紗！達成 55000 活動點數，即可見證最終的結局。成功解鎖，將獲得珍藏角色/道具「〇〇」以及額外活動獎勵 50！(🤨)

2.0(帶思考):

エンディング：「世界一カッコいい人」へ (結局：致「世界第一帥氣的人」)

燐子と共に下したあこの決断。それは、ステージで明かされる。
- 直譯：與燐子一同做出的亞子的決定。那將會在舞台上揭曉。
- 意譯：亞子和燐子共同做出的決定，將在舞台上公開。
- 超譯：亞子與燐子攜手做出的抉擇，即將在耀眼的舞台上揭開神秘面紗。
條件：55000イベントP達成
- 直譯：條件：達成55000活動P。
- 意譯：要求：獲得55000活動點數。
- 超譯：目標：累積到55000活動點數即可觀看結局。
報酬：<0xE3><0x80><0x80>×1<0xE3><0x80><0x80>×50
- 直譯：報酬：粉紅寶石 x1，黃色寶石 x50。
- 意譯：獎勵：粉紅寶石 1 個，黃色寶石 50 個。
- 超譯：最終獎勵為：粉紅寶石一顆，黃色寶石五十顆。
- (可以接受的錯誤，即便是2.5P這個最強也是需要人工,這個品質可以用只是不太順利)

2.5Pro(自帶思維鏈，沒有不思考的狀態):

結局：致『世界第一帥氣之人』

劇情： 亞子和燐子一同做出的決定。這一切，將在舞台上揭曉。
條件： 活動 Pt 累積達 55000
獎勵： [星星] x1, [音色水晶] x50

(雖然反了，但是名詞是對的)

直: 追求字詞層面的對等，盡可能保留原文的結構和詞彙。
- 可能版本： 結局：往「世界第一帥氣的人」
- 特點： 非常貼近原文的字面意思和結構（ヘ = 往...方向/向著...）。但讀起來可能不太自然，甚至有點生硬或語意不清。它保留了最多的原始信息，但犧牲了流暢度和目標語言的習慣用法。

意: 追求意義層面的對等，用目標語言自然、準確的方式傳達原文的核心意思。

可能版本（我(模型自己)之前用的是這個）： 結局：致「世界第一帥氣之人」
特點： 這是最常見的翻譯方式。它理解原文的整體意思（這是一個獻給某人的結局），然後用中文流暢地表達出來。「致」比「往」更符合中文書面語的習慣。「帥氣之人」比「帥氣的人」稍微更書面化一點，符合標題的感覺。它在忠實原文和目標語可讀性之間取得平衡。

超: 為了達到特定效果（如：更強的感染力、更貼近目標受眾文化、更符合特定文體風格），可以較大程度地脫離原文的字面意思甚至結構，重在傳達精神、風格或引發相同的情感共鳴。

可能版本：
- 結局：獻給吾之最帥 (更強調個人情感和一種詩意/中二感？) （前面這不是我寫的，這它自己開的括號,然後就是“最帥“這塊）
- 終章：所謂「天下第一帥」 (用「終章」替代「結局」，「所謂」增加一點玩味，「天下第一」更口語化)（這裡放一個我自己的版本終局：所謂天下第一。或者是套個角色濾鏡上去（Ex.這團主唱想要抵達的“舞台上的頂點”使文案更加融入那個世界））
- The Showdown: To Be the Coolest! (如果目標是英文版，且想強調遊戲的熱血感，可能完全改變結構)
特點： 自由度最大，但也最容易引起爭議。它可能非常有創意，也可能偏離原意太遠。在遊戲、詩歌、廣告標語等領域比較常見，目的是抓住眼球或營造特定氛圍，而不僅僅是傳遞信息。

---------------分隔線-----------------------------------------------------------

Grok

社群媒體的Ai

Grok3的結果像4omini，2代結果會更好一些，部分意譯跑出來有概率還是很生硬

-------------------分隔線----------------

Claude

沒有得選啊（免費仔）但是Think可以用民間大佬的網頁插件+特調Prompts做到思考這事

3.7Sonnet：

翻譯上面人名細節問題（可接受），結果非常舒服屬於是上面各家優秀的綜合體

开场：杂志专访 - 故事：小日和接受了音乐杂志的采访，谈论了她的乐队以及其他话题...

第1话：如果是青涩、燃烧着的青春（目前看過最頂標題，而且是直譯） - 故事：全力以赴投入练习的小日和。在这过程中，两人开始想象某些事。

3.7Sonnet（加think）：

直意標題還是很頂但內容變得普通，反而是意譯出來的結果是最完美的

------------------------------------分隔線-----------------------

Le chat

歐洲模型，不怪它

資料量上面還是歐洲為主，放棄一點通用性換來一個成本是GPT四分之一但效果接近的地區型特調AI也是個不錯的選擇

4o mini的味道又再次重現（但更糟）

-------------------------------------------------

追加提問

“直譯意譯超譯這些詞對於模型的意義”

這麼多的模型在問一輪之綜合答案是這樣的：

對模型來說，這些詞彙在內部運作意義不大

但是對於使用者&描述與評估輸出來說仍然重要

模型不會刻意的去選擇輸出的風格，我們現在看到的是基於放進去的大量資料,學習出來的結果（當然你也可以透過反饋,模型記憶或是提示詞工程去引導結果）

這些AI（工具）本身是為了服務人類而打造的

所以用人能理解的框架/概念標準去要求,引導,評價是依然重要的一件事，使得能夠定義需求,溝通期望並判斷結果是不是符合人的標準

-----------------------------------

後記

我本來以為可以水一篇的

結果軍備競賽，新模型,新的概念都跑出來了

寫著寫著又4千了還拖了點時間（高三事務）

目前還是以免費版本能用的為主啦，可能明年想不開跑去用Poe,Monica這種多種服務供應商的軟體去測付費模型

近期新內容清單：

［OC•人設•角色扮演Chatbot］

［假虛化的應用&如何把照片變微縮模型］

新開了邦邦四格漫翻譯，每週二三更新

有興趣歡迎去看看

留言

留言分享你的想法！

林的怪東西集中地

2會員

54內容數

怪東西都會在這裡

#AI 的其他內容

出鞘的雙面刃：AI

目前共 13332 篇

怪獸科技公司✖️沙龍

從《鬼滅之刃》看「變強」的代價：當成長變成權力與執念，我們都可能變成鬼｜怪獸科技公司

Anthropic 團隊現身說法：如何設計一個高效率的 AI Agent【全文摘要翻譯】

學習玩家｜啟動玩心學習

打造專屬你的 AI 助理：從 Gemini 的 Gem 功能開始｜附贈 PARTS 設計小指南

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15