🤖譯後編輯的世界

閱讀時間約 7 分鐘
  還記得上在【翻譯所大小事】介紹口筆譯組課程時,有提到師大翻譯所因應翻譯產業的趨勢,加開了「譯後編輯」的課程嗎?趁著最近開學新氣象,不妨跟著小編一同初步探索譯後編輯的世界吧!

機器翻譯就。很。破?

  不諱言,現在就算將唐詩名句「松下問童子」拿去Google翻譯,還是會得到 ”Panasonic asks the boy” 如此啼笑皆非的譯文(筆者親測),但不代表機器翻譯 (machine translation, 下簡稱MT) 發展至今並無任何長進。根據一項網路報告指出 [1] ,以Google翻譯從2006年甫推出時所使用的基於短語機器翻譯 (phrase-based machine translation, 下簡稱PBMT) 技術,直到2016年開始引進神經機器翻譯 (neural machine translation, 下簡稱NMT) 技術,就翻譯品質而言,英進中提升了58%,而英進西甚至提升高達87%。長期研究機器翻譯的史宗玲老師在最新一期《編譯論叢》所發表的期刊論文中也提及 [2] ,以英文原文 “We welcome the new year with a renewed spirit and enthusiasm” 為例,在早期以PBMT技術為主的Google翻譯會翻成「我們歡迎新的一年以新的精神和熱情」,很明顯地當時機器翻譯無法產出正確語序的譯文,但現在全面使用NMT的Google翻譯已經會自動調整成「我們以全新的精神和熱情迎接新的一年」。儘管如此,眾所皆知目前機器翻譯品質參差不齊,因此使用機器翻譯固然方便,但仍需人工輔助編修,因應而生的機器翻譯後編輯 (machine translation post-editing, 下簡稱MTPE) 可說是未來的趨勢。

機器翻譯後編輯-怎麼編?修多少?

  目前西方學者多半將MTPE分成:輕量級後編輯 (light editing) 和全面性後編輯 (full editing)。根據翻譯自動化用戶協會 (Translation Automation User Society,下簡稱TAUS) 所發行的MTPE指導手冊中 [3] ,描述輕量後編輯多半是為了個人或內部作業使用,僅需局部編輯獲得內文資訊大意即可;而全面性後編輯則須將機器翻譯的譯文編修至近乎人工翻譯的品質程度,多半是為出版用。然而在這種簡單的二分法劃分下,仍難以在MTPE的訓練上提供務實的標準。史宗玲老師曾於去年 (2020) 國教院所舉辦的「翻譯教育如何面臨 AI 的挑戰及如何運用 AI」論壇中,提供3層級的MTPE訓練 [4] :
▹第 1 層級:來源語導向 (ST-oriented) 的後編輯策略 /
著重在修正語意和文法錯誤等語言的機器翻譯錯誤 (linguistic MT errors) ,如使用正確的單字、術語、標點符號、文法或者是語序。在其最新發表的期刊論文中,舉了一項技術類文本英進中機器翻譯後編輯為例子 [5] :
ST ▾
To find out which features are #supported in your area, see
MT ▾
要瞭解您所在地區 #支持 哪些功能,請參閱
MTPE ▾
若要查看您的所在地區 #支援 哪些功能,請參閱
▹第 2 層級:目標語導向 (TL-oriented) 的後編輯策略 /
著重修正語用的機器翻譯錯誤 (pragmatic MT errors) ,以符合目標語表達習慣,如用一致性的術語、去除贅詞,遇到隱喻、俚語要改編,甚至將整個句子重寫,或是加上連接詞或轉折詞讓語言更通順。在其最新發表的期刊論文中,舉了一項公司網頁文本英進中機器翻譯後編輯為例子 [6] :
ST ▾
If a standard room is available, #it_is_yours .
MT ▾
如果有標準房間,#那是你的
MTPE ▾
若有標準客房,#我們就會為您保留
▹第 3 層級:功能導向 (function-oriented) 的後編輯策略 /
著重在修正情感的機器翻譯錯誤 (affective MT errors) ,以滿足勸誘或美學欣賞能力,惟運用策略時經常需要重寫,並加上修飾詞或者情感用詞,再補充訊息。在其最新發表的期刊論文中,也舉了一項公司網頁文本中進英機器翻譯後編輯為例子 [7] :
ST ▾
現在則循著同樣的創新模式,#進入智慧連結與虛擬實境的領域
MT ▾
The mobile phone industry is now following the same innovative model and #entering_the_field_of_smart_links_and_virtual_reality.
MTPE ▾
相信上述的 3 層級的MTPE訓練策略,能夠讓我們更有意識地增進MTPE技巧!
  隨著科技的日新月異,很多時候我們不禁會開始擔心何時工作會被AI取代;然而,翻譯是一種有機的過程,跨文化間的溝通交流,如何不斷與時俱進,善用科技之餘,繼續提供具有人情味的翻譯服務,更是現代譯者所需不斷學習的課題。
𝐑𝐞𝐟𝐞𝐫𝐞𝐧𝐜𝐞𝐬:
[1] TechOrange(2016年9月29日)。〈不用學英文了?Google 翻譯導入類神經機器學習,Google 小姐變聰明啦!〉。Buzzorgange。https://buzzorange.com/.../09/29/google-translation-gnmt/
[2] 史宗玲(2021)。〈高科技變動情境下的再出發──重新審視機器翻譯錯誤和後編輯策略〉。《編譯論叢》,14(2),125-166。https://ctr.naer.edu.tw/v14.2/ctr140204.pdf
[3] Translation Automation User Society. (2016, January 20). 𝘛𝘈𝘜𝘚 𝘱𝘰𝘴𝘵-𝘦𝘥𝘪𝘵𝘪𝘯𝘨 𝘨𝘶𝘪𝘥𝘦𝘭𝘪𝘯𝘦𝘴. TAUS—The Language Data Network. https://cdn2.hubspot.net/.../TAUS%20Post-Editing...
[4] 史宗玲(2020)。AI時代「M型雙峰」翻譯人才培育。發表於林慶隆(主持),翻譯教育如何面臨 AI 的挑戰及如何運用 AI ,國家教育研究院語文教育及編譯研究中心舉辦之2020臺灣翻譯研討會-AI與翻譯教育,臺北市,臺灣。https://ctr.naer.edu.tw/v14.1/ctr140106.pdf
[5] 同註[2],頁140。
[6] 同前註,頁145。
[7] 同前註,頁148。
註:本文為 2021 年 10 月 8 日臺師大翻譯所臉書粉絲專頁貼文
想知道更多有趣的翻譯書,或想透過書本更深入了解翻譯生活嗎? 喜歡閱讀、熱愛翻譯的你,千萬不能錯過我們的好書分享與深度介紹!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
美國有不少移民雖有投票權,卻因語言障礙而無法完全理解競選人的政見或是投票制度。就像是有滿腦子的想法,卻因為語言隔閡感到疏離。若這些選民得到適切的語言服務支援,說不定可能會翻轉選舉結果。
Zirnstein 表示,「由於優秀的雙語能力者接觸的不只一種語言,多種語言輸入使他們必須面對更多挑戰。我們在他們的大腦活動中發現,精通第二語言的讀者能夠主動預測下文可能會出現的字詞,甚至能在判斷錯誤時盡快適應、學習,如此一來,雙語者第二外語的能力就有可能會和單一語言能力者一樣好。」
美國總統川普與俄羅斯總統普亭於今年(2018年) 7 月 16 日在芬蘭首都赫爾辛基舉行首次正式峰會,川普和普亭單獨閉門晤談了兩個小時,除了兩名口譯員外,沒有其他官員在場,各界對兩位領袖的秘密會談內容都感到相當擔憂。 📝原文連結: 📌延伸閱讀:
Google 一直致力於透過機器學習改善自家翻譯系統的準確度,利用人工智慧的力量提升機器翻譯品質,並於今年八月發表新機器學習模型 Universal Transformer。隨著機器學習模型不斷演進,AI 處理翻譯時的邏輯和策略也與真人譯者越來越相似。 原文連結
「要做翻譯就坐下來翻譯啊,何必跑到學校學呢?」 「都已經是譯者了,還有必要上課進修嗎?」 如果你也有過類似的疑問,不妨看看新加坡政府即將為該國翻譯產業祭出的新計畫吧! . 你也想提升自己的翻譯能力嗎?快來報名台師大口筆譯推廣班!(最新資訊請鎖定師大翻譯所臉書粉絲專頁)
美國有不少移民雖有投票權,卻因語言障礙而無法完全理解競選人的政見或是投票制度。就像是有滿腦子的想法,卻因為語言隔閡感到疏離。若這些選民得到適切的語言服務支援,說不定可能會翻轉選舉結果。
Zirnstein 表示,「由於優秀的雙語能力者接觸的不只一種語言,多種語言輸入使他們必須面對更多挑戰。我們在他們的大腦活動中發現,精通第二語言的讀者能夠主動預測下文可能會出現的字詞,甚至能在判斷錯誤時盡快適應、學習,如此一來,雙語者第二外語的能力就有可能會和單一語言能力者一樣好。」
美國總統川普與俄羅斯總統普亭於今年(2018年) 7 月 16 日在芬蘭首都赫爾辛基舉行首次正式峰會,川普和普亭單獨閉門晤談了兩個小時,除了兩名口譯員外,沒有其他官員在場,各界對兩位領袖的秘密會談內容都感到相當擔憂。 📝原文連結: 📌延伸閱讀:
Google 一直致力於透過機器學習改善自家翻譯系統的準確度,利用人工智慧的力量提升機器翻譯品質,並於今年八月發表新機器學習模型 Universal Transformer。隨著機器學習模型不斷演進,AI 處理翻譯時的邏輯和策略也與真人譯者越來越相似。 原文連結
「要做翻譯就坐下來翻譯啊,何必跑到學校學呢?」 「都已經是譯者了,還有必要上課進修嗎?」 如果你也有過類似的疑問,不妨看看新加坡政府即將為該國翻譯產業祭出的新計畫吧! . 你也想提升自己的翻譯能力嗎?快來報名台師大口筆譯推廣班!(最新資訊請鎖定師大翻譯所臉書粉絲專頁)
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
本文探討了機器翻譯技術,特別是神經機器翻譯(NMT)的發展及其在商業與專業領域的應用。儘管技術提升,專家認為人力翻譯在高精度、文化適配等領域仍不可或缺,未來將呈現人機協作的新模式。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 120 中使用 Google Gemini 將一段英文翻譯成法文,那我不是法文專業者,怎麼知道翻譯的好不好呢? 我可以使用 B
Thumbnail
AI對語言學習的衝擊 自從ChapGPT橫空出世,大家開始真正感受到AI真的來了,最起碼它在語言這塊已經可以做到接近完美的程度,很多人甚至開始懷疑到底我們還需要學習英文嗎?畢竟現在人手一機,再加上AI的應用,基本就是帶了一個會行走的翻譯機,以後出國再也不用擔心語言的問題,是不是翻譯已經變成是一項可
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在第四章中,將會談論以下主題: 定義機器翻譯 人類轉導與翻譯 機器轉導和翻譯 評估機器翻譯 預處理 Workshop on Machine Translati
機器其實不是像人類這樣一的單字對應一個單字去翻譯, 而是使用「編碼器 Encoder」與「解碼器 Decoder」來做語言之間的翻譯。 其中編碼器的任務,是「閱讀 Read」與「處理 Process」完整的文本, 而解碼器的任務,則是「產生 Produced」翻譯過後的文本。
機器學習是什麼? 簡單來說,機器學習就是訓練機器尋找Function的一段過程,而這個Function可以幫助我們解決我們遇到的問題,或是幫助我們
現代大語言模型建構於Transformer結構。 Transformer結構是源自於2017年著名論文 Attention Is All You Need的深度神經網路結構。 原始的Trasformer是為了機器翻譯發展,當初的任務是將英文翻譯成德文與法文。 Transformer
去年八月左右,幾個新聞界的記者朋友遇到我,便連聲感嘆說:AI的寫作編輯功能太厲害了,照這情勢發展下去,我們很快就要失業了。一個翻譯界的朋友,同樣表達這一憂慮:譯者與翻譯軟體較量最後是誰勝出?對我來說,要回答這些尖銳的問題,我得不帶任何偏見,認識AI和翻譯軟體這樣的競爭對手,否則很容易流於意氣之爭,於
前言 113.2.28曾任科技部代理部長的林一平在聯合報發表了一篇《AI時代的作家》討論AI對作家的影響,原因是有外文系教授問他:未來文學院學生的工作是否會被AI所取代?他的看法是翻譯工作可以確定會被取代。(註:到清邁旅遊時,手機壞了,不通泰語,可是到尚泰百貨的手機商場時,修理手機的小弟直接用
Thumbnail
台灣啟航:跨領域的解讀與對話;對於文學創作的新認識
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
本文探討了機器翻譯技術,特別是神經機器翻譯(NMT)的發展及其在商業與專業領域的應用。儘管技術提升,專家認為人力翻譯在高精度、文化適配等領域仍不可或缺,未來將呈現人機協作的新模式。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們在 AI說書 - 從0開始 - 120 中使用 Google Gemini 將一段英文翻譯成法文,那我不是法文專業者,怎麼知道翻譯的好不好呢? 我可以使用 B
Thumbnail
AI對語言學習的衝擊 自從ChapGPT橫空出世,大家開始真正感受到AI真的來了,最起碼它在語言這塊已經可以做到接近完美的程度,很多人甚至開始懷疑到底我們還需要學習英文嗎?畢竟現在人手一機,再加上AI的應用,基本就是帶了一個會行走的翻譯機,以後出國再也不用擔心語言的問題,是不是翻譯已經變成是一項可
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在第四章中,將會談論以下主題: 定義機器翻譯 人類轉導與翻譯 機器轉導和翻譯 評估機器翻譯 預處理 Workshop on Machine Translati
機器其實不是像人類這樣一的單字對應一個單字去翻譯, 而是使用「編碼器 Encoder」與「解碼器 Decoder」來做語言之間的翻譯。 其中編碼器的任務,是「閱讀 Read」與「處理 Process」完整的文本, 而解碼器的任務,則是「產生 Produced」翻譯過後的文本。
機器學習是什麼? 簡單來說,機器學習就是訓練機器尋找Function的一段過程,而這個Function可以幫助我們解決我們遇到的問題,或是幫助我們
現代大語言模型建構於Transformer結構。 Transformer結構是源自於2017年著名論文 Attention Is All You Need的深度神經網路結構。 原始的Trasformer是為了機器翻譯發展,當初的任務是將英文翻譯成德文與法文。 Transformer
去年八月左右,幾個新聞界的記者朋友遇到我,便連聲感嘆說:AI的寫作編輯功能太厲害了,照這情勢發展下去,我們很快就要失業了。一個翻譯界的朋友,同樣表達這一憂慮:譯者與翻譯軟體較量最後是誰勝出?對我來說,要回答這些尖銳的問題,我得不帶任何偏見,認識AI和翻譯軟體這樣的競爭對手,否則很容易流於意氣之爭,於
前言 113.2.28曾任科技部代理部長的林一平在聯合報發表了一篇《AI時代的作家》討論AI對作家的影響,原因是有外文系教授問他:未來文學院學生的工作是否會被AI所取代?他的看法是翻譯工作可以確定會被取代。(註:到清邁旅遊時,手機壞了,不通泰語,可是到尚泰百貨的手機商場時,修理手機的小弟直接用
Thumbnail
台灣啟航:跨領域的解讀與對話;對於文學創作的新認識