機器學習模型革新 AI翻譯品質再次向前邁進

更新於 2022/02/02閱讀時間約 4 分鐘
Google 一直致力於透過機器學習改善自家翻譯系統的準確度,利用人工智慧的力量提升機器翻譯品質,並於今年八月發表新機器學習模型 Universal Transformer。隨著機器學習模型不斷演進,AI 處理翻譯時的邏輯和策略也與真人譯者越來越相似。
Google 在去年發佈了新型機器學習模型 Transformer,使得翻譯準確度和效率較循環神經網路模型(Recurrent Neural Networks, RNN)提升不少。而今年Google 則是改良了Universal模型,發表了新的 Universal Transformer 模型,讓翻譯事業更上一層樓。要瞭解這之間的運作方式,以及 Google 翻譯系統越來越強大的原因,就請各位讀者跟著小編一起讀下去囉!
首先,過去的機器翻譯系統採用循環神經網路模型處理翻譯訊息,而該模型處理訊息的機制是依照順序處理每個單字,並且將先前單字處理好的結果帶入下一個單字的分析預測中。
舉個例子來說,小明重訓時習慣分成胸 – 三頭、背 – 二頭、腿三組循環,但是重訓的時間極不固定,如果公司上班忙碌,需要加班,可能間隔好幾天才重訓;而比較不忙碌的時候,則會天天跑去重訓。
RNN 透過逐筆運算,分析發現小明的運動規律和前一次訓練的部位有關,如果前一次練背 – 二頭、下一次就會練腿,再下一次就會練胸 – 三頭,進而預測小明每天訓練的部位。如果小明今天沒去重訓呢?循環神經網路會使用小明前一次重訓的紀錄(可能是昨天或好幾天前),帶入明天的預測分析中。
到這裡我們可以發現 RNN 會依序分析資料後,形成一個資料網路,分析每筆資料間的關聯,並作出預測,但這同時也代表在長句處理時 RNN 需要的步驟較為繁複,訓練起來較費時。
相較之下,Transformer 則是利用自我注意機制(self-attention mechanism),判斷句子中的哪些單詞需要較多的運算資源,並進行處理,就像人類譯者並不是拿到文章就一路埋頭苦翻到底,而是邊分析文章中的字句,邊決定接下來如何翻譯。
文章中所舉的例子為:I arrived at the bank after crossing the river.
傳統的RNN運算模型需要逐字分析完「bank」、「river」等字後才能理出其中的關連,判斷bank指的是河堤,而非銀行。若句子拉長,兩個彼此有關聯的單詞距離較遠時,這樣的運算方式就會較耗時。
Transformer模型則是透過經驗,建立句子中所有單詞之間的關聯(與單詞相對距離無關),並判斷哪些單詞需要較多的關注,以同句子為例,Transformer模型能判斷「I」、「bank」、「river」中,「bank」有多種解釋可能,「I」和「river」則相對較無歧異。接著,為了處理歧異性較高的「bank」,Transformer 模型會去找出和「bank」關聯性較高的單字,從而找出「river」和其高度關聯,判斷「bank」的意思為河堤。
不過,在一開始對於句子裡的所有單字進行判斷時,Transformer模型需要無條件將同樣的運算量用在每個單詞,因此 Google 新發表了 Universal Transformer 模型,讓系統可以只在歧異性較高的單詞上花費較多的運算資源,使得分析過程變得更「動態」,資源分配也更有效率。
Transformer推出時,Google 研究指出其翻譯品質較先前的機器學習模型提高2.0 個 BLEU(Bilingual Evaluation Understudy)值,而在相同的訓練方式和訓練資料下,Universal Transformer 模型比起 Transformer 又提高了 0.9 個BLEU 值,整體翻譯品質和去年相比,相對提升 50%。
Universal Transformer模型提供大規模語言處理(如機器翻譯)一個更快、更準確的解決方案,翻譯結果更接近真人翻譯,而 Google 團隊也會持續努力提升Universal Transformer 模型效能。
原文連結
註:本文為 2018 9 14 日師大翻譯所臉書粉絲專頁貼文
想知道更多有趣的翻譯書,或想透過書本更深入了解翻譯生活嗎? 喜歡閱讀、熱愛翻譯的你,千萬不能錯過我們的好書分享與深度介紹!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
「要做翻譯就坐下來翻譯啊,何必跑到學校學呢?」 「都已經是譯者了,還有必要上課進修嗎?」 如果你也有過類似的疑問,不妨看看新加坡政府即將為該國翻譯產業祭出的新計畫吧! . 你也想提升自己的翻譯能力嗎?快來報名台師大口筆譯推廣班!(最新資訊請鎖定師大翻譯所臉書粉絲專頁)
「要做翻譯就坐下來翻譯啊,何必跑到學校學呢?」 「都已經是譯者了,還有必要上課進修嗎?」 如果你也有過類似的疑問,不妨看看新加坡政府即將為該國翻譯產業祭出的新計畫吧! . 你也想提升自己的翻譯能力嗎?快來報名台師大口筆譯推廣班!(最新資訊請鎖定師大翻譯所臉書粉絲專頁)
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。 感知器流程 輸入 資料的輸入: 輸入層接受資料的輸入,每個輸入對應一個特徵,還有一個固定的偏差神經元。 資料經過每個神經元時,會乘上相應的
機器學習是什麼? 簡單來說,機器學習就是訓練機器尋找Function的一段過程,而這個Function可以幫助我們解決我們遇到的問題,或是幫助我們
Thumbnail
本文會利用sklearn引入breast_cancer datasets來訓練,在處理數據的部份,特徵工程用兩種方式去做處理,分別是特徵選取與特徵萃取的方式去做比較。 特徵選取的方法中,使用了KNN 分類器來選出最重要的兩個特徵 特徵萃取的方法中,使用了PCA降維
Thumbnail
前言 上一篇討論到如何訓練出模型,此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識 連結 程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料,用網頁展現成果_模型訓練篇 如何連動github與stramlit可以參考
Thumbnail
streamlit與github連動程式庫,呈現即時預測手寫英文字母 整理了一下,先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型,使用的模型是CNN(Convolutional Neural Network,CNN)模型 訓練好的模型,當然是要拿來應用,成果呈現
Thumbnail
兼回答觀眾來信問題 經過上一次的文章之後,棒棒的觀眾們依然有問題丟過來 有些觀眾的問題都滿認真的,也不好像其他節目一樣 在節目上講講就沒了,所以依然用文章的方式帶給大家一點東西。 我們先來看看觀眾疑問: 1. 是不是機器人預測的結果,都是依照revenue? 特徵是什麼? 特徵提取又是什麼?
Thumbnail
我之所以大膽的把股價預測稱之為「最強」,因為這本身就是一個可以變現的專案,並且可以同時累積數據分析及投資操作經驗,在投資與程式設計同時躍升為顯學的時代,把這兩條學習路徑融合在一起,似乎自然而然,也合情合理。當然,這條路的學習成本非常高,但翻山越嶺之後的美景也同樣讓人心神嚮往。
Thumbnail
大數據和機器學習正掀起一波“數位革命”,巨量的資料正掀起人類生活、工作和思考方式的全面革新。 以股票市場來說, 許多國家允許投資者自行探索自由市場的相關數據。例如,數百萬種金融商品的即時價格、電子商務在某個時間的交易的客戶數量或者用衛星探測某個國家農業的總產量等等。
Thumbnail
武漢肺炎席捲全球,不管是電視、網路、各種社群媒體,跳出來的第一個資訊都是相關的疫情報導,面對如此大量且龐雜的訊息,如何保有個人的獨立判斷能力,不因此恐慌焦慮最非常重要的議題。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
感知器是一種基本的神經網路模型,用於二分類問題。它模擬了人腦神經元的工作原理,通過調整權重和偏差值來達到預測和分類的目的。 感知器流程 輸入 資料的輸入: 輸入層接受資料的輸入,每個輸入對應一個特徵,還有一個固定的偏差神經元。 資料經過每個神經元時,會乘上相應的
機器學習是什麼? 簡單來說,機器學習就是訓練機器尋找Function的一段過程,而這個Function可以幫助我們解決我們遇到的問題,或是幫助我們
Thumbnail
本文會利用sklearn引入breast_cancer datasets來訓練,在處理數據的部份,特徵工程用兩種方式去做處理,分別是特徵選取與特徵萃取的方式去做比較。 特徵選取的方法中,使用了KNN 分類器來選出最重要的兩個特徵 特徵萃取的方法中,使用了PCA降維
Thumbnail
前言 上一篇討論到如何訓練出模型,此篇將說明Streamlit建立的簡單Web應用程式的解說 Streamlit網頁App_貓狗辨識 連結 程式碼Github連結 [機器學習]CNN學習MNIST 手寫英文字母資料,用網頁展現成果_模型訓練篇 如何連動github與stramlit可以參考
Thumbnail
streamlit與github連動程式庫,呈現即時預測手寫英文字母 整理了一下,先前學的機器學習利用Colab來訓練出能辨識手寫A~Z英文字母的模型,使用的模型是CNN(Convolutional Neural Network,CNN)模型 訓練好的模型,當然是要拿來應用,成果呈現
Thumbnail
兼回答觀眾來信問題 經過上一次的文章之後,棒棒的觀眾們依然有問題丟過來 有些觀眾的問題都滿認真的,也不好像其他節目一樣 在節目上講講就沒了,所以依然用文章的方式帶給大家一點東西。 我們先來看看觀眾疑問: 1. 是不是機器人預測的結果,都是依照revenue? 特徵是什麼? 特徵提取又是什麼?
Thumbnail
我之所以大膽的把股價預測稱之為「最強」,因為這本身就是一個可以變現的專案,並且可以同時累積數據分析及投資操作經驗,在投資與程式設計同時躍升為顯學的時代,把這兩條學習路徑融合在一起,似乎自然而然,也合情合理。當然,這條路的學習成本非常高,但翻山越嶺之後的美景也同樣讓人心神嚮往。
Thumbnail
大數據和機器學習正掀起一波“數位革命”,巨量的資料正掀起人類生活、工作和思考方式的全面革新。 以股票市場來說, 許多國家允許投資者自行探索自由市場的相關數據。例如,數百萬種金融商品的即時價格、電子商務在某個時間的交易的客戶數量或者用衛星探測某個國家農業的總產量等等。
Thumbnail
武漢肺炎席捲全球,不管是電視、網路、各種社群媒體,跳出來的第一個資訊都是相關的疫情報導,面對如此大量且龐雜的訊息,如何保有個人的獨立判斷能力,不因此恐慌焦慮最非常重要的議題。