語言學家如何看待「翻譯將被人工智慧取代」這件事?(上篇)

更新於 2020/07/14閱讀時間約 5 分鐘
我去俄羅斯旅行的時候,很少遇到能完全用英文溝通的俄羅斯人。我和旅伴幾乎是靠谷歌翻譯加眉目傳情完成戰鬥民族之旅。以前大多數人認為谷歌翻譯不堪用,現在它已經明顯進化。那之前到底是怎麼了?現在又出現什麼變化,讓谷歌突飛猛進呢?
一般人可能不清楚,要做翻譯科技絕對少不了語言學。教人工智慧學習人類的語言,也需要語言學家先將語言分解並建立重組的規則,才有可能讓「機器」模擬「人類的語言」。
清大語言學研究所的蔡維天教授在輔大跨文所舉辦的科技部學術研習營暨語言科技與醫療翻譯工作坊主講《語言學與人工智慧》,就是在討論這個議題。內容非常精實,身為翻譯工作者,我受到很多啟發。

在進入正題之前,必須先了解語言學

語言學是一門很跨領域的學問,和社會學混搭就是社會語言學,和認知心理學混搭就是心理語言學。基本上每個領域都會和語言學有關聯,因為每個領域都必須用語言去討論,才能成就一門學問。
聽起來很博大精深難以理解,但其實語言學一直都在生活當中應用。譬如學習外語,就是一個很好的例子。
我們天天在用的中文甚至台語,根本不會去思考什麼動詞名詞代詞。今天如果你學英文的時候,碰到不懂動詞名詞代詞的老師,我想你會很痛苦。語言學家就是把這些現在看起來理所當然的詞彙分類,然後找到重建句子規則的人。(我這麼說,語言學家會可能想掐死我,不過這麼說應該會比較好懂。)
就我的理解來說,語言學就是幫助人類了解母語和其他語言的學問,所以其實不用想得太複雜。

我們為什麼會說母語?

蔡教授的演講一開始就提到我最近很感興趣的話題──人為什麼會有語言能力?從語言生物觀的角度來說,語言是人類的本能,基因當中本來就自帶一個語言包。全世界的人類語言都有共通之處,就是因為我們有「普遍語法」。而普遍語法就是指兒童發展語言的初始狀態。
普遍語法就像一顆種籽,當孩子漸漸成長,外在的經驗會不斷澆灌,讓語言長成一棵大樹。我經常看的科普頻道曾經提到過「狼孩」這個主題。從小就被狼抓去養的孩子,一旦超過某個年齡,就再也無法學會語言。他們頂多只能了解單詞,但無法了解詞和詞之間的連結。也就是說,雖然我們一出生就自帶語言包,但是缺乏外在經驗澆灌,仍然無法習得語言。

人工智慧學習人類語言的難處

從前面的內容可以了解,人類的語言生成需要一個基因中的語言包和外在經驗。在語言學上,基於這一點把語言分成兩個層面:
  • 內延語言:基於普遍語法而來的內在語言知識或語言官能。
  • 外延語言:約定俗成的外在語言行為與形式。
機器要學習語言勢必要「以人為師」。機器在明確的規範下能累積經驗、解決問題,可以長時間做大量運算不會疲勞,更加不會受到情緒的影響。這也是為什麼世界棋王會輸給電腦的原因。不過,機器雖然擅長累積經驗,卻難以抒發情感、創作文學作品。我想這就是因為機器本身缺少了那個人類基因裡自帶的語言包(內延語言),只能靠累積經驗來模擬人類的語言(外延語言)。

人工智慧怎麼學習人類的語言?

那麼人工智慧要如何透過大量的外在經驗模擬人類語言呢?針對這一點,蔡教授提到自然語言處理(natural language processing,簡稱NLP),這是人工智慧的一部分,也是人類和機器溝通的管道。
中研院的馬偉雲研究員在《研之有物》提到,要讓電腦學習語言,第一步是教會機器斷詞、理解詞;第二步則是分析句子,包含語法及語義的自動解析。這項工作需要結合語言學家和資訊處理專家能各領域的人才。而且語言學家在這裡扮演了非常關鍵的角色,因為語言學家就是在分析語言的結構邏輯,分析出來之後才能讓機器學習。
那我們要如何得知,機器模擬的語言自不自然呢?有一種方法叫做圖靈測試。
圖靈測試示意圖(圖片來自https://science.jrank.org/programming/Turing_Test.html)
這個圖靈測試簡單來說就是讓人在不知情的狀況下分別和電腦、人類聊天,測試人會不會發現自己聊天的對象是電腦。不過目前除了假新聞之外,我還沒看到有機器人通過圖靈測試就是了。撇除語言成分,倒是有外觀和人類相近到難以辨別真偽的機器人。(有興趣的朋友可以參考日本人造美少女的影片,真的滿像的,而且還是2018年的新聞。)

AI版的小譯者

人工智慧到底能不能學會人類的語言?

既然沒有機器人通過圖靈測試,是不是就表示機器無法學會語言呢?這個問題沒有答案,不過蔡老師提出他語言學家的觀點。機器可以用外在經驗模擬外延語言,但內延語言可是說是人類演化的結晶,機器是否真的能學會還是一個問題。而且,人工智慧終究只是在「模擬」語言,並不是真的「了解」語言,這一點和人類對「學會」的定義就不太相同了。
讀到這裡大家可能覺得沒什麼結論,這很正常,因為一切都是進行式,我們永遠無法準確預測未來。而且,談到這裡還沒超過蔡教授簡報的一半呢!對語言學和人工智能有概念之後,下一集我會繼續分享蔡教授怎麼談語言學在人工智慧領域的應用、對翻譯工作的影響以及我個人的看法。
為什麼會看到廣告
avatar-img
16.7K會員
133內容數
成為自由譯者之後會怎麼樣? ──就等著下地獄啊!(笑歪) 我想在這裡和大家分享我趕稿和趕稿之外的日常, 尋找同溫層一起取暖,好嗎?
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
小譯者的日常 的其他內容
咳咳,在武漢肺炎肆虐的這個摩門,大家好嗎?外景的故事終於要寫最後一集了。(最近因為疫情的關係,大家對咳嗽聲很敏感。偏偏我又是很容易被自己口水嗆到的人,經常嚇到路人,真是抱歉。)當初寫這個工作日誌的時候就在想,最後一集一定要等到看完外景的成品再來寫。所以,這一等就等到了月底。
今天要從東港接關台東成功,瓜哥預計至少要三個小時才能抵達。所以我們最好早早拍完收工,早早移動到台東。東港要抓緊時間拍,工作人員很早就在飯店大廳集合。 我們一早就來到金碧輝煌的東隆宮,天氣非常好,藍天白雲把金色的牌樓襯得更閃閃發亮。
景點都拍完之後,接下來就是要拍美食了。要採訪的店家都已經安排好菜色,我們人一到幾乎就可以馬上上菜。不過導演說要拍炒菜的過程,所以從拍店家外觀、炒菜過程、單品特寫、桌菜特寫一路拍完,最後才輪到我吃
咳咳,節目要開拍了。 大家趕快準備零食和飲料,坐好準備看我出糗精湛的演技了。 機場看板的記者會 開始拍攝的前一天,我才在機場見到所有工作人員。傍晚五點多,口罩大軍來來去去的機場大廳,因為疫情的關係看板上顯示許多班機取消。日方的工作人員比原定計畫還早抵達,但海關那裡似乎因為窗口少而堵住了。
就在我外出工作的這段期間,粉絲團默默增加了數名粉絲,熱烈歡迎各位參與我樸實無華的懶散日常。 前一陣子在譯者的群組上,有人提到「譯者除了口筆譯之外還有什麼其他的工作類型」這個非常正經的話題。因為太正經了,導致我不敢隨便亂回。
上一篇發文前,我也把內容傳給綿羊老師看。聊著聊著,我說悔恨當天拍照很糊,老師馬上問我哪一張並傳了截圖給我。於是就有一張高清原圖和一張模糊變形的圖。為何不兩張都原圖?高清原圖是要證明老師拍照功力很強,模糊的圖是證明我很認真聽講啊!(笑) 閒話聊完,要進入今天的主題了。第四場講者是銳譯翻譯的翁雅如小姐。
咳咳,在武漢肺炎肆虐的這個摩門,大家好嗎?外景的故事終於要寫最後一集了。(最近因為疫情的關係,大家對咳嗽聲很敏感。偏偏我又是很容易被自己口水嗆到的人,經常嚇到路人,真是抱歉。)當初寫這個工作日誌的時候就在想,最後一集一定要等到看完外景的成品再來寫。所以,這一等就等到了月底。
今天要從東港接關台東成功,瓜哥預計至少要三個小時才能抵達。所以我們最好早早拍完收工,早早移動到台東。東港要抓緊時間拍,工作人員很早就在飯店大廳集合。 我們一早就來到金碧輝煌的東隆宮,天氣非常好,藍天白雲把金色的牌樓襯得更閃閃發亮。
景點都拍完之後,接下來就是要拍美食了。要採訪的店家都已經安排好菜色,我們人一到幾乎就可以馬上上菜。不過導演說要拍炒菜的過程,所以從拍店家外觀、炒菜過程、單品特寫、桌菜特寫一路拍完,最後才輪到我吃
咳咳,節目要開拍了。 大家趕快準備零食和飲料,坐好準備看我出糗精湛的演技了。 機場看板的記者會 開始拍攝的前一天,我才在機場見到所有工作人員。傍晚五點多,口罩大軍來來去去的機場大廳,因為疫情的關係看板上顯示許多班機取消。日方的工作人員比原定計畫還早抵達,但海關那裡似乎因為窗口少而堵住了。
就在我外出工作的這段期間,粉絲團默默增加了數名粉絲,熱烈歡迎各位參與我樸實無華的懶散日常。 前一陣子在譯者的群組上,有人提到「譯者除了口筆譯之外還有什麼其他的工作類型」這個非常正經的話題。因為太正經了,導致我不敢隨便亂回。
上一篇發文前,我也把內容傳給綿羊老師看。聊著聊著,我說悔恨當天拍照很糊,老師馬上問我哪一張並傳了截圖給我。於是就有一張高清原圖和一張模糊變形的圖。為何不兩張都原圖?高清原圖是要證明老師拍照功力很強,模糊的圖是證明我很認真聽講啊!(笑) 閒話聊完,要進入今天的主題了。第四場講者是銳譯翻譯的翁雅如小姐。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
要走入雙語社會,最有力的保證是先好好 “重視” 自己的母語,也好好 “珍惜” 自己生活的社會所普遍在應用的語言。 在本地說話型態所應用的語言, 至少也有十種上下,每一種都值得持續被好好傳承下去。不過,我認為最不能隨意被矇混的語言,是台灣社會通用的 「國語」。 事實上,學好國語並不需要需要
Thumbnail
閱讀打開眼界,這本書對我而言便是如此。 作者丹尼爾.艾弗列特是一位美國語言學家,他一開始進入皮拉哈部落是為了傳教佈道,翻譯《聖經》,試圖改變皮拉哈人的信仰文化,而最後改變的卻是他自己的信仰。 本書的前半部分,便是敘寫他於皮拉哈部落的生活,後半部分則寫皮拉哈語對於語言學有何影響。 皮拉哈人的價值
Thumbnail
我們對富豪的認識少之又少。他們怎麼看待自己,看待別人,看待倫敦?他們錢打哪來?又是怎麼花錢? 身為倫敦大學金匠學院社會學者的作者卡若琳.諾斯用「腳」探究了這些問題。 她走入倫敦街道四處踏查,並匿名訪談富人、富人家屬,以及為這群人效命的服侍者階層等數十名人士, 藉此揭開倫敦富豪生活的簾幕。
Thumbnail
艾倫人工智慧研究所很高興地宣布,我們正在著手創建一個開放的、最先進的生成語言模型:AI2 OLMo(Open Language Model)。 OLMo 的規模將與其他最先進的大型語言模型相媲美,參數達到70 億個,預計在2024 年初推出。
★「你的肢體語言,是決定一切成敗的最後關鍵。」 ●展現最佳狀態,指的是「了解並能夠自在地表達自己真實想法、感受、價值觀與潛力的一種狀態」 就是這樣。它不是一種恆久、超驗的存在 模式。它會來來去去,是每個不同片刻組成的現象。當我們感到自己很有力量,最佳狀態就會出現,那讓我們真實了解到最真摯的自我。在這
Thumbnail
你會說台語嗎?先自首,身為打狗子弟的我會說,但稱不上「輪轉」。今天想介紹《語言學家解破台語》這本小巧的台語文法書。別被「文法」兩個字嚇著了,不管你會不會說台語,作者有趣又有料的解說絕對會讓你腦洞大開!
Thumbnail
每當遇到像是轉折的行情,當天大漲或大跌時候,總會有人出來『預測』一下。 『逃命波』、『死貓跳』、『會套在山頂』等等字眼,看久了來來去去就那樣。 喊的人有的是基於好心,擔心有人受傷慘重,遭逢不可逆的損失。 另外有的人,好像是想要表現自己的能力,如果結果與他預測的一樣,是一種肯定,也許還會受人崇拜。
Thumbnail
在上一集的[親子閱讀專家推薦你的零歲寶寶書單:前言觀念篇]裡,提到如果希望藉由親子共讀,幫助寶寶的語言學習能力,一定要選擇文字內容重複又有節奏的書! 市面上到底有哪些書是屬於這個類型的呢?語嫣今天就來簡單跟大家分享我家書櫃的收藏!
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
要走入雙語社會,最有力的保證是先好好 “重視” 自己的母語,也好好 “珍惜” 自己生活的社會所普遍在應用的語言。 在本地說話型態所應用的語言, 至少也有十種上下,每一種都值得持續被好好傳承下去。不過,我認為最不能隨意被矇混的語言,是台灣社會通用的 「國語」。 事實上,學好國語並不需要需要
Thumbnail
閱讀打開眼界,這本書對我而言便是如此。 作者丹尼爾.艾弗列特是一位美國語言學家,他一開始進入皮拉哈部落是為了傳教佈道,翻譯《聖經》,試圖改變皮拉哈人的信仰文化,而最後改變的卻是他自己的信仰。 本書的前半部分,便是敘寫他於皮拉哈部落的生活,後半部分則寫皮拉哈語對於語言學有何影響。 皮拉哈人的價值
Thumbnail
我們對富豪的認識少之又少。他們怎麼看待自己,看待別人,看待倫敦?他們錢打哪來?又是怎麼花錢? 身為倫敦大學金匠學院社會學者的作者卡若琳.諾斯用「腳」探究了這些問題。 她走入倫敦街道四處踏查,並匿名訪談富人、富人家屬,以及為這群人效命的服侍者階層等數十名人士, 藉此揭開倫敦富豪生活的簾幕。
Thumbnail
艾倫人工智慧研究所很高興地宣布,我們正在著手創建一個開放的、最先進的生成語言模型:AI2 OLMo(Open Language Model)。 OLMo 的規模將與其他最先進的大型語言模型相媲美,參數達到70 億個,預計在2024 年初推出。
★「你的肢體語言,是決定一切成敗的最後關鍵。」 ●展現最佳狀態,指的是「了解並能夠自在地表達自己真實想法、感受、價值觀與潛力的一種狀態」 就是這樣。它不是一種恆久、超驗的存在 模式。它會來來去去,是每個不同片刻組成的現象。當我們感到自己很有力量,最佳狀態就會出現,那讓我們真實了解到最真摯的自我。在這
Thumbnail
你會說台語嗎?先自首,身為打狗子弟的我會說,但稱不上「輪轉」。今天想介紹《語言學家解破台語》這本小巧的台語文法書。別被「文法」兩個字嚇著了,不管你會不會說台語,作者有趣又有料的解說絕對會讓你腦洞大開!
Thumbnail
每當遇到像是轉折的行情,當天大漲或大跌時候,總會有人出來『預測』一下。 『逃命波』、『死貓跳』、『會套在山頂』等等字眼,看久了來來去去就那樣。 喊的人有的是基於好心,擔心有人受傷慘重,遭逢不可逆的損失。 另外有的人,好像是想要表現自己的能力,如果結果與他預測的一樣,是一種肯定,也許還會受人崇拜。
Thumbnail
在上一集的[親子閱讀專家推薦你的零歲寶寶書單:前言觀念篇]裡,提到如果希望藉由親子共讀,幫助寶寶的語言學習能力,一定要選擇文字內容重複又有節奏的書! 市面上到底有哪些書是屬於這個類型的呢?語嫣今天就來簡單跟大家分享我家書櫃的收藏!