語言學家如何看待「翻譯將被人工智慧取代」這件事?(上篇)

更新於 發佈於 閱讀時間約 5 分鐘
我去俄羅斯旅行的時候,很少遇到能完全用英文溝通的俄羅斯人。我和旅伴幾乎是靠谷歌翻譯加眉目傳情完成戰鬥民族之旅。以前大多數人認為谷歌翻譯不堪用,現在它已經明顯進化。那之前到底是怎麼了?現在又出現什麼變化,讓谷歌突飛猛進呢?
一般人可能不清楚,要做翻譯科技絕對少不了語言學。教人工智慧學習人類的語言,也需要語言學家先將語言分解並建立重組的規則,才有可能讓「機器」模擬「人類的語言」。
清大語言學研究所的蔡維天教授在輔大跨文所舉辦的科技部學術研習營暨語言科技與醫療翻譯工作坊主講《語言學與人工智慧》,就是在討論這個議題。內容非常精實,身為翻譯工作者,我受到很多啟發。

在進入正題之前,必須先了解語言學

語言學是一門很跨領域的學問,和社會學混搭就是社會語言學,和認知心理學混搭就是心理語言學。基本上每個領域都會和語言學有關聯,因為每個領域都必須用語言去討論,才能成就一門學問。
聽起來很博大精深難以理解,但其實語言學一直都在生活當中應用。譬如學習外語,就是一個很好的例子。
我們天天在用的中文甚至台語,根本不會去思考什麼動詞名詞代詞。今天如果你學英文的時候,碰到不懂動詞名詞代詞的老師,我想你會很痛苦。語言學家就是把這些現在看起來理所當然的詞彙分類,然後找到重建句子規則的人。(我這麼說,語言學家會可能想掐死我,不過這麼說應該會比較好懂。)
就我的理解來說,語言學就是幫助人類了解母語和其他語言的學問,所以其實不用想得太複雜。

我們為什麼會說母語?

蔡教授的演講一開始就提到我最近很感興趣的話題──人為什麼會有語言能力?從語言生物觀的角度來說,語言是人類的本能,基因當中本來就自帶一個語言包。全世界的人類語言都有共通之處,就是因為我們有「普遍語法」。而普遍語法就是指兒童發展語言的初始狀態。
普遍語法就像一顆種籽,當孩子漸漸成長,外在的經驗會不斷澆灌,讓語言長成一棵大樹。我經常看的科普頻道曾經提到過「狼孩」這個主題。從小就被狼抓去養的孩子,一旦超過某個年齡,就再也無法學會語言。他們頂多只能了解單詞,但無法了解詞和詞之間的連結。也就是說,雖然我們一出生就自帶語言包,但是缺乏外在經驗澆灌,仍然無法習得語言。

人工智慧學習人類語言的難處

從前面的內容可以了解,人類的語言生成需要一個基因中的語言包和外在經驗。在語言學上,基於這一點把語言分成兩個層面:
  • 內延語言:基於普遍語法而來的內在語言知識或語言官能。
  • 外延語言:約定俗成的外在語言行為與形式。
機器要學習語言勢必要「以人為師」。機器在明確的規範下能累積經驗、解決問題,可以長時間做大量運算不會疲勞,更加不會受到情緒的影響。這也是為什麼世界棋王會輸給電腦的原因。不過,機器雖然擅長累積經驗,卻難以抒發情感、創作文學作品。我想這就是因為機器本身缺少了那個人類基因裡自帶的語言包(內延語言),只能靠累積經驗來模擬人類的語言(外延語言)。

人工智慧怎麼學習人類的語言?

那麼人工智慧要如何透過大量的外在經驗模擬人類語言呢?針對這一點,蔡教授提到自然語言處理(natural language processing,簡稱NLP),這是人工智慧的一部分,也是人類和機器溝通的管道。
中研院的馬偉雲研究員在《研之有物》提到,要讓電腦學習語言,第一步是教會機器斷詞、理解詞;第二步則是分析句子,包含語法及語義的自動解析。這項工作需要結合語言學家和資訊處理專家能各領域的人才。而且語言學家在這裡扮演了非常關鍵的角色,因為語言學家就是在分析語言的結構邏輯,分析出來之後才能讓機器學習。
那我們要如何得知,機器模擬的語言自不自然呢?有一種方法叫做圖靈測試。
圖靈測試示意圖(圖片來自https://science.jrank.org/programming/Turing_Test.html)
這個圖靈測試簡單來說就是讓人在不知情的狀況下分別和電腦、人類聊天,測試人會不會發現自己聊天的對象是電腦。不過目前除了假新聞之外,我還沒看到有機器人通過圖靈測試就是了。撇除語言成分,倒是有外觀和人類相近到難以辨別真偽的機器人。(有興趣的朋友可以參考日本人造美少女的影片,真的滿像的,而且還是2018年的新聞。)

AI版的小譯者

人工智慧到底能不能學會人類的語言?

既然沒有機器人通過圖靈測試,是不是就表示機器無法學會語言呢?這個問題沒有答案,不過蔡老師提出他語言學家的觀點。機器可以用外在經驗模擬外延語言,但內延語言可是說是人類演化的結晶,機器是否真的能學會還是一個問題。而且,人工智慧終究只是在「模擬」語言,並不是真的「了解」語言,這一點和人類對「學會」的定義就不太相同了。
讀到這裡大家可能覺得沒什麼結論,這很正常,因為一切都是進行式,我們永遠無法準確預測未來。而且,談到這裡還沒超過蔡教授簡報的一半呢!對語言學和人工智能有概念之後,下一集我會繼續分享蔡教授怎麼談語言學在人工智慧領域的應用、對翻譯工作的影響以及我個人的看法。
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
17.3K會員
133內容數
成為自由譯者之後會怎麼樣? ──就等著下地獄啊!(笑歪) 我想在這裡和大家分享我趕稿和趕稿之外的日常, 尋找同溫層一起取暖,好嗎?
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
小譯者的日常 的其他內容
咳咳,在武漢肺炎肆虐的這個摩門,大家好嗎?外景的故事終於要寫最後一集了。(最近因為疫情的關係,大家對咳嗽聲很敏感。偏偏我又是很容易被自己口水嗆到的人,經常嚇到路人,真是抱歉。)當初寫這個工作日誌的時候就在想,最後一集一定要等到看完外景的成品再來寫。所以,這一等就等到了月底。
今天要從東港接關台東成功,瓜哥預計至少要三個小時才能抵達。所以我們最好早早拍完收工,早早移動到台東。東港要抓緊時間拍,工作人員很早就在飯店大廳集合。 我們一早就來到金碧輝煌的東隆宮,天氣非常好,藍天白雲把金色的牌樓襯得更閃閃發亮。
景點都拍完之後,接下來就是要拍美食了。要採訪的店家都已經安排好菜色,我們人一到幾乎就可以馬上上菜。不過導演說要拍炒菜的過程,所以從拍店家外觀、炒菜過程、單品特寫、桌菜特寫一路拍完,最後才輪到我吃
咳咳,節目要開拍了。 大家趕快準備零食和飲料,坐好準備看我出糗精湛的演技了。 機場看板的記者會 開始拍攝的前一天,我才在機場見到所有工作人員。傍晚五點多,口罩大軍來來去去的機場大廳,因為疫情的關係看板上顯示許多班機取消。日方的工作人員比原定計畫還早抵達,但海關那裡似乎因為窗口少而堵住了。
就在我外出工作的這段期間,粉絲團默默增加了數名粉絲,熱烈歡迎各位參與我樸實無華的懶散日常。 前一陣子在譯者的群組上,有人提到「譯者除了口筆譯之外還有什麼其他的工作類型」這個非常正經的話題。因為太正經了,導致我不敢隨便亂回。
上一篇發文前,我也把內容傳給綿羊老師看。聊著聊著,我說悔恨當天拍照很糊,老師馬上問我哪一張並傳了截圖給我。於是就有一張高清原圖和一張模糊變形的圖。為何不兩張都原圖?高清原圖是要證明老師拍照功力很強,模糊的圖是證明我很認真聽講啊!(笑) 閒話聊完,要進入今天的主題了。第四場講者是銳譯翻譯的翁雅如小姐。
咳咳,在武漢肺炎肆虐的這個摩門,大家好嗎?外景的故事終於要寫最後一集了。(最近因為疫情的關係,大家對咳嗽聲很敏感。偏偏我又是很容易被自己口水嗆到的人,經常嚇到路人,真是抱歉。)當初寫這個工作日誌的時候就在想,最後一集一定要等到看完外景的成品再來寫。所以,這一等就等到了月底。
今天要從東港接關台東成功,瓜哥預計至少要三個小時才能抵達。所以我們最好早早拍完收工,早早移動到台東。東港要抓緊時間拍,工作人員很早就在飯店大廳集合。 我們一早就來到金碧輝煌的東隆宮,天氣非常好,藍天白雲把金色的牌樓襯得更閃閃發亮。
景點都拍完之後,接下來就是要拍美食了。要採訪的店家都已經安排好菜色,我們人一到幾乎就可以馬上上菜。不過導演說要拍炒菜的過程,所以從拍店家外觀、炒菜過程、單品特寫、桌菜特寫一路拍完,最後才輪到我吃
咳咳,節目要開拍了。 大家趕快準備零食和飲料,坐好準備看我出糗精湛的演技了。 機場看板的記者會 開始拍攝的前一天,我才在機場見到所有工作人員。傍晚五點多,口罩大軍來來去去的機場大廳,因為疫情的關係看板上顯示許多班機取消。日方的工作人員比原定計畫還早抵達,但海關那裡似乎因為窗口少而堵住了。
就在我外出工作的這段期間,粉絲團默默增加了數名粉絲,熱烈歡迎各位參與我樸實無華的懶散日常。 前一陣子在譯者的群組上,有人提到「譯者除了口筆譯之外還有什麼其他的工作類型」這個非常正經的話題。因為太正經了,導致我不敢隨便亂回。
上一篇發文前,我也把內容傳給綿羊老師看。聊著聊著,我說悔恨當天拍照很糊,老師馬上問我哪一張並傳了截圖給我。於是就有一張高清原圖和一張模糊變形的圖。為何不兩張都原圖?高清原圖是要證明老師拍照功力很強,模糊的圖是證明我很認真聽講啊!(笑) 閒話聊完,要進入今天的主題了。第四場講者是銳譯翻譯的翁雅如小姐。
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
為什麼本書主張語言是否為人類的本能呢?作者一步步提出精彩的案例與論述,並探討語言的演化與發展。語言的能力對於人類,是非常重大的演化突破,也因此才有現今的文明,讓我們來了解史帝芬˙平克這本語言學的經典著作吧!
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
AI對語言學習的衝擊 自從ChapGPT橫空出世,大家開始真正感受到AI真的來了,最起碼它在語言這塊已經可以做到接近完美的程度,很多人甚至開始懷疑到底我們還需要學習英文嗎?畢竟現在人手一機,再加上AI的應用,基本就是帶了一個會行走的翻譯機,以後出國再也不用擔心語言的問題,是不是翻譯已經變成是一項可
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
Thumbnail
生活中的溝通和誤會是人與人之間相互學習的過程,人工智慧在學習我們的智慧時,我們需要思考人類與人工智慧之間的關係。
Thumbnail
這篇文章討論了自然語言處理技術的發展歷程,從語言模型的引入到深度學習的應用。作者觀察到現今GPT在產出中文國學內容時的深度不足,並提出了自然語言處理領域的倫理使用和版權問題,以及對大眾的影響。最後,作者探討了個人在自然語言領域的發展可能性。
在人工智能的發展歷程中,早期的研究主要側重於將解決問題的規則輸入計算機,試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而,這條路逐漸變得艱難,因為規則過於繁多,無法應對複雜的情境和語境。在這個背景下,一些科學家轉向了神經網絡算法,試圖模擬人腦的感知能力。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。
Thumbnail
對於熱衷於語言科技的你, 大語言模型(LLMs)在自然語言處理(NLP)領域的發展無疑是一個革命性的進展。 從傳統的規則系統到基於深度學習的方法, LLMs展現了在理解、生成和翻譯人類語言方面的巨大突破。 這不僅是技術上的飛躍, 更是開啟了新的應用和可能性。 下面將介紹這一變革帶來的三大
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
為什麼本書主張語言是否為人類的本能呢?作者一步步提出精彩的案例與論述,並探討語言的演化與發展。語言的能力對於人類,是非常重大的演化突破,也因此才有現今的文明,讓我們來了解史帝芬˙平克這本語言學的經典著作吧!
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
AI對語言學習的衝擊 自從ChapGPT橫空出世,大家開始真正感受到AI真的來了,最起碼它在語言這塊已經可以做到接近完美的程度,很多人甚至開始懷疑到底我們還需要學習英文嗎?畢竟現在人手一機,再加上AI的應用,基本就是帶了一個會行走的翻譯機,以後出國再也不用擔心語言的問題,是不是翻譯已經變成是一項可
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
Thumbnail
生活中的溝通和誤會是人與人之間相互學習的過程,人工智慧在學習我們的智慧時,我們需要思考人類與人工智慧之間的關係。
Thumbnail
這篇文章討論了自然語言處理技術的發展歷程,從語言模型的引入到深度學習的應用。作者觀察到現今GPT在產出中文國學內容時的深度不足,並提出了自然語言處理領域的倫理使用和版權問題,以及對大眾的影響。最後,作者探討了個人在自然語言領域的發展可能性。
在人工智能的發展歷程中,早期的研究主要側重於將解決問題的規則輸入計算機,試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而,這條路逐漸變得艱難,因為規則過於繁多,無法應對複雜的情境和語境。在這個背景下,一些科學家轉向了神經網絡算法,試圖模擬人腦的感知能力。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。
Thumbnail
對於熱衷於語言科技的你, 大語言模型(LLMs)在自然語言處理(NLP)領域的發展無疑是一個革命性的進展。 從傳統的規則系統到基於深度學習的方法, LLMs展現了在理解、生成和翻譯人類語言方面的巨大突破。 這不僅是技術上的飛躍, 更是開啟了新的應用和可能性。 下面將介紹這一變革帶來的三大