語言學家如何看待「翻譯將被人工智慧取代」這件事?(上篇)

更新於 發佈於 閱讀時間約 6 分鐘

我去俄羅斯旅行的時候,很少遇到能完全用英文溝通的俄羅斯人。我和旅伴幾乎是靠谷歌翻譯加眉目傳情完成戰鬥民族之旅。以前大多數人認為谷歌翻譯不堪用,現在它已經明顯進化。那之前到底是怎麼了?現在又出現什麼變化,讓谷歌突飛猛進呢?

一般人可能不清楚,要做翻譯科技絕對少不了語言學。教人工智慧學習人類的語言,也需要語言學家先將語言分解並建立重組的規則,才有可能讓「機器」模擬「人類的語言」。

清大語言學研究所的蔡維天教授在輔大跨文所舉辦的科技部學術研習營暨語言科技與醫療翻譯工作坊主講《語言學與人工智慧》,就是在討論這個議題。內容非常精實,身為翻譯工作者,我受到很多啟發。

raw-image

在進入正題之前,必須先了解語言學

語言學是一門很跨領域的學問,和社會學混搭就是社會語言學,和認知心理學混搭就是心理語言學。基本上每個領域都會和語言學有關聯,因為每個領域都必須用語言去討論,才能成就一門學問。

聽起來很博大精深難以理解,但其實語言學一直都在生活當中應用。譬如學習外語,就是一個很好的例子。

我們天天在用的中文甚至台語,根本不會去思考什麼動詞名詞代詞。今天如果你學英文的時候,碰到不懂動詞名詞代詞的老師,我想你會很痛苦。語言學家就是把這些現在看起來理所當然的詞彙分類,然後找到重建句子規則的人。(我這麼說,語言學家會可能想掐死我,不過這麼說應該會比較好懂。)

就我的理解來說,語言學就是幫助人類了解母語和其他語言的學問,所以其實不用想得太複雜。

我們為什麼會說母語?

蔡教授的演講一開始就提到我最近很感興趣的話題──人為什麼會有語言能力?從語言生物觀的角度來說,語言是人類的本能,基因當中本來就自帶一個語言包。全世界的人類語言都有共通之處,就是因為我們有「普遍語法」。而普遍語法就是指兒童發展語言的初始狀態。

普遍語法就像一顆種籽,當孩子漸漸成長,外在的經驗會不斷澆灌,讓語言長成一棵大樹。我經常看的科普頻道曾經提到過「狼孩」這個主題。從小就被狼抓去養的孩子,一旦超過某個年齡,就再也無法學會語言。他們頂多只能了解單詞,但無法了解詞和詞之間的連結。也就是說,雖然我們一出生就自帶語言包,但是缺乏外在經驗澆灌,仍然無法習得語言。

raw-image

人工智慧學習人類語言的難處

從前面的內容可以了解,人類的語言生成需要一個基因中的語言包和外在經驗。在語言學上,基於這一點把語言分成兩個層面:

  • 內延語言:基於普遍語法而來的內在語言知識或語言官能。
  • 外延語言:約定俗成的外在語言行為與形式。

機器要學習語言勢必要「以人為師」。機器在明確的規範下能累積經驗、解決問題,可以長時間做大量運算不會疲勞,更加不會受到情緒的影響。這也是為什麼世界棋王會輸給電腦的原因。不過,機器雖然擅長累積經驗,卻難以抒發情感、創作文學作品。我想這就是因為機器本身缺少了那個人類基因裡自帶的語言包(內延語言),只能靠累積經驗來模擬人類的語言(外延語言)。

人工智慧怎麼學習人類的語言?

那麼人工智慧要如何透過大量的外在經驗模擬人類語言呢?針對這一點,蔡教授提到自然語言處理(natural language processing,簡稱NLP),這是人工智慧的一部分,也是人類和機器溝通的管道。

中研院的馬偉雲研究員在《研之有物》提到,要讓電腦學習語言,第一步是教會機器斷詞、理解詞;第二步則是分析句子,包含語法及語義的自動解析。這項工作需要結合語言學家和資訊處理專家能各領域的人才。而且語言學家在這裡扮演了非常關鍵的角色,因為語言學家就是在分析語言的結構邏輯,分析出來之後才能讓機器學習。

那我們要如何得知,機器模擬的語言自不自然呢?有一種方法叫做圖靈測試。

raw-image

這個圖靈測試簡單來說就是讓人在不知情的狀況下分別和電腦、人類聊天,測試人會不會發現自己聊天的對象是電腦。不過目前除了假新聞之外,我還沒看到有機器人通過圖靈測試就是了。撇除語言成分,倒是有外觀和人類相近到難以辨別真偽的機器人。(有興趣的朋友可以參考日本人造美少女的影片,真的滿像的,而且還是2018年的新聞。)



raw-image

人工智慧到底能不能學會人類的語言?

既然沒有機器人通過圖靈測試,是不是就表示機器無法學會語言呢?這個問題沒有答案,不過蔡老師提出他語言學家的觀點。機器可以用外在經驗模擬外延語言,但內延語言可是說是人類演化的結晶,機器是否真的能學會還是一個問題。而且,人工智慧終究只是在「模擬」語言,並不是真的「了解」語言,這一點和人類對「學會」的定義就不太相同了。

讀到這裡大家可能覺得沒什麼結論,這很正常,因為一切都是進行式,我們永遠無法準確預測未來。而且,談到這裡還沒超過蔡教授簡報的一半呢!對語言學和人工智能有概念之後,下一集我會繼續分享蔡教授怎麼談語言學在人工智慧領域的應用、對翻譯工作的影響以及我個人的看法。

留言
avatar-img
留言分享你的想法!
avatar-img
小譯者的日常
25.6K會員
148內容數
成為自由譯者之後會怎麼樣? ──就等著下地獄啊!(笑歪) 我想在這裡和大家分享我趕稿和趕稿之外的日常, 尋找同溫層一起取暖,好嗎?
小譯者的日常的其他內容
2023/06/21
我之前說過,去年十月份有一段奇幻旅程,奇幻到可能要分成好幾集才說得完。今天來聊聊奇幻旅程的其中一段──偶然成了全民運選手的故事。 在拿到瑜珈師資之前,我是一個不太規律練習的瑜珈人,而且因為久坐的關係,身上到處都是毛病。開始規律練習瑜珈並且拿到師資證照之後,我彷彿被點開某個穴道,接觸各種不同的運動。
Thumbnail
2023/06/21
我之前說過,去年十月份有一段奇幻旅程,奇幻到可能要分成好幾集才說得完。今天來聊聊奇幻旅程的其中一段──偶然成了全民運選手的故事。 在拿到瑜珈師資之前,我是一個不太規律練習的瑜珈人,而且因為久坐的關係,身上到處都是毛病。開始規律練習瑜珈並且拿到師資證照之後,我彷彿被點開某個穴道,接觸各種不同的運動。
Thumbnail
2023/04/20
信箱裡裡躺著一封信,表示我三十天沒有發文,變成魔法師了。最近一位瘋狂趕稿與教課,一個不小心就忘記發文,沒想到就這樣變成魔法師,嚇得我趕快來把寫好的文章發出去。 去年十月底,我去上自由潛水AIDA2的證照課,考試還有兩項沒過,台灣就迎來東北季風,工作也開始忙了起來。這導致我上完課之後都沒機會練習,
Thumbnail
2023/04/20
信箱裡裡躺著一封信,表示我三十天沒有發文,變成魔法師了。最近一位瘋狂趕稿與教課,一個不小心就忘記發文,沒想到就這樣變成魔法師,嚇得我趕快來把寫好的文章發出去。 去年十月底,我去上自由潛水AIDA2的證照課,考試還有兩項沒過,台灣就迎來東北季風,工作也開始忙了起來。這導致我上完課之後都沒機會練習,
Thumbnail
2022/08/18
花蓮美食推薦#1:伊江滇緬料理 花蓮美食推薦#2:炸彈蔥油餅 花蓮美食推薦#3:芙芮利 花蓮美食推薦#4:蔡記豆花 花蓮美食推薦#5:國聲沾醬雞排 花蓮美食推薦#6:晨饅早午餐
Thumbnail
2022/08/18
花蓮美食推薦#1:伊江滇緬料理 花蓮美食推薦#2:炸彈蔥油餅 花蓮美食推薦#3:芙芮利 花蓮美食推薦#4:蔡記豆花 花蓮美食推薦#5:國聲沾醬雞排 花蓮美食推薦#6:晨饅早午餐
Thumbnail
看更多
你可能也想看
Thumbnail
未來的世界,沒有語言隔閡。那時候,翻譯這個行業已經完全被資訊科技所取代。人們也不再需要實質的張開嘴巴溝通,思考時,腦類的 inner voice利用腦波傳送出去即可,人工智慧會即刻翻譯成聽話者的母語。人跟人之間,已經再也沒有語言的隔閡。 巴別塔,混亂之塔已倒塌。 大學期間,我跟他個別的專業分別是
Thumbnail
未來的世界,沒有語言隔閡。那時候,翻譯這個行業已經完全被資訊科技所取代。人們也不再需要實質的張開嘴巴溝通,思考時,腦類的 inner voice利用腦波傳送出去即可,人工智慧會即刻翻譯成聽話者的母語。人跟人之間,已經再也沒有語言的隔閡。 巴別塔,混亂之塔已倒塌。 大學期間,我跟他個別的專業分別是
Thumbnail
語言和邏輯,包含了一切知識和智慧!?我在格友的文章中回應到: 語言和邏輯已經包含了一切的知識和智慧。 語言是思想的載體,所以學習的基礎至少要有一種語言,通常是母語,要非常的熟,熟到爛,如此才有辦法發展精準和覆雜的邏輯。 在我還沒接觸AI之前,我從沒想過機器可以承載智慧,我也曾經以為,人類之所以
Thumbnail
語言和邏輯,包含了一切知識和智慧!?我在格友的文章中回應到: 語言和邏輯已經包含了一切的知識和智慧。 語言是思想的載體,所以學習的基礎至少要有一種語言,通常是母語,要非常的熟,熟到爛,如此才有辦法發展精準和覆雜的邏輯。 在我還沒接觸AI之前,我從沒想過機器可以承載智慧,我也曾經以為,人類之所以
Thumbnail
近年來,隨著人工智慧的崛起,自動翻譯成為一項受到廣泛關注的技術,這種技術的應用使我們不再需要學習其他國家的語言,因為AI能夠自動翻譯,這也成為許多科技公司努力的目標。然而,就像所有技術一樣,它也具有潛在的風險。
Thumbnail
近年來,隨著人工智慧的崛起,自動翻譯成為一項受到廣泛關注的技術,這種技術的應用使我們不再需要學習其他國家的語言,因為AI能夠自動翻譯,這也成為許多科技公司努力的目標。然而,就像所有技術一樣,它也具有潛在的風險。
Thumbnail
「語言學? 是學很多語言嗎?」「生成式AI來襲,電腦也看得懂人話?」 身為即將進入外文系的新鮮人,除了以後要讀很多文學作品、還有「英文要好、工作難找、總之快逃」之外,在外文系的相關介紹常常看到「語言學」這三個字,但你真的知道它在學什麼嗎?
Thumbnail
「語言學? 是學很多語言嗎?」「生成式AI來襲,電腦也看得懂人話?」 身為即將進入外文系的新鮮人,除了以後要讀很多文學作品、還有「英文要好、工作難找、總之快逃」之外,在外文系的相關介紹常常看到「語言學」這三個字,但你真的知道它在學什麼嗎?
Thumbnail
我寫完上一篇文章之後,深夜突發奇想,乾脆來採訪chatGPT好了。因為我在使用chatGPT的過程中,發現只要問到一些無法制式回答的問題,它就會卡住,就像答不上話的人一樣當機。問到敏感的問題時,它也會像打太極拳的政治官員一樣,含糊其辭顧左右而言他。 看著文字一個一個浮現,就像真的有人在回答這些問題。
Thumbnail
我寫完上一篇文章之後,深夜突發奇想,乾脆來採訪chatGPT好了。因為我在使用chatGPT的過程中,發現只要問到一些無法制式回答的問題,它就會卡住,就像答不上話的人一樣當機。問到敏感的問題時,它也會像打太極拳的政治官員一樣,含糊其辭顧左右而言他。 看著文字一個一個浮現,就像真的有人在回答這些問題。
Thumbnail
我認為還有一個特質特別劃清了人類與機器的界線,這其中參雜了理性與感性,在人類的歷史進程上也經常發生 「明知結果會失敗仍願意放手一搏 拚了命去爭取不可能中的可能」
Thumbnail
我認為還有一個特質特別劃清了人類與機器的界線,這其中參雜了理性與感性,在人類的歷史進程上也經常發生 「明知結果會失敗仍願意放手一搏 拚了命去爭取不可能中的可能」
Thumbnail
在教機器學習語言之前,必須先釐清什麼是語言知識。用車子來譬喻。會開車的人未必懂得汽車的原理架構,會講中文的人也未必懂得漢語語法。我相信很多人在學外語之前,都不覺得中文也有語法吧?兒童學習母語的方式是用外在經驗灌溉基因裡的語言種籽,和成人之後學習外語是兩回事。所以從這一點來看,機器學習語言就有共通之處
Thumbnail
在教機器學習語言之前,必須先釐清什麼是語言知識。用車子來譬喻。會開車的人未必懂得汽車的原理架構,會講中文的人也未必懂得漢語語法。我相信很多人在學外語之前,都不覺得中文也有語法吧?兒童學習母語的方式是用外在經驗灌溉基因裡的語言種籽,和成人之後學習外語是兩回事。所以從這一點來看,機器學習語言就有共通之處
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News