如何用大模型翻譯藏文文獻

閱讀時間約 6 分鐘

今天看到有人在微信po說用大模型翻譯藏文文獻比較,因此想說引用記錄下來,免的之後看不到了。

我目前沒有試用過,大家可以自己試試看!

原文參考自:如何用大模型翻譯藏文文獻

以下正文


1.翻譯品質對比

claude 3.5 sonnet某些層面上比Openai的Gpt4.0要好,對內容有註釋和概況,而谷歌的機翻水平不堪入目。

對比測試<1>:

藏文:

raw-image


谷歌的翻譯結果:

沒有任何修正,心就變得自由,就像海洋與水不分離一樣,無論心如何生起,它都不會以所有過去真理的形式行動。

因此,自我意識的自我意識沒有做任何事。進入在家是享受思想本質的道路。

如此,知善惡、拒絕、接受、捨棄的狂喜近乎平靜,空性大樂一起誕生。留在知境中的本質是決心的意義。

Claude-3.5-Sonnet翻譯結果:

身為中文佛教學者,我將盡力準確翻譯並解釋這段藏文內容。這段文字似乎出自藏傳佛教的大圓滿(dzogchen)教法,闡述了無為而治的修行方法和心性本質。以下是翻譯和解釋:

"不加任何人為造作,只需安住其中,各種念頭便會自然解脫。就像大海中生起的波浪,無論如何翻騰,終究不離大海本身;同樣,無論生起何種念頭,也不曾離開本初清淨的法性境界。

因此,對於任何生起的念頭,不去迎接或送別,不作取捨、遮遣或成立,而是任其自然顯現。這便是將念頭作為法性遊舞而修持的方法。

如此安住,善惡、遮遣與成立、取捨等分別妄想都會平息,明空雙運的俱生智慧將安住於本初清淨的狀態中,這就是頓斷法的真諦。"

這段文字闡述了大圓滿中的核心修行理念:

無為而治:不對念頭做任何干預,讓它們自然生起和消失。

心性本質:所有念頭本質上都是法性的顯現,如同波浪不離大海。

超越二元對立:不執著於善惡、取捨等概念,而是平等看待一切現象。

自然解脫:透過這種無為的修行方法,念頭會自然解脫,不需要刻意壓抑或轉化。

明空雙運:最終達到空性與光明並存的覺悟狀態,即所謂的"俱生智慧"。

本初清淨:強調心的本質是原始清淨的,這是大圓滿教法的核心見地。

這種修行方法強調直指心性,不依賴漸進的修行階段,而是直接認識並安住於心的本質,因此被稱為"頓斷"或"頓悟"法門。這在藏傳佛教,特別是寧瑪派的教法中佔有重要地位。


對比測試<2>:

藏文:

raw-image


谷歌的翻譯結果:

七月的天空格外晴朗。今天早晨的陽光非常美麗。於是,我和我的兩個朋友就朝著那裡的準卡拉石廟走去。宗喀爾位於西藏洛卡地區格拉囊宗巴桑亞斯寺以西15公里處。這個名字也寫為Zungkar和Zungkhar。還有很多關於這座城市的文章。在這裡,「Zungkhar」是根據當今當地人的俗名書寫的。

Claude-3.5-Sonnet翻譯結果:

身為中文佛教學者,我將為您翻譯這段藏文內容如下:

七月的天空異常清澈,今日此地的晨光格外宜人。正值此際,我與兩位法友一同驅車前往宗喀朵塔。宗喀位於西藏自治區洛札縣桑耶寺以西約十五公里處。此地名稱的書寫方式有多種變體,如宗喀(ཟ​​ུང་དཀར )、宗喀(ཟ​​ུང་མཁར )、蘇喀(ཟུར་ར༽ ཽ )。然而,在此我們採用"宗喀"(ཟུང་མཁར )這一拼寫,因為這是當地居民口中最常用的稱呼。

註記與解釋:

"七月":此處指藏曆七月,約對應公曆八月或九月。

「法友"(ཆོས་གྲོགས ):佛教中指同修道友。

"宗喀朵塔"(ཟུང་མཁར་རྡོའི་མཆོད་རྟེན ):直譯為"宗喀石塔"直譯為"宗。"朵"(རྡོ )意為石頭,"塔"(མཆོད་རྟེན )為藏語"舍利塔"之意,漢傳佛教常譯為"佛塔"或"舍利塔"。

"洛扎縣"(ལྷོ་ཁ་གྲ་ནང་རྫོང ):位於西藏自治區山南市。

"桑耶寺"(བསམ་ཡས་གཙུག་ལག་ཁང ):藏傳佛教著名寺院,建於8世紀,是吐蕃王朝時期修建的第一座佛教寺院。

關於地名的不同寫法,反映了藏語音譯的多樣性,這在藏族地區的地名中較為常見。選擇當地人使用的發音作為標準拼寫,體現了對當地文化的尊重。

這段文字描述了作者和同伴前往宗喀石塔的旅程開端,同時介紹了宗喀的地理位置和名稱由來,為讀者勾勒出一幅藏地朝聖之旅的畫面。

2.藏文文本獲取

藏傳佛教文獻資料中心:http://www.tbrc.org/

Nitartha數位圖書館:http://nitarthadigitallibrary.org/xtf/search

3.圖片擷取文字OCR

raw-image

一般情況,我們拿到的藏文文獻無論是紙本版還是電子版,都是以上這種,需要先將圖片中文字提取出來。大部分人用的谷歌的OCR。這裡推薦一款app:Text scanner proe,辨識精準度高達99%

Ocr工具下載連結:https://apkpure.com/cn/ocr-text-scanner-pro/com.offline.ocr.english.image.to.text.pro/downloading

3.1 進入APP,選擇所需辨識的圖片,可上傳圖片,也可拍照

raw-image


3.2 點選左下角,滑到底,選擇Tibetan

raw-image


識別精度99%

熱愛分享佛教內容,正專注於學習攝類學,透過辯論逐步進入五大論的學習。 作為佛教辯論的入門新手,我一邊學習一邊整理筆記和心得,目標是讓思維像鋼鐵般清晰,不再輕易被唬弄! 如果你也對用邏輯思維來理解佛教教義和觀點感興趣,歡迎一起探索。 我喜歡邊學邊記錄,期待和大家共同成長,將佛法智慧應用在日常生活中!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
要做會議記錄或課程筆記,想做逐字稿卻苦於打字速度不夠快嗎?錄音再慢慢回放浪費時間又容易恍神?這篇文章包你滿意,不用再浪費時間爬文了,你需要的逐字稿神器在這裡,保母級教學!
Thumbnail
網址:https://gadget.chienwen.net/x/text/articlecut 這個網頁裡面有許多小工具, 但感覺現在有很多被 AI 取代掉的東西, 推薦大家可以來用看看~
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
在數字化時代,PDF文件廣泛使用,但傳統處理方式顯得力不從心。本文推薦pdftopdf.ai等工具,通過OCR識別,將圖片中的文字轉化為可編輯、可搜索的文本。探討PDF文檔分析的AI工具,功能和價格。描述其用途以解決掃描件中文字無法直接搜索的困擾,提高工作效率。
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
在本文中,我們將瞭解如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
要做會議記錄或課程筆記,想做逐字稿卻苦於打字速度不夠快嗎?錄音再慢慢回放浪費時間又容易恍神?這篇文章包你滿意,不用再浪費時間爬文了,你需要的逐字稿神器在這裡,保母級教學!
Thumbnail
網址:https://gadget.chienwen.net/x/text/articlecut 這個網頁裡面有許多小工具, 但感覺現在有很多被 AI 取代掉的東西, 推薦大家可以來用看看~
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
在數字化時代,PDF文件廣泛使用,但傳統處理方式顯得力不從心。本文推薦pdftopdf.ai等工具,通過OCR識別,將圖片中的文字轉化為可編輯、可搜索的文本。探討PDF文檔分析的AI工具,功能和價格。描述其用途以解決掃描件中文字無法直接搜索的困擾,提高工作效率。
Thumbnail
這是什麼大問題嗎?這樣就寫一篇文章,會不會太混了! 會! 其實蠻混的! 哈哈哈! 1.英文不好,乾脆用中文。就用微軟 Copilot 設計工具 的網址在此。好啦!
Thumbnail
在本文中,我們將瞭解如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
前篇測試如何把提示詞生成的圖像細節提高,這篇要測試的工作流是把任意圖像載入後經由放大模型放大,同時測試放大後重繪看看效果如何。