日文工具盒(一):筑波網路語料庫檢索系統 NINJAL-LWP for TWC

更新於 2020/04/05閱讀時間約 1 分鐘

何謂語料庫

語料庫(corpus)係指大量收集語言現象資料(語料)後所彙編而成的資料庫,語言研究者可藉由語料庫了解語言的使用情形,針對特定主題進行研究。
語料庫主要以學術研究為目的而存在,聽起來似乎不怎麼平易近人,但其實一般學習者也能從中獲益。像是如果想要知道某個名詞通常會和哪些動詞一起出現,某個形容詞通常會拿來修飾哪些名詞,或者反過來說某個名詞通常會被哪些形容詞修飾等等,撇開直接請教老師或母語人士,語料庫絕對會是學習者最好的選擇。

NINJAL-LWP for TWC

在日文的語料庫當中,築波大學開發的「築波網路語料庫(Tsukuba Web Corpus, TWC)」規模可謂數一數二,語料來源為網際網路,包含各式新聞、記事、部落格等,蒐羅的詞語數有 11 億之多,足以忠實呈現現代日文的使用現象。本文所介紹的 NINJAL-LWP for TWC 即是該語料庫的檢索系統。
進入 NINJAL-LWP for TWC 首頁後,先按右上方的「検索を開始する」,出現使用者條款,勾選「上記の利用規約に同意します」再按「同意する」,便是檢索頁面了。
在搜尋框內輸入欲查詢的詞語(動詞等有活用的詞性必須輸入辭書形),按下「絞り込み」或 Enter 鍵後即顯示搜尋結果。
「頻度」代表詞語在語料庫中出現的次數,數字越大,代表該詞語的使用頻率越高。點擊搜尋結果的話能夠詳細查看使用型態分析以及完整的句子,甚至可以連結至語料的來源網站,惟礙於使用者條款中的規範,本文不便截圖細解,敬請參考官方的操作說明書
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
譯猶未盡。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
凌晨兩點半,渡輪靠岸時的震動和聲響驚擾了睡夢中的旅客。我拉起滑落的大衣重新蓋回身上,抵不住襲來的睡意,再次遁入夢鄉。五點多下船以後,天色未明,拿出手機一查,方知這個時節的八幡濱要快七點才日出。據聞八幡濱在明治時代西化甚早,四國最早的電燈、愛媛縣首家銀行皆出現在此,產銅,航運、紡織業發達,而有四國的曼
在別府待到晚上十一點五十分,然後坐上開往八幡濱,靠岸後可以留在船上休息到清晨的末班渡輪。天色未暗時,便先來了一趟宇和島運輸的售票暨候船大廳。大廳所在的水泥樓房有些老舊,外牆也已斑駁,似乎是昭和時代的產物。寬敞但昏暗的空間裏設置了一排臺灣診所常見的水藍色膠椅,以及十臺左右的吃角子老虎機。當時在大廳裏的
福岡,只停留了短短三小時的地方。原本有打算去福岡市博物館看一眼漢委奴國王印 [1],也有打算找間屋臺啖上一碗道地的博多拉麵,但畢竟最後的目的地是廣島,八天七夜的行程安排下來,在福岡流連越久,後面的行程便越緊湊,權衡之下只好完全放棄福岡了。入境後移動到博多車站時已經接近中午,在街上晃了晃,找到郵貯的提
何謂接頭辭 不少人在學習英文時會利用字首來記憶單詞,如 re 開頭的詞語多和重複、重新有關,un、dis、in 往往帶有否定意味等,而在日文中也有相當於字首的東西存在,即「接頭辭」。如同英文的字首,接頭辭大多時候並不被單獨使用,而是接在語的前方派生新語。「無」「不」「未」都是日文中常見的接頭辭,在構
形容詞敬體表現的前世今生 在我們所熟悉的現代日語中,形容詞的敬體乃是透過接續敬體斷定助動詞「です」來呈現,例如「早い」的敬體為「早いです」,「早かった」的敬體為「早かったです」,「早くない」的敬體為「早くないです」[1],「早くなかった」的敬體為「早くなかったです」[2]。然而這樣的表現方式成為理所
2018 年 3 月發行的 AKB48 第 51 張單曲中,收錄了一首和坂道系列合作,以「坂道 AKB」名義推出的曲目——《国境のない時代》。歌曲一公開,網路上中譯四出,儼如雨後春筍。在這些良莠不一的譯本中,歌名的中譯出現了兩種版本,其中一個版本照搬漢字,譯為「無國境時代」,另一個版本則抽換了詞面,
凌晨兩點半,渡輪靠岸時的震動和聲響驚擾了睡夢中的旅客。我拉起滑落的大衣重新蓋回身上,抵不住襲來的睡意,再次遁入夢鄉。五點多下船以後,天色未明,拿出手機一查,方知這個時節的八幡濱要快七點才日出。據聞八幡濱在明治時代西化甚早,四國最早的電燈、愛媛縣首家銀行皆出現在此,產銅,航運、紡織業發達,而有四國的曼
在別府待到晚上十一點五十分,然後坐上開往八幡濱,靠岸後可以留在船上休息到清晨的末班渡輪。天色未暗時,便先來了一趟宇和島運輸的售票暨候船大廳。大廳所在的水泥樓房有些老舊,外牆也已斑駁,似乎是昭和時代的產物。寬敞但昏暗的空間裏設置了一排臺灣診所常見的水藍色膠椅,以及十臺左右的吃角子老虎機。當時在大廳裏的
福岡,只停留了短短三小時的地方。原本有打算去福岡市博物館看一眼漢委奴國王印 [1],也有打算找間屋臺啖上一碗道地的博多拉麵,但畢竟最後的目的地是廣島,八天七夜的行程安排下來,在福岡流連越久,後面的行程便越緊湊,權衡之下只好完全放棄福岡了。入境後移動到博多車站時已經接近中午,在街上晃了晃,找到郵貯的提
何謂接頭辭 不少人在學習英文時會利用字首來記憶單詞,如 re 開頭的詞語多和重複、重新有關,un、dis、in 往往帶有否定意味等,而在日文中也有相當於字首的東西存在,即「接頭辭」。如同英文的字首,接頭辭大多時候並不被單獨使用,而是接在語的前方派生新語。「無」「不」「未」都是日文中常見的接頭辭,在構
形容詞敬體表現的前世今生 在我們所熟悉的現代日語中,形容詞的敬體乃是透過接續敬體斷定助動詞「です」來呈現,例如「早い」的敬體為「早いです」,「早かった」的敬體為「早かったです」,「早くない」的敬體為「早くないです」[1],「早くなかった」的敬體為「早くなかったです」[2]。然而這樣的表現方式成為理所
2018 年 3 月發行的 AKB48 第 51 張單曲中,收錄了一首和坂道系列合作,以「坂道 AKB」名義推出的曲目——《国境のない時代》。歌曲一公開,網路上中譯四出,儼如雨後春筍。在這些良莠不一的譯本中,歌名的中譯出現了兩種版本,其中一個版本照搬漢字,譯為「無國境時代」,另一個版本則抽換了詞面,
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
在學習日語的過程中,語法經常令人困惑,但其結構卻非常有邏輯。這篇文章詳細介紹了日語的基本語法,包括句子結構、助詞使用、動詞變化與形容詞的運用,並提供有效的學習技巧。通過實際例句與教學策略,初學者可以更輕鬆地掌握日語語法,享受學習的樂趣。
Thumbnail
學習完基礎的日文五十音後,接來下要學習的是日文單字。 日文單字是掌握日語的重要步驟,無論是聽、說、讀、寫,每個方面都需要大量的詞彙和單字作為基礎。 在這篇部落格中,我將介紹50個常用的日文單字,並分享一些有效的學習方法和技巧,幫助你更快地掌握這些詞彙。
Thumbnail
五倍紅寶石軟體開發公司於今年參與建置「臺灣台語語料庫應用檢索系統」,包含檢索系統上的三個重要功能,包含「教科書詞彙檢索系統」、「語法點檢索系統」及「語料檢索系統」,五倍紅寶石軟體開發創辦人鄧慕凡表示台灣目前處理台語相關的網站及資料很少,這次能接到開發該系統的重責大任,是很有價值且感到榮幸的一件事。
「讀“新聞”來獲得最新的情報。」 「“網際網路”對我而言,是字典與百科全書的替代。」 「當想知道情報的全局,就要活用“書”。」 這3句話,節錄於日本作者出口治明[1]的著書, 《いま君に伝えたい知的生産の考え方 》[2]的第134頁。 我一直不知道新聞該怎麼讀,
Thumbnail
・把名詞和名詞連接起來。 ・“N1の”修飾N2。 ・「の」表示N1是N2的所屬單位。 1)わたしは東京高校の木村です。   我是東京高中的木村。 ・「の 」表示N1是N2的種類。 2)あれは英語の教科書です。 那是英語的教科書。 3)A:日本
Thumbnail
本文詳細介紹了日語中如何使用助詞「だけ」來限定對象、程度、範圍、數量等,並提供了多個例句來說明使用方法。
Thumbnail
教育部閩南語常用詞辭典提供了基本的查詢方式,包括頭字、尾字、字元等方式,使用漢字和拼音做例子,並講解了各種查詢方式的使用方法。
Thumbnail
今á日beh紹介ê語詞是khăn-jió͘,khêng實像chit款詞,是tī日本時代,台語kah日語sio thàu-lām ê產物,有1 kóa日語內底有,m̄-koh台語內底無--ê,chŏaⁿ直接kā日本話the̍h入來台語講,吸收做台語ê 1部分。Tī chia ē-sái講幾ê例,凡
Thumbnail
在學習到日文自動詞與他動詞的用法,是不是許多學習者學完課本教材後,費了很大的功夫終於弄清楚了自他動詞的區別,還是記不住哪個是自動詞還是他動詞呢? 日語中自動詞與他動詞兩大類是學習的難點之一。在日語的學習過程中,你是否也被自他動詞所困擾,分不清它們的使用規則?
Thumbnail
語言,是一扇連接文化的窗戶,而學習日文,更是打開這扇窗戶的鑰匙。然而,要想熟練掌握一門語言,不僅需要學習語法和詞彙,更需要將自己完全沉浸在該語言的環境中。在這個時代,學習日文已不再是一件艱難的事情,只要你掌握了一些技巧,你就能夠事半功倍地學好日文。
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
在學習日語的過程中,語法經常令人困惑,但其結構卻非常有邏輯。這篇文章詳細介紹了日語的基本語法,包括句子結構、助詞使用、動詞變化與形容詞的運用,並提供有效的學習技巧。通過實際例句與教學策略,初學者可以更輕鬆地掌握日語語法,享受學習的樂趣。
Thumbnail
學習完基礎的日文五十音後,接來下要學習的是日文單字。 日文單字是掌握日語的重要步驟,無論是聽、說、讀、寫,每個方面都需要大量的詞彙和單字作為基礎。 在這篇部落格中,我將介紹50個常用的日文單字,並分享一些有效的學習方法和技巧,幫助你更快地掌握這些詞彙。
Thumbnail
五倍紅寶石軟體開發公司於今年參與建置「臺灣台語語料庫應用檢索系統」,包含檢索系統上的三個重要功能,包含「教科書詞彙檢索系統」、「語法點檢索系統」及「語料檢索系統」,五倍紅寶石軟體開發創辦人鄧慕凡表示台灣目前處理台語相關的網站及資料很少,這次能接到開發該系統的重責大任,是很有價值且感到榮幸的一件事。
「讀“新聞”來獲得最新的情報。」 「“網際網路”對我而言,是字典與百科全書的替代。」 「當想知道情報的全局,就要活用“書”。」 這3句話,節錄於日本作者出口治明[1]的著書, 《いま君に伝えたい知的生産の考え方 》[2]的第134頁。 我一直不知道新聞該怎麼讀,
Thumbnail
・把名詞和名詞連接起來。 ・“N1の”修飾N2。 ・「の」表示N1是N2的所屬單位。 1)わたしは東京高校の木村です。   我是東京高中的木村。 ・「の 」表示N1是N2的種類。 2)あれは英語の教科書です。 那是英語的教科書。 3)A:日本
Thumbnail
本文詳細介紹了日語中如何使用助詞「だけ」來限定對象、程度、範圍、數量等,並提供了多個例句來說明使用方法。
Thumbnail
教育部閩南語常用詞辭典提供了基本的查詢方式,包括頭字、尾字、字元等方式,使用漢字和拼音做例子,並講解了各種查詢方式的使用方法。
Thumbnail
今á日beh紹介ê語詞是khăn-jió͘,khêng實像chit款詞,是tī日本時代,台語kah日語sio thàu-lām ê產物,有1 kóa日語內底有,m̄-koh台語內底無--ê,chŏaⁿ直接kā日本話the̍h入來台語講,吸收做台語ê 1部分。Tī chia ē-sái講幾ê例,凡
Thumbnail
在學習到日文自動詞與他動詞的用法,是不是許多學習者學完課本教材後,費了很大的功夫終於弄清楚了自他動詞的區別,還是記不住哪個是自動詞還是他動詞呢? 日語中自動詞與他動詞兩大類是學習的難點之一。在日語的學習過程中,你是否也被自他動詞所困擾,分不清它們的使用規則?
Thumbnail
語言,是一扇連接文化的窗戶,而學習日文,更是打開這扇窗戶的鑰匙。然而,要想熟練掌握一門語言,不僅需要學習語法和詞彙,更需要將自己完全沉浸在該語言的環境中。在這個時代,學習日文已不再是一件艱難的事情,只要你掌握了一些技巧,你就能夠事半功倍地學好日文。