日文工具盒（一）：筑波網路語料庫檢索系統 NINJAL-LWP for TWC

2020/04/05閱讀時間約 1 分鐘

何謂語料庫

語料庫（corpus）係指大量收集語言現象資料（語料）後所彙編而成的資料庫，語言研究者可藉由語料庫了解語言的使用情形，針對特定主題進行研究。

語料庫主要以學術研究為目的而存在，聽起來似乎不怎麼平易近人，但其實一般學習者也能從中獲益。像是如果想要知道某個名詞通常會和哪些動詞一起出現，某個形容詞通常會拿來修飾哪些名詞，或者反過來說某個名詞通常會被哪些形容詞修飾等等，撇開直接請教老師或母語人士，語料庫絕對會是學習者最好的選擇。

NINJAL-LWP for TWC

在日文的語料庫當中，築波大學開發的「築波網路語料庫（Tsukuba Web Corpus, TWC）」規模可謂數一數二，語料來源為網際網路，包含各式新聞、記事、部落格等，蒐羅的詞語數有 11 億之多，足以忠實呈現現代日文的使用現象。本文所介紹的 NINJAL-LWP for TWC 即是該語料庫的檢索系統。

進入 NINJAL-LWP for TWC 首頁後，先按右上方的「検索を開始する」，出現使用者條款，勾選「上記の利用規約に同意します」再按「同意する」，便是檢索頁面了。

在搜尋框內輸入欲查詢的詞語（動詞等有活用的詞性必須輸入辭書形），按下「絞り込み」或 Enter 鍵後即顯示搜尋結果。

「頻度」代表詞語在語料庫中出現的次數，數字越大，代表該詞語的使用頻率越高。點擊搜尋結果的話能夠詳細查看使用型態分析以及完整的句子，甚至可以連結至語料的來源網站，惟礙於使用者條款中的規範，本文不便截圖細解，敬請參考官方的操作說明書。

為什麼會看到廣告

#語料庫

#NINJALLWPforTWC

鮮奶綠大叔的日語工作室的沙龍

12會員

9內容數

譯猶未盡。

留言0

查看全部

發表第一個留言支持創作者！

鮮奶綠大叔的日語工作室的沙龍的其他內容

八幡濱：被遺忘的地方都市，四國的曼徹斯特

凌晨兩點半，渡輪靠岸時的震動和聲響驚擾了睡夢中的旅客。我拉起滑落的大衣重新蓋回身上，抵不住襲來的睡意，再次遁入夢鄉。五點多下船以後，天色未明，拿出手機一查，方知這個時節的八幡濱要快七點才日出。據聞八幡濱在明治時代西化甚早，四國最早的電燈、愛媛縣首家銀行皆出現在此，產銅，航運、紡織業發達，而有四國的曼

#八幡濱 #四國的曼徹斯特 #愛媛

豐後水道渡輪

在別府待到晚上十一點五十分，然後坐上開往八幡濱，靠岸後可以留在船上休息到清晨的末班渡輪。天色未暗時，便先來了一趟宇和島運輸的售票暨候船大廳。大廳所在的水泥樓房有些老舊，外牆也已斑駁，似乎是昭和時代的產物。寬敞但昏暗的空間裏設置了一排臺灣診所常見的水藍色膠椅，以及十臺左右的吃角子老虎機。當時在大廳裏的

#宇和島運輸

九州別府地獄巡禮

福岡，只停留了短短三小時的地方。原本有打算去福岡市博物館看一眼漢委奴國王印 [1]，也有打算找間屋臺啖上一碗道地的博多拉麵，但畢竟最後的目的地是廣島，八天七夜的行程安排下來，在福岡流連越久，後面的行程便越緊湊，權衡之下只好完全放棄福岡了。入境後移動到博多車站時已經接近中午，在街上晃了晃，找到郵貯的提

#血池地獄 #海地獄 #鬼石坊主地獄

有「真夏」「真冬」卻無「真春」「真秋」？談接頭辭「真」的派生語

何謂接頭辭不少人在學習英文時會利用字首來記憶單詞，如 re 開頭的詞語多和重複、重新有關，un、dis、in 往往帶有否定意味等，而在日文中也有相當於字首的東西存在，即「接頭辭」。如同英文的字首，接頭辭大多時候並不被單獨使用，而是接在語的前方派生新語。「無」「不」「未」都是日文中常見的接頭辭，在構

#接頭辭 #派生語 #日文

從「早い」到「おはようございます」：淺談形容詞接補助動詞「ございます」時的音便現象

形容詞敬體表現的前世今生在我們所熟悉的現代日語中，形容詞的敬體乃是透過接續敬體斷定助動詞「です」來呈現，例如「早い」的敬體為「早いです」，「早かった」的敬體為「早かったです」，「早くない」的敬體為「早くないです」[1]，「早くなかった」的敬體為「早くなかったです」[2]。然而這樣的表現方式成為理所

#形容詞 #音便 #ウ音便

〈無國境時代〉或是〈無國界時代〉？淺談同形異義詞「國境」應如何翻譯

2018 年 3 月發行的 AKB48 第 51 張單曲中，收錄了一首和坂道系列合作，以「坂道 AKB」名義推出的曲目——《国境のない時代》。歌曲一公開，網路上中譯四出，儼如雨後春筍。在這些良莠不一的譯本中，歌名的中譯出現了兩種版本，其中一個版本照搬漢字，譯為「無國境時代」，另一個版本則抽換了詞面，

#同形異義詞 #偽友 #無國境時代