現實世界中出現過的語言素材,可以透過數位系統儲存在語料庫中,並分析處理成可搜索的資源。英文論文對中文為背景的學術作者們來說並不容易。然而想要成功出版英文寫作的層次是相當重要的,要能達到期刊論文的程度才有機會,指導學生的論文寫作就更不用說了。線上詞典、Google Translate和電子期刊資料庫等,線上英語語料庫又是一項不錯的工具。
語料庫與線上詞典、Google Translate及電子期刊資料庫分別的功能是甚麼?線上詞典可以解釋單詞的意思,翻譯軟體則能大略分析段落結構及關鍵詞語,學術期刊資料庫給你真實的語境以及篇章讓你瞭解實際運用。而語料庫的功能則是在使用以上三個工具以後逐字逐句細部地修訂。
英語教學的研究來說語料庫是工具也是研究方法,透過分析詞組及句式的出現頻率、語境及搭配等等呈現質性分析無法呈現的結果,設定單一句法、語義或詞性的分類標籤,以各種文章的語言特徵、語體分類等探討口語溝通的結構模式。
有諸個具有大數據及學術代表性的英語語料庫,包括:英國國家語料庫
BNC,美國當代英語語料庫
COCA,密西根學術口語英語語料庫
MICASE,密西根高階學生論文語料庫 ,以及清大自然語言處理語料庫
Linggle等。
如testicle/testis/testes,線上詞典大部分都在解釋睪丸的詞義,例句也非學術寫作所使用的語境,在搜尋引擎找到的幾篇文章,又要進一步研究testis/testes到底出現在哪裡,這是相當費工的;若美國當代英語語料庫COCA中,同個頁面會呈現上百筆真實語料,
“Remove the testis from the tunica albuginea”
“The ovaries are the female equivalent of the male testes”
相當清楚不用自行揣測。
論文模版功能在語料庫中也有提供,若在寫方法論時詞窮了,就用The method involves進行搜尋實例,先用method involves查一遍,再用method及involves分別查一遍就可看見各式各樣的實用例子。或先找幾篇目標
投稿期刊的經典論文,分析整體架構中的必要部分,其常用句式、表達法,進入語料庫中分別搜尋,就能編寫適合自己的英語論文寫作模版。
自己的專屬語料庫是根據自己的需要提供細緻的資料。如天文物理領域的碩博士生,計劃要投稿Science,可以先找適合自己的自建語料庫軟體,並以天文物理的關鍵詞建立語料庫,蒐集Science刊過的天文物理文章,深入瞭解天文物理領域如何對不同問題進行論述,縮小搜尋範圍以方便使用。將自己一篇篇的論文紀錄以建立另外的語料庫,每次寫完新的論文後,就能在這個語料庫中再次進行搜索並找出錯誤,進而逐步提升寫作能力,累積日後寫作和出版的素材。