tokenization
含有「tokenization」共 1 篇內容
全部內容
發佈日期由新至舊
Rene Wang的沙龍
2021/03/19
[探索] 語言模型基礎:Subword algorithms
一個好的自然語言模型,若出現了語言模型的 vocabulary set 未曾收錄的單字,語言模型就會產生 Out-of-Vocabulary (OOV)。 本文介紹 subword algorithms 介於 word-level 和 character-level 解決 OOV 的方法。
#
DeepLearning
#
語言模型
#
深度學習
7
留言