GPT2
含有「GPT2」共 1 篇內容
全部內容
發佈日期由新至舊
王啟樺的沙龍
2024/06/13
C003|為什麼大語言模型的嵌入需要這麼多維度?
大語言模型通常會生產自己的「嵌入 Embedding」作為部分的輸入層, 並且在大語言模型的訓練途中不斷優化嵌入的方式, 以對特定的任務特定的數據優化。 而大語言模型使用的「嵌入維度 Embedding Dimension」通常是高維度的, 例如最小的GPT-2模型有1億1千
#
大語言模型
#
GPT2
#
GPT3
5
留言