嵌入
含有「嵌入」共 3 篇內容
全部內容
發佈日期由新至舊
王啟樺的沙龍
2024/07/16
學習大語言模型 101
步驟 1: 計劃每天花點時間學習大語言模型的技術部分。 步驟 2: 選擇合適的教材。我選擇了Manning出版的《Build a Large Language Model (From Scratch)》,這本書有配套的程式碼和詳細的講解,是我信賴的學習素材。 步驟 3: 瀏覽教材中的程式
#
大語言模型
#
程式碼
#
字符串
喜歡
留言
王啟樺的沙龍
2024/06/13
C002|文本嵌入的效果為何在Obsidian中很不理想?
「嵌入 Embedding」這個概念, 是指將「資料 Data」轉換為「向量 Vector」格式的過程。 資料可以是影片的樣本, 可以是音訊的樣本, 可以是圖片的樣本, 可以是文字的樣本。 不同類型的樣本, 可以透過相對應的預訓練神經網路模型, 將資料
#
嵌入
#
數位筆記
#
資料
4
留言
王啟樺的沙龍
2024/06/12
C001|為什麼需要 tiktoken 將文字轉換成符元表?
2024年6月11日晚上6點48分於洛杉磯, 我打算開始每天花點時間學習大語言模型的技術部分。 主要使用的教材是 Manning出版的Build a Large Language Model (From Scratch) [1]。 這本書有配套的code,還有詳細的講解,是我信賴的
#
大語言模型
#
OpenAI
#
tiktoken
5
留言