C002|文本嵌入的效果為何在Obsidian中很不理想?「嵌入 Embedding」這個概念,
是指將「資料 Data」轉換為「向量 Vector」格式的過程。
資料可以是影片的樣本,
可以是音訊的樣本,
可以是圖片的樣本,
可以是文字的樣本。
不同類型的樣本,
可以透過相對應的預訓練神經網路模型,
將資料 C001|為什麼需要 tiktoken 將文字轉換成符元表?2024年6月11日晚上6點48分於洛杉磯,
我打算開始每天花點時間學習大語言模型的技術部分。
主要使用的教材是 Manning出版的Build a Large Language Model (From Scratch) [1]。
這本書有配套的code,還有詳細的講解,是我信賴的