2024-06-13|閱讀時間 ‧ 約 23 分鐘

C002|文本嵌入的效果為何在Obsidian中很不理想?

「嵌入 Embedding」這個概念,


是指將「資料 Data」轉換為「向量 Vector」格式的過程。


資料可以是影片的樣本,


可以是音訊的樣本,


可以是圖片的樣本,


可以是文字的樣本。


不同類型的樣本,


可以透過相對應的預訓練神經網路模型,


將資料樣本轉換為「嵌入向量 Embedding Vector」。


嵌入的目的,


是將這些不是數字的資料(影片圖片音訊文字),


轉換成數字的向量,


這樣神經網路就可以處理,


跑各種最優化演算法了!


附帶一提,


在Obsidian裡面有個外掛叫做「Smart Connections [1]」,


可以透過應用「嵌入」的技術,


來幫助你看到你的筆記之間的關係[2]。


我之前有嘗試安裝這個外掛,


實際使用時,


會經過一段很長的時間,


來將我Obsidian庫中的筆記做嵌入。


根據Smart Connections開法者的說明[2],


這個外掛會將我們存放在Obsidian的筆記,


轉化為1536維的向量!


我猜轉為向量後,


大概就是用基本的Euclidean Distance判斷筆記之間的遠近。


在我的使用經驗上,


他找出來的相近的筆記,


相近的都是字面上,


而不是字面下的深刻含義。


這對做筆記其實幫助很有限。


Reference

[1]


[2]


分享至
成為作者繼續創作的動力吧!
從 Google News 追蹤更多 vocus 的最新精選內容從 Google News 追蹤更多 vocus 的最新精選內容

王啟樺的沙龍 的其他內容

你可能也想看

發表回應

成為會員 後即可發表留言
© 2024 vocus All rights reserved.