「嵌入 Embedding」這個概念,
是指將「資料 Data」轉換為「向量 Vector」格式的過程。
資料可以是影片的樣本,
可以是音訊的樣本,
可以是圖片的樣本,
可以是文字的樣本。
不同類型的樣本,
可以透過相對應的預訓練神經網路模型,
將資料樣本轉換為「嵌入向量 Embedding Vector」。
嵌入的目的,
是將這些不是數字的資料(影片圖片音訊文字),
轉換成數字的向量,
這樣神經網路就可以處理,
跑各種最優化演算法了!
附帶一提,
在Obsidian裡面有個外掛叫做「Smart Connections [1]」,
可以透過應用「嵌入」的技術,
來幫助你看到你的筆記之間的關係[2]。
我之前有嘗試安裝這個外掛,
實際使用時,
會經過一段很長的時間,
來將我Obsidian庫中的筆記做嵌入。
根據Smart Connections開法者的說明[2],
這個外掛會將我們存放在Obsidian的筆記,
轉化為1536維的向量!
我猜轉為向量後,
大概就是用基本的Euclidean Distance判斷筆記之間的遠近。
在我的使用經驗上,
他找出來的相近的筆記,
相近的都是字面上,
而不是字面下的深刻含義。
這對做筆記其實幫助很有限。
Reference
[1]
[2]