AI說書 - 從0開始 - 44

2024/06/23 更新2024/06/23 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

我們已經在AI說書 - 從0開始 - 43中，闡述了 Embedding 的訓練方式，現在我們來看是否 Embedding 如我們預期般運作：

假設我的目標句子是：「The black cat sat on the couch and the brown dog slept on the rug」，我將關注於「black」與「brown」這兩個字，因為它們都是顏色的意涵，我預期它們的 Embedding 相似度會挺高的，以下開始驗證：

經過查詢後，「black」的 Embedding 如下，其為維度 d_model = 512 的向量：

圖片出自：Transformers for Natural Language Processing and Computer Vision - Third Edition, Denis Rothman, 2024

而「brown」的 Embedding 如下，其亦為維度 d_model = 512 的向量：

圖片出自：Transformers for Natural Language Processing and Computer Vision - Third Edition, Denis Rothman, 2024

為了進行比較，我們引入 Cosine Similarity 的基準進行比較，其概念為：「 Uses the Euclidean (L2) norm to create vectors in a unit sphere. The dot product of the vectors we are comparing is the cosine between the points of those two vectors」，如果各位有興趣的話，可以參照：https://scikit-learn.org/stable/modules/metrics.html#cosine-similarity，運行結果如下：

圖片出自：Transformers for Natural Language Processing and Computer Vision - Third Edition, Denis Rothman, 2024

結果如預期， Embedding 可以偵測到顏色的詞彙，並安排相近的向量來詮釋，因此 Transformer 模型引入 Embedding 後可以把「字詞相近的意涵」或「字與字間的關聯」一併當作模型的有用資訊，然而還缺少一個重要資訊，那就是每個字的位置資訊，這也就是 Positional Encoding 的重點之處。

Learn AI 不 BI三分鐘學AIAI從0開始-第二章

留言

留言分享你的想法！

Learn AI 不 BI

244會員

965內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/07/05

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

2024/07/05

AI說書 - 從0開始 - 71

2024/07/04

AI說書 - 從0開始 - 70

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 的重要性已經被公認了，因此在 Hugging Face 中亦有被實作，呼叫方式如下： !pip -q install transformers

2024/07/04

AI說書 - 從0開始 - 70

2024/07/02

AI說書 - 從0開始 - 69

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Trainin

2024/07/02

你可能也想看

暖家的防潮、除濕用品分享，若你知道有什麼CP值更高的用品，請推薦給我！同時也分享蝦皮分潤計畫的好處。

#蝦皮分潤計畫#蝦皮1212#蝦皮免運

2025/11/26

暖茶文鳥町｜鳥日常·插畫

暖家對抗潮濕對策：防潮好物分享

暖家的防潮、除濕用品分享，若你知道有什麼CP值更高的用品，請推薦給我！同時也分享蝦皮分潤計畫的好處。

#蝦皮分潤計畫#蝦皮1212#蝦皮免運

2025/11/26

氵函 🐈‍⬛ 動植物溝通

寒流、冬天保暖佈置❄️手腳冰冷必備怕冷禦寒小物｜CP值爆表、實用防寒小物全指南｜蝦皮雙12這樣買最省

寒流來襲，你準備好禦寒小物了嗎？小吉推薦實際使用過、愛用且會回購的防寒小物，強調兼具美感與實用的選品原則。居家必備的地毯、手腳保暖小物（貓咪襪子、防水鋪棉手套、絨毛室內拖鞋）、電力保暖用品（電動暖暖包、可定時電熱毯），泡腳桶、浴室電暖器。特別整理蝦皮雙 12 活動攻略，並邀請你透過連結購買加入分潤。

#蝦皮雙十二#蝦皮雙12#雙十二

2025/11/27