我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。本章節將涵蓋以下內容:使用 Punkt 對文字進行標記使用 Gensim 和 Word2Vec 嵌入文本探討單字的向量探索嵌入向量空間餘弦相似度使用 TensorFlow Projector 顯示向量空間問答準備搜尋資料使用 Embedding Searching遷移學習運行 Ada 嵌入並使用 RAG使用學習到的嵌入對資料進行聚類