AI說書 - 從0開始 - 335 | Embedding Based Search Embedded 高相似度者當提示

2025/02/27 更新2025/02/27 發佈閱讀 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

回顧目前有的素材：

透過 Embedding 模型找出高相似度的文字後，要再匯入當作 Prompt，不過我們先寫一個計算 Token 數目的函數，不管從專案面 (模型有最大支援 Token 數限制) 還是價格面都會有幫助：

GPT_MODEL = "gpt-4-turbo"
def num_tokens(text: str, model: str = GPT_MODEL) -> int:
	encoding = tiktoken.encoding_for_model(model)
	return len(encoding.encode(text))

再撰寫一個 Query 函數，此函數要考量上述提及的：模型有最大支援 Token 數限制：

def query_message(query: str, df: pd.DataFrame, model: str, token_budget: int) -> str:
	strings, relatednesses = strings_ranked_by_relatedness(query, df)
	introduction = 'Use the below articles on the 2022 Winter Olympics to answer the subsequent question. If the answer cannot be found in the articles, write "I could not find an answer."'
	question = f"\n\nQuestion: {query}"
	message = introduction
	for string in strings:
		next_article = f'\n\nWikipedia article section:\n"""\n{string}\n"""'
		if num_tokens(message + next_article + question, model = model) > token_budget:
			break
		else:
			message += next_article
	return message + question

Learn AI 不 BI三分鐘學AI (2)AI從0開始-十一章

留言

留言分享你的想法！

Learn AI 不 BI

240會員

883內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2025/03/12

AI說書 - 從0開始 - 346 | 第十一章額外閱讀

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。本章的重點在於，原始的 Prompt 匯入 GPT 模型可能效果不好，因此納入 Embedding 資料庫，將此 Prompt 轉成 Embedding，再將此 Emb

2025/03/12

AI說書 - 從0開始 - 346 | 第十一章額外閱讀

2025/03/10

AI說書 - 從0開始 - 345 | Embedding Based Search 之群聚效果檢視

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。整理目前手上有的素材： AI說書 - 從0開始 - 338 | Embedding Based Search 資料集描述 AI說書 - 從0開始 - 339 | E

2025/03/10

AI說書 - 從0開始 - 345 | Embedding Based Search 之群聚效果檢視

2025/03/09

AI說書 - 從0開始 - 344 | Embedding Based Search 之 t-SNE 降維

2025/03/09

AI說書 - 從0開始 - 344 | Embedding Based Search 之 t-SNE 降維

看更多

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15