Overview-What is LLM?
大型語言模型(Large Language Model,LLM)是一項人工智慧技術,其目的在於理解和生成人類語言,可將其想像成一種高階的「文字預測機器」,然而,它們並非真正理解語言。
雖然大型語言模型在理解和生成文本方面表現驚人,但它們並非真正理解語言,也缺乏世界運作的知識,模型可能學到偏見或生成不準確的信息。
除了在上篇介紹的 Prompt Design Pattern 可以協助我們在使用 LLM 時給予指示,以更好的執行我們期望中的工作之外,今天我們會介紹其他的技巧,確保生成的輸出擁有特定的品質,包括:- Chain of Thought Prompting
- One-shot/Few-shot
- ReAct Prompting
what you need to know when using a LLM?
- LLM 的數學很糟。LLM 是在大量文本上進行訓練,而解決數學問題可能需要其他模型。
- 使用英文來提詞你會的得到更好的回答。論文🔗
- 偏見與幻覺。LLM 在回應中基於它的訓練資料集可能展現偏見;在回答不知道答案的問題時可能產生“幻覺”或生成虛假信息。
- 耐心。LLM 透過精準的對話,基於對話的上下文,可以提供更精確的生成結果。
- 平庸的輸入導致平庸的輸出。請使用 Prompt Pattern… 等等方法提高生成輸出的品質。
Chain of Thought Prompting
Chain of Thought Prompting 是一種與大型語言模型(LLM)互動的方式,旨在通過建立連貫的思維過程,引導模型生成更深入、更有邏輯結構的回答,通常都會提高 LLM 生成答案的準確度。
在使用 Chain of Thought Prompting 有幾個特點:
- 首先, Chain of Thought Prompting 允許模型將多步驟問題分解為更多的中間步驟,這意味著需要更多運算資源處理推理步驟的問題。
- 其次, Chain of Thought Prompting 為模型的行為提供了一個可解釋的窗口,表明它可能如何獲得特定的答案,並提供調試推理路徑錯誤的機會
- 第三, Chain of Thought Prompting 可用於諸如數學單字問題、常識推理和符號操作等任務,並且原則上適用於人類可以透過語言解決的任何任務。
- 最後,只需將 Chain of Thought Prompting 推理的範例配合使用少量提示(One-shot/Few-shot Prompting),就可以輕鬆地在的現成大型語言模型中引出 Chain of Thought Prompting 的推理。
context, information, conditions
input:1
reasoning:1
output:1
input:2
reasoning:2
output:2
input:3
reasoning:3
output:3
input: your question?

One-shots/Few-shots
One-shots 和 Few-shots 是一種強大的大型語言模型(LLM)使用框架。One-shots 和 Few-shots 指的是提供模型一些的範例就能夠學會新事物的能力。
這種學習方法的優勢在於其高效性和適應性。One-shots 和 Few-shots 更能夠迅速適應新的任務或情境,並在短時間內生成合理的回答。這種方式使得LLMs可以更靈活地應對各種問題,而不需要龐大的訓練數據集。
One-shots 和 Few-shots 的差別在於提供的範例數量為一個還是多個。
context, information, conditions
input:1
output:1
input:2
output:2
input:3
output:3
input: your question?
output:
ReAct Prompting
ReAct Prompting是一種與大型語言模型(LLM)互動的框架,其中大型語言模型(LLMs)以交替的方式生成推理軌跡和特定任務的操作,以達到更精確和符合期望的回應。
提供範例並要求模型生成推理軌跡使能夠誘導 LLM 追踪和更新行動計劃。操作步驟甚至允許LLMs 與外部資源(如知識庫或環境)進行串接互動,檢索附加信息,從而產生更可靠和事實準確的回應。
Task:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
---
Task: [your task]
補充資料:其他框架技巧
延伸閱讀
三大大型語言模型工具
參考引源和學習資源整理
- https://www.coursera.org/learn/prompt-engineering
- A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT
- Dive into Deep Learning
- https://learnprompting.org/docs/intro
- https://learningprompt.gh.miniasp.com/zh-Hant/docs/chatgpt-learning-path
- https://github.com/devisasari/awesome-gpt-store?tab=readme-ov-file#music