大型語言模型常用的提詞框架 | Coursera 課程回顧(下)

2024/03/09閱讀時間約 8 分鐘

Overview-What is LLM?

大型語言模型(Large Language Model,LLM)是一項人工智慧技術,其目的在於理解生成人類語言,可將其想像成一種高階的「文字預測機器」,然而,它們並非真正理解語言。

雖然大型語言模型在理解和生成文本方面表現驚人,但它們並非真正理解語言,也缺乏世界運作的知識,模型可能學到偏見或生成不準確的信息。

除了在上篇介紹的 Prompt Design Pattern 可以協助我們在使用 LLM 時給予指示,以更好的執行我們期望中的工作之外,今天我們會介紹其他的技巧,確保生成的輸出擁有特定的品質,包括:

  1. Chain of Thought Prompting
  2. One-shot/Few-shot
  3. ReAct Prompting

what you need to know when using a LLM?

  1. LLM 的數學很糟。LLM 是在大量文本上進行訓練,而解決數學問題可能需要其他模型。
  2. 使用英文來提詞你會的得到更好的回答。論文🔗
  3. 偏見與幻覺。LLM 在回應中基於它的訓練資料集可能展現偏見;在回答不知道答案的問題時可能產生“幻覺”或生成虛假信息。
  4. 耐心。LLM 透過精準的對話,基於對話的上下文,可以提供更精確的生成結果。
  5. 平庸的輸入導致平庸的輸出。請使用 Prompt Pattern… 等等方法提高生成輸出的品質。

Chain of Thought Prompting

Chain of Thought Prompting 是一種與大型語言模型(LLM)互動的方式,旨在通過建立連貫的思維過程,引導模型生成更深入、更有邏輯結構的回答,通常都會提高 LLM 生成答案的準確度

在使用 Chain of Thought Prompting 有幾個特點:

  1. 首先, Chain of Thought Prompting 允許模型將多步驟問題分解為更多的中間步驟,這意味著需要更多運算資源處理推理步驟的問題。
  2. 其次, Chain of Thought Prompting 為模型的行為提供了一個可解釋的窗口,表明它可能如何獲得特定的答案,並提供調試推理路徑錯誤的機會
  3. 第三, Chain of Thought Prompting 可用於諸如數學單字問題常識推理符號操作等任務,並且原則上適用於人類可以透過語言解決的任何任務。
  4. 最後,只需將 Chain of Thought Prompting 推理的範例配合使用少量提示(One-shot/Few-shot Prompting),就可以輕鬆地在的現成大型語言模型中引出 Chain of Thought Prompting 的推理。
context, information, conditions

input:1
reasoning:1
output:1
input:2
reasoning:2
output:2
input:3
reasoning:3
output:3

input: your question?
raw-image


One-shots/Few-shots

One-shots 和 Few-shots 是一種強大的大型語言模型(LLM)使用框架。One-shots 和 Few-shots 指的是提供模型一些的範例就能夠學會新事物的能力。

這種學習方法的優勢在於其高效性和適應性。One-shots 和 Few-shots 更能夠迅速適應新的任務或情境,並在短時間內生成合理的回答。這種方式使得LLMs可以更靈活地應對各種問題,而不需要龐大的訓練數據集。

One-shots 和 Few-shots 的差別在於提供的範例數量為一個還是多個。

context, information, conditions

input:1
output:1
input:2
output:2
input:3
output:3

input: your question?
output:


ReAct Prompting

ReAct Prompting是一種與大型語言模型(LLM)互動的框架,其中大型語言模型(LLMs)以交替的方式生成推理軌跡和特定任務的操作,以達到更精確和符合期望的回應。

提供範例並要求模型生成推理軌跡使能夠誘導 LLM 追踪和更新行動計劃。操作步驟甚至允許LLMs 與外部資源(如知識庫或環境)進行串接互動,檢索附加信息,從而產生更可靠和事實準確的回應。

Task:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
---
Task: [your task]


補充資料:其他框架技巧

延伸閱讀

三大大型語言模型工具

參考引源和學習資源整理



17會員
32內容數
歡迎來到「Marcos的方格子」!目前在「Marcos談科技」撰寫在職涯上學習到的知識,在「Marcos談書」分享我在日常的閱讀和心得,歡迎您的到來!!
留言0
查看全部
發表第一個留言支持創作者!