大型語言模型常用的提詞框架 | Coursera 課程回顧(下)

閱讀時間約 8 分鐘

Overview-What is LLM?

大型語言模型(Large Language Model,LLM)是一項人工智慧技術,其目的在於理解生成人類語言,可將其想像成一種高階的「文字預測機器」,然而,它們並非真正理解語言。

雖然大型語言模型在理解和生成文本方面表現驚人,但它們並非真正理解語言,也缺乏世界運作的知識,模型可能學到偏見或生成不準確的信息。

除了在上篇介紹的 Prompt Design Pattern 可以協助我們在使用 LLM 時給予指示,以更好的執行我們期望中的工作之外,今天我們會介紹其他的技巧,確保生成的輸出擁有特定的品質,包括:

  1. Chain of Thought Prompting
  2. One-shot/Few-shot
  3. ReAct Prompting

what you need to know when using a LLM?

  1. LLM 的數學很糟。LLM 是在大量文本上進行訓練,而解決數學問題可能需要其他模型。
  2. 使用英文來提詞你會的得到更好的回答。論文🔗
  3. 偏見與幻覺。LLM 在回應中基於它的訓練資料集可能展現偏見;在回答不知道答案的問題時可能產生“幻覺”或生成虛假信息。
  4. 耐心。LLM 透過精準的對話,基於對話的上下文,可以提供更精確的生成結果。
  5. 平庸的輸入導致平庸的輸出。請使用 Prompt Pattern… 等等方法提高生成輸出的品質。

Chain of Thought Prompting

Chain of Thought Prompting 是一種與大型語言模型(LLM)互動的方式,旨在通過建立連貫的思維過程,引導模型生成更深入、更有邏輯結構的回答,通常都會提高 LLM 生成答案的準確度

在使用 Chain of Thought Prompting 有幾個特點:

  1. 首先, Chain of Thought Prompting 允許模型將多步驟問題分解為更多的中間步驟,這意味著需要更多運算資源處理推理步驟的問題。
  2. 其次, Chain of Thought Prompting 為模型的行為提供了一個可解釋的窗口,表明它可能如何獲得特定的答案,並提供調試推理路徑錯誤的機會
  3. 第三, Chain of Thought Prompting 可用於諸如數學單字問題常識推理符號操作等任務,並且原則上適用於人類可以透過語言解決的任何任務。
  4. 最後,只需將 Chain of Thought Prompting 推理的範例配合使用少量提示(One-shot/Few-shot Prompting),就可以輕鬆地在的現成大型語言模型中引出 Chain of Thought Prompting 的推理。
context, information, conditions

input:1
reasoning:1
output:1
input:2
reasoning:2
output:2
input:3
reasoning:3
output:3

input: your question?
raw-image


One-shots/Few-shots

One-shots 和 Few-shots 是一種強大的大型語言模型(LLM)使用框架。One-shots 和 Few-shots 指的是提供模型一些的範例就能夠學會新事物的能力。

這種學習方法的優勢在於其高效性和適應性。One-shots 和 Few-shots 更能夠迅速適應新的任務或情境,並在短時間內生成合理的回答。這種方式使得LLMs可以更靈活地應對各種問題,而不需要龐大的訓練數據集。

One-shots 和 Few-shots 的差別在於提供的範例數量為一個還是多個。

context, information, conditions

input:1
output:1
input:2
output:2
input:3
output:3

input: your question?
output:


ReAct Prompting

ReAct Prompting是一種與大型語言模型(LLM)互動的框架,其中大型語言模型(LLMs)以交替的方式生成推理軌跡和特定任務的操作,以達到更精確和符合期望的回應。

提供範例並要求模型生成推理軌跡使能夠誘導 LLM 追踪和更新行動計劃。操作步驟甚至允許LLMs 與外部資源(如知識庫或環境)進行串接互動,檢索附加信息,從而產生更可靠和事實準確的回應。

Task:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
Think:
Action: Use Tools (SEARCH WEB, Video, other tools)
Result:
---
Task: [your task]


補充資料:其他框架技巧

延伸閱讀

三大大型語言模型工具

參考引源和學習資源整理



avatar-img
18會員
41內容數
歡迎來到「Marcos的方格子」!目前在「Marcos談科技」撰寫在職涯上學習到的知識,在「Marcos談書」分享我在日常的閱讀和心得,歡迎您的到來!!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Marcos的方格子 的其他內容
大型語言模型(Large Language Model,LLM)是一項人工智慧技術,其目的在於理解和生成人類語言,可將其想像成一種高階的「文字預測機器」。 Prompt Pattern 是給予LLM的指示,並確保生成的輸出擁有特定的品質(和數量)。
FinOps 的出現協助幫助傳統的 IT 財務控制方法難以適應雲端環境,導致成本失控、缺乏透明度等諸多挑戰。 本文統整了 Google Cloud 所建議的 FinOps 優化方法論。
BigQuery M是 BigQuery 中的一項功能,數據分析師可以使用SQL語句創建、訓練、評估和預測機器學習模型。 在這次實作將使用一個電子商務(Google 商品商店)數據集來運行一些典型的查詢和模型訓練和預測,以讓企業更了解其客戶的購買習慣。
Easy共有九題,所有難度總共有75題,慢慢更新中。
在 Google Cloud 上保留靜態 IP 位址但未使用時,會按小時收取費用。使用 Cloud Functions 和 Cloud Scheduler 來識別和清理浪費的雲端資源,可以自動化的減少浪費的發生
大型語言模型(Large Language Model,LLM)是一項人工智慧技術,其目的在於理解和生成人類語言,可將其想像成一種高階的「文字預測機器」。 Prompt Pattern 是給予LLM的指示,並確保生成的輸出擁有特定的品質(和數量)。
FinOps 的出現協助幫助傳統的 IT 財務控制方法難以適應雲端環境,導致成本失控、缺乏透明度等諸多挑戰。 本文統整了 Google Cloud 所建議的 FinOps 優化方法論。
BigQuery M是 BigQuery 中的一項功能,數據分析師可以使用SQL語句創建、訓練、評估和預測機器學習模型。 在這次實作將使用一個電子商務(Google 商品商店)數據集來運行一些典型的查詢和模型訓練和預測,以讓企業更了解其客戶的購買習慣。
Easy共有九題,所有難度總共有75題,慢慢更新中。
在 Google Cloud 上保留靜態 IP 位址但未使用時,會按小時收取費用。使用 Cloud Functions 和 Cloud Scheduler 來識別和清理浪費的雲端資源,可以自動化的減少浪費的發生
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
Thumbnail
大型語言模型(LLM)是基於深度學習的自然語言處理模型,而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言,LMM 能夠處理跨模態的內容,並整合多種資料的能力,有望成為未來趨勢。
Thumbnail
本篇文章主要介紹一位菲律賓學者對使用大型語言模型產生文章的想法,說明如何利用AI技術進行學術寫作,以及提示工程的重要性。文中介紹了許多在醫學領域的應用以及學術寫作中的多種提示類型。文章還提到了。本文將會給讀者帶來對AI在學術寫作領域的啟發。
Thumbnail
ChatGPT於2022年底問世後,人們陷入興奮、緊張、恐懼的情緒。ChatGPT屬於大型語言模型,簡稱LLM(large language model)。⋯ 一旦LLM開始變成服務後,當一個人無法駕馭一個LLM時,被淘汰的變成是LLM而非這個人了。⋯
Thumbnail
知識的詛咒,或稱為"專家的詛咒"(Curse of Knowledge),是指一旦人們理解或掌握了某種知識,就很難回到那種不理解或不知道的狀態,使得難以理解那些還未掌握相同知識的人的視角。這種現象在教育和溝通中尤其明顯,經常讓專家難以有效地傳達他們的知識給初學者。 當我在和孩子溝通時,也常發生…
Thumbnail
雖然ChatGPT這種基於大型語言模型(LLM)的助手, 在大部分的場景都能滿足我們的需求, 但也並非完美, 在使用時仍需注意一些隱患。 以下是LLM的一些缺陷及需要注意的點。 弱弱的數學造成明顯錯誤 過份樂觀帶來錯誤資訊 相信常常使用ChatGPT的朋友應該都有發現到, 不論我們怎麼提問, Cha
Thumbnail
本文探討大型語言模型的兩種主要類型:GPT和BERT。GPT,如ChatGPT,被視為"通才",能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點:專才模型在特定任務上準確度高,而通才模型靈活多功能。選擇哪種取決於需求和目標。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
藉由Michal Kosinski教授所撰寫的研究論文中針對大型語言模型(LLMs)中出現人類獨有的心智理論現象,延續討論上篇文章中我所提出「人工智慧與人之間的差異?意識?」一問;並思考我們與AI的距離:當「我思故我在」不僅僅用在人類身上時,我們還有什麼是身為人獨有的特質?
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
Thumbnail
大型語言模型(LLM)是基於深度學習的自然語言處理模型,而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言,LMM 能夠處理跨模態的內容,並整合多種資料的能力,有望成為未來趨勢。
Thumbnail
本篇文章主要介紹一位菲律賓學者對使用大型語言模型產生文章的想法,說明如何利用AI技術進行學術寫作,以及提示工程的重要性。文中介紹了許多在醫學領域的應用以及學術寫作中的多種提示類型。文章還提到了。本文將會給讀者帶來對AI在學術寫作領域的啟發。
Thumbnail
ChatGPT於2022年底問世後,人們陷入興奮、緊張、恐懼的情緒。ChatGPT屬於大型語言模型,簡稱LLM(large language model)。⋯ 一旦LLM開始變成服務後,當一個人無法駕馭一個LLM時,被淘汰的變成是LLM而非這個人了。⋯
Thumbnail
知識的詛咒,或稱為"專家的詛咒"(Curse of Knowledge),是指一旦人們理解或掌握了某種知識,就很難回到那種不理解或不知道的狀態,使得難以理解那些還未掌握相同知識的人的視角。這種現象在教育和溝通中尤其明顯,經常讓專家難以有效地傳達他們的知識給初學者。 當我在和孩子溝通時,也常發生…
Thumbnail
雖然ChatGPT這種基於大型語言模型(LLM)的助手, 在大部分的場景都能滿足我們的需求, 但也並非完美, 在使用時仍需注意一些隱患。 以下是LLM的一些缺陷及需要注意的點。 弱弱的數學造成明顯錯誤 過份樂觀帶來錯誤資訊 相信常常使用ChatGPT的朋友應該都有發現到, 不論我們怎麼提問, Cha
Thumbnail
本文探討大型語言模型的兩種主要類型:GPT和BERT。GPT,如ChatGPT,被視為"通才",能執行多種任務。BERT則被視為"專才"的基本語言模型。兩者各有優點:專才模型在特定任務上準確度高,而通才模型靈活多功能。選擇哪種取決於需求和目標。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
藉由Michal Kosinski教授所撰寫的研究論文中針對大型語言模型(LLMs)中出現人類獨有的心智理論現象,延續討論上篇文章中我所提出「人工智慧與人之間的差異?意識?」一問;並思考我們與AI的距離:當「我思故我在」不僅僅用在人類身上時,我們還有什麼是身為人獨有的特質?