如何有效地使用大語言模型

更新 發佈閱讀 2 分鐘

隨著大語言模型的發展熱潮,如何有效地使用大語言模型成為大眾關心的話題。要學會使用大語言模型不能不了解提示工程 (Prompt Engineering),提示工程也稱為上下文內提示,指的是如何與大型語言模型(Large Language Model, LLM)溝通以引導其行為達到預期結果的方法,而無需更新模型權重。這是一門經驗科學,提示工程方法的效果在不同模型間可能有很大差異,因此需要大量實驗和啟發式方法。

本文僅關注自回歸語言模型的提示工程,不涉及圖像生成模型或多模態模型。本文核心目標是關於相容性和模型可操控性。


基本提示

零樣本和少樣本學習是兩種最基本的模型提示方法,由許多大型語言模型(LLM)論文開創,並常用於評估LLM性能。零樣本學習是簡單地將任務文本輸入模型並要求結果。


指令提示

在提示中呈現少量樣本的目的是向模型解釋使用者的意圖;換句話說,使用者以示範的形式向模型描述任務指令。然而,少樣本在標記使用方面可能成本高昂,並且由於上下文長度有限而限制了輸入長度。指令型語言模型(例如InstructGPT、自然指令)通過高品質的(任務指令、輸入、真實輸出)資料組對預訓練模型進行微調,使語言模型更好地理解用戶意圖並遵循指令。RLHF(基於人類反饋的強化學習)是一種常用的方法。指令遵循風格的微調改善了模型與人類意圖的對齊,並大大降低了溝通成本。在與指令模型互動時,我們應該詳細描述任務要求,努力做到具體和精確,避免說「不要做某事」,而是具體指明要做什麼。


Reference

留言
avatar-img
Kiki的沙龍
9會員
111內容數
心繫正體中文的科學家,立志使用正體中文撰寫文章。 此沙龍預計涵蓋各項資訊科技知識分享與學習心得
Kiki的沙龍的其他內容
2025/04/27
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
2025/04/27
Meta 推出了開源大型語言模型 Llama。這一代特別引人注目,因為 80 億參數的模型小到可以在家用電腦上運行,效能卻不輸比它大十倍的模型。在許多應用場景下,它給出的回應品質已經能媲美 GPT-4。在這篇文章裡,我會說明自架 Llama 3 的優缺點,並提供設定方式與資源,讓讀者也能輕鬆動手。
2025/04/20
這份實務指引旨在協助產品和工程團隊入門 大型語言模型(LLM)驅動的人工智慧代理人建構,它定義了代理的核心概念,例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理,特別是在傳統自動化方法受限的複雜情境,並深入探討了代理設計的基礎要素,包括模型選擇、工具整合及指令設置。
2025/04/20
這份實務指引旨在協助產品和工程團隊入門 大型語言模型(LLM)驅動的人工智慧代理人建構,它定義了代理的核心概念,例如獨立執行任務和利用 LLM 管理工作流程決策。本文闡述了何時應考慮建立代理,特別是在傳統自動化方法受限的複雜情境,並深入探討了代理設計的基礎要素,包括模型選擇、工具整合及指令設置。
2025/04/06
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
2025/04/06
這篇文章將搭配簡單的範例,介紹最近推出的 Docker Model Runner。內容比較隨意粗略,希望能成為讓讀者了解這項工具的契機!
看更多
你可能也想看
Thumbnail
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
Thumbnail
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
Thumbnail
如何訓練寫prompt的人才? Prompt工程 是一門正在快速發展的學科,它的核心在於如何向AI模型提出精確、有效的指令,以獲得最理想的輸出結果。要訓練寫prompt的人手,可以從以下幾個方面著手: 1. 理解AI模型的運作原理 模型的特性: 不同模型(如GPT-3、BERT)在處理語言、
Thumbnail
如何訓練寫prompt的人才? Prompt工程 是一門正在快速發展的學科,它的核心在於如何向AI模型提出精確、有效的指令,以獲得最理想的輸出結果。要訓練寫prompt的人手,可以從以下幾個方面著手: 1. 理解AI模型的運作原理 模型的特性: 不同模型(如GPT-3、BERT)在處理語言、
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
談到提示工程的框架,這篇寫得很好,也成為我們常用來提供給客戶的教學指引。 參考文章:產品經理必須懂得AI:prompts提示工程之五大經典框架 不同類型的 AI Agent 在開發時適用不同的 提示工程框架,這取決於 Agent 的用途、交互方式、技術需求 以及 使用者期望。以下是幾種類型的
Thumbnail
談到提示工程的框架,這篇寫得很好,也成為我們常用來提供給客戶的教學指引。 參考文章:產品經理必須懂得AI:prompts提示工程之五大經典框架 不同類型的 AI Agent 在開發時適用不同的 提示工程框架,這取決於 Agent 的用途、交互方式、技術需求 以及 使用者期望。以下是幾種類型的
Thumbnail
想斜槓做 line 貼圖卻沒時間學繪畫技巧? 有創意卻不知道怎麼寫募資計畫? 提示語範例將提供斜槓仔運用 AI 完成夢想,各類提示語範例將陸續更新,歡迎收藏本文 文章提供提示框架包含CLEAR、RTGO、CO-STAR和CLEVER框架介紹,以及提示語範例,涵蓋行銷、內容創作、教育、職場應用等領域
Thumbnail
想斜槓做 line 貼圖卻沒時間學繪畫技巧? 有創意卻不知道怎麼寫募資計畫? 提示語範例將提供斜槓仔運用 AI 完成夢想,各類提示語範例將陸續更新,歡迎收藏本文 文章提供提示框架包含CLEAR、RTGO、CO-STAR和CLEVER框架介紹,以及提示語範例,涵蓋行銷、內容創作、教育、職場應用等領域
Thumbnail
在這個 AI 蓬勃發展的時代,大語言模型(LLM)已逐漸成為我們日常工作、學習、甚至創作上的重要工具。ChatGPT 就是其中一個廣為人知的例子。然而,許多人初次接觸它時,會誤以為它像搜尋引擎,只需輸入一個問題,就能得到完美解答。但事實上,它的使用邏輯與傳統工具完全不同,它不只是單純地「回應」,而是
Thumbnail
在這個 AI 蓬勃發展的時代,大語言模型(LLM)已逐漸成為我們日常工作、學習、甚至創作上的重要工具。ChatGPT 就是其中一個廣為人知的例子。然而,許多人初次接觸它時,會誤以為它像搜尋引擎,只需輸入一個問題,就能得到完美解答。但事實上,它的使用邏輯與傳統工具完全不同,它不只是單純地「回應」,而是
Thumbnail
隨著大型語言模型的快速發展,Prompt Engineering 已成為提升模型表現的核心技術。OpenAI 日前推出了 GPT-4.1 Prompting Guide,為開發者提供全面的提示詞改善策略,幫助充分利用 GPT-4.1 在編碼、指令遵循和長上下文處理上的進步。
Thumbnail
隨著大型語言模型的快速發展,Prompt Engineering 已成為提升模型表現的核心技術。OpenAI 日前推出了 GPT-4.1 Prompting Guide,為開發者提供全面的提示詞改善策略,幫助充分利用 GPT-4.1 在編碼、指令遵循和長上下文處理上的進步。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
實測5種提示詞工程,改變o1的思維方向 現在主流的語言模型都內建思維鏈。 像ChatGPT-o1、DeepSeek-R1這類便是。 因為他們會在給出答案前自我思考。 這大大簡化了提示詞的複雜度。 也讓使用者寫指令的時候, 專注在「目標」的描述而非「手段」。
Thumbnail
實測5種提示詞工程,改變o1的思維方向 現在主流的語言模型都內建思維鏈。 像ChatGPT-o1、DeepSeek-R1這類便是。 因為他們會在給出答案前自我思考。 這大大簡化了提示詞的複雜度。 也讓使用者寫指令的時候, 專注在「目標」的描述而非「手段」。
Thumbnail
本文介紹了大型語言模型(LLM)中Prompt的原理及實踐,並提供了撰寫Prompt的基本框架邏輯PREP,以及加強Prompt撰寫的幾個方向:加強說明背景、角色描述和呈現風格,加強背景說明,角色描述,呈現風格以及目標受眾(TA)。同時推薦了幾個Prompt相關的參考網站。最後解答了一些快問快答。
Thumbnail
本文介紹了大型語言模型(LLM)中Prompt的原理及實踐,並提供了撰寫Prompt的基本框架邏輯PREP,以及加強Prompt撰寫的幾個方向:加強說明背景、角色描述和呈現風格,加強背景說明,角色描述,呈現風格以及目標受眾(TA)。同時推薦了幾個Prompt相關的參考網站。最後解答了一些快問快答。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News