L12:生成式AI應用與規劃
L122:生成式AI應用領域與工具使用
L12202:如何善用生成式AI工具
Prompt
如何善用生成式AI工具,如Prompt、RAG等。
關鍵要點
- 研究顯示,善用生成式AI工具如提示(Prompt)和檢索增強生成(RAG)需要清晰的提示設計和外部數據整合。
- 提示工程似乎是獲得理想輸出的關鍵,應具體、提供上下文並迭代優化。
- 證據傾向於認為RAG能提升AI的準確性和相關性,特別是通過訪問最新領域特定信息。
- 有效使用這些工具可能涉及理解工具能力、評估輸出並確保倫理使用,這些方法因工具和任務而異。
提示工程
生成式AI工具的提示工程是設計輸入以指導模型產生期望輸出的過程。以下是一些最佳做法:
- 具體和清晰:清楚說明你希望AI做什麼,例如“寫一篇關於可持續發展的500字博客文章”。
- 提供上下文:給模型足夠的背景信息,例如“針對高中生的科學項目,生成一個實驗計劃”。
- 使用正確的語氣和風格:在提示中指定,例如“用輕鬆的語氣寫一封客戶服務電子郵件”。
- 迭代和優化:從基本提示開始,根據模型的回應進行調整。
- 避免歧義:確保提示沒有多重解釋,例如避免模糊的詞語。
- 使用示例:提供示例以指導AI,例如“參考這篇文章的風格,寫一篇類似的產品評論”。
檢索增強生成(RAG)
RAG是一種技術,通過整合信息檢索系統增強生成式AI,使模型能訪問外部數據源以提供更準確和相關的回應。
RAG如何工作:
- 索引:將數據轉換為嵌入並存儲在向量數據庫中。
- 檢索:根據用戶查詢獲取相關信息。
- 增強:將檢索的信息納入提示中。
- 生成:AI模型使用增強後的提示生成最終回應。
RAG的好處:
- 無需重新訓練即可訪問最新和領域特定的信息。
- 提高AI生成內容的準確性和相關性。
有效使用生成式AI工具
要有效使用這些工具:
- 理解工具的能力:知道工具能做什麼和不能做什麼。
- 設計清晰具體的提示:應用上述提示工程最佳做法。
- 必要時使用RAG:利用外部數據源以獲得更好結果。
- 評估和迭代:根據輸出優化提示和RAG使用。
- 倫理考慮:確保AI使用負責任且符合倫理,尊重隱私並避免誤導信息。
詳細報告
生成式AI工具的應用和規劃是一個快速發展的領域,特別是在提示(Prompt)和檢索增強生成(RAG)等技術的背景下。以下是關於如何有效使用這些工具的全面分析,涵蓋提示工程和RAG的細節,旨在為用戶提供深入的指導。
提示工程:設計有效輸入的藝術
提示工程是為生成式AI模型設計輸入的過程,以確保輸出符合期望。研究顯示,這是獲得高質量結果的關鍵步驟。以下是從多個來源(如Atlassian、Microsoft和SalesForce)總結的最佳做法,這些做法適用於各種生成式AI工具,如ChatGPT或MidJourney。
- 具體和清晰:提示應明確說明任務,例如“生成一個關於氣候變化的100字社交媒體帖子”。這有助於避免模型誤解用戶意圖。SalesForce的文章強調,清晰的語言能顯著提高回應質量AI Prompts: 6 Tips For Writing Generative AI Prompts。
- 提供上下文:給模型足夠的背景信息,例如“假設你是一名營養師,為糖尿病患者設計一周的飲食計劃”。Atlassian的指南建議,這能讓AI更好地理解場景Best practices for generating AI prompts。
- 使用正確的語調和風格:指定期望的語調,例如“用專業的語氣寫一封業務提案”。這在創意寫作和客戶溝通中尤為重要。
- 迭代和優化:從簡單提示開始,根據模型回應進行調整。例如,如果初次生成結果過於泛泛,可以添加更多細節。MIT Sloan的文章建議,這是提高效率的關鍵Effective Prompts for AI: The Essentials。
- 避免歧義:確保提示沒有多重解釋,例如避免使用模糊詞語如“一些”或“可能”。這能減少不相關的輸出。
- 使用示例:提供具體示例以指導AI,例如“參考這篇博客文章的風格,寫一篇類似的科技評論”。Grammarly的指南強調,這利用了AI的機器學習能力How to Create Effective AI Prompts (With Examples)。
Atlassian的文章進一步提供了額外的技巧,這些技巧在專業文章中被廣泛討論:
- 指定受眾:針對特定受眾定制提示,例如“為初學者寫一個Python編程入門指南”。這能確保輸出更相關。
- 要求解釋過程:使用鏈式思考提示,例如“如果Danny有7個蘋果,Marissa給他8個,但他丟了2個,Danny有多少個蘋果?請解釋過程。”這有助於理解AI的推理。
- 提示鏈接:通過連續的提示構建對話流,例如先問“本周有哪些任務?”然後問“任務1的狀態如何?”這在多步任務中非常有用。
- 包括不該做的內容:指定避免的內容,例如“不要使用技術術語,字數限制在200字內”。這能更精確地控制輸出。
- 為特定任務定制提示:創建並保存常用提示,例如客戶服務回覆模板,節省時間。
- 保持簡潔:使用精確的語言,避免不必要的詞語,以提高效率。
- 設置輸出限制:控制回應長度或格式,例如“生成一個5點清單,總長度不超過300字”。
- 提供背景上下文:包括場景或敘述,例如“假設你正在為一家初創公司設計品牌口號,目標是吸引年輕消費者”。
這些做法的組合能顯著提升生成式AI工具的可用性,特別是在內容創建、數據分析和客戶互動等應用中。
檢索增強生成(RAG):增強AI的知識能力
RAG是一種將信息檢索系統與生成式AI結合的技術,允許模型訪問外部數據源以提供更準確和相關的回應。從多個來源(如Azure AI Search、NVIDIA和IBM)的分析來看,RAG特別適合知識密集型任務。
RAG的工作原理: 根據Wikipedia的解釋,RAG包括四個關鍵階段:
- 索引:將數據轉換為LLM嵌入(數值向量表示),存儲在向量數據庫中,支持非結構化、半結構化或結構化數據(如知識圖譜)。這一步確保數據可檢索。
- 檢索:根據用戶查詢選擇相關文檔,使用各種方法依賴於索引類型,例如基於向量的相似性搜索。
- 增強:將檢索的信息通過提示工程納入模型,例如將相關文檔附加到提示中。2023年的新實現包括查詢擴展、記憶和從先前檢索中自我改進。
- 生成:LLM使用增強後的提示生成最終輸出,可能包括重新排序、上下文選擇和微調以改善結果。
AWS的解釋進一步指出,RAG使LLM能夠參考權威知識庫,而無需重新訓練模型What is Retrieval-Augmented Generation (RAG)。
RAG的改進和挑戰:
- 編碼器改進:使用密集/稀疏向量提升文本編碼,例如更快點積、近似最近鄰搜索、中心點搜索、後期交互和混合向量(結合密集和稀疏,如BM25、SPLADE、DRAGON)。
- 檢索器中心改進:通過逆向Cloze任務預訓練、進展式數據增強(Dragon採樣困難負樣本)、監督訓練最小化KL-散度以及重新排序提升檢索質量。
- 語言模型改進:Retro設計實現與25倍小網絡的相似困惑度;Retro++是可重現版本,包含上下文RAG。訓練成本高,因需從頭開始。
- 分塊策略:包括固定長度帶重疊、基於語法的(例如使用spaCy、NLTK的句子)、基於文件格式的(例如代碼函數、HTML表、PDF,使用Unstructured、Langchain)。
- 知識圖譜:將文檔轉換為知識圖譜,向量化子圖進行檢索(GraphRAG);結構有助於相關事實檢索,混合文本搜索可緩解遺漏事實。
RAG的好處:
- 允許LLM使用領域特定和更新的信息,超越靜態訓練數據。例如,為聊天機器人提供內部公司數據訪問,或僅從權威來源提供事實信息。
- 成本效益高,無需重新訓練模型即可保持相關性和準確性。IBM的研究強調,這對企業內部知識庫特別有用What is retrieval-augmented generation (RAG)?。
挑戰:
- 當外部數據源很大時,檢索可能變慢。
- RAG不完全解決LLM的挑戰,如幻覺(hallucination),仍需用戶審查輸出。
有效使用生成式AI工具的實踐
要有效使用生成式AI工具,特別是涉及提示和RAG的工具,需結合上述知識進行以下步驟:
- 理解工具的能力:了解生成式AI工具的局限性和強項。例如,某些工具可能不支援RAG,或在創意寫作中表現更好。Harvard的指南建議,這是使用AI的首要步驟Getting started with prompts for text-based Generative AI tools。
- 設計清晰具體的提示:應用提示工程最佳做法,例如從Atlassian的指南中學習,確保提示清晰、提供上下文並使用示例Best practices for generating AI prompts。
- 必要時使用RAG:當任務需要最新或特定領域信息時,啟用RAG。例如,在醫療聊天機器人中,RAG可訪問最新的研究論文。NVIDIA的博客強調,這能顯著提升模型的可靠性What Is Retrieval-Augmented Generation aka RAG。
- 評估和迭代:檢查AI的輸出,根據需要優化提示或RAG配置。例如,如果回應不夠準確,可以調整檢索數據源或添加更多上下文。
- 倫理考慮:確保AI使用負責任,尊重隱私,避免傳播誤導信息。Harvard的指南提醒用戶審查AI生成內容以防止不準確或冒犯性輸出Getting started with prompts for text-based Generative AI tools。
綜合分析與意外發現
除了預期的提示工程和RAG細節,還發現了一些意外但相關的信息。例如,Atlassian提到提示鏈接(prompt chaining)能構建對話流,這在多步任務中非常有用,但可能不為普通用戶所知Best practices for generating AI prompts。此外,RAG的知識圖譜應用(GraphRAG)顯示了結構化數據在檢索中的潛力,這可能對企業數據管理有重大影響Retrieval-augmented generation。
這些發現強調了生成式AI工具的靈活性,特別是在結合提示工程和RAG時,能夠適應從創意內容到知識密集型任務的廣泛應用。
表格:提示工程最佳做法
以下表格總結了提示工程的關鍵技巧,基於Atlassian的指南:

表格:RAG的關鍵階段和改進
以下表格概述RAG的工作階段和主要改進,基於Wikipedia和NVIDIA的內容:

這些表格提供了結構化的視角,有助於用戶理解和應用提示工程與RAG。
結論
總之,善用生成式AI工具需要結合提示工程的精細設計和RAG的知識增強能力。通過理解工具能力、優化提示和必要時整合外部數據,用戶可以最大化這些工具的潛力,特別是在內容創建、知識管理和客戶互動等領域。倫理考慮和持續迭代是確保長期成功的關鍵。
關鍵引用:
- 从 Atlassian 生成 AI 提示的最佳实践
- 来自 Microsoft 的提示的艺术
- 专家指南:生成式 AI 提示 Hatchworks 实现最高效率
- AI 提示制作艺术:OpenAI 社区爱好者综合指南
- 为 Promptitude 的增强内容制作有效的 AI 提示
- 有效的 AI 提示:麻省理工学院斯隆商学院的要点
- AI 提示:从 Salesforce 编写生成式 AI 提示的 6 个技巧
- 哈佛大学 IT 部门提供的基于文本的生成式 AI 工具提示入门
- 如何使用 Grammarly 的示例创建有效的 AI 提示
- 来自 Microsoft Learn 的 RAG 和生成式 AI Azure AI 搜索
- 什么是 AWS 的检索增强生成 RAG 解释
- 什么是 NVIDIA 博客中的 Retrieval-Augmented Generation 又名 RAG
- 从 Prompt Engineering Guide 中检索 Augmented Generation RAG
- 什么是 IBM 研究院的检索增强一代 RAG
- 什么是 Cohesity Glossary 中的检索增强生成
- RAG GenAI 为什么检索增强生成是 K2view 生成式 AI 的关键
- 什么是 IBM 的 RAG Retrieval Augmented Generation
- 来自 Wikipedia 的检索增强生成
- 什么是检索增强生成,它对生成式 AI 有什么作用,来自 GitHub 博客