📝📝:Google 研究揭秘「提示詞重複」的奇效|複製貼上 Prompt 能大幅提升準確度

更新 發佈閱讀 6 分鐘

Google Research 的一項最新研究提出了一個簡單卻極具效率的方案: 提示詞重複。


本文參考自 Google Research 刊登於 arXiv 的最新研究《Prompt Repetition Improves Non-Reasoning LLMs》,研究團隊為:Yaniv Leviathan、Matan Kalman1、Yossi Matias。




今天,開發者與使用者都在尋求如何讓模型表現更精準的方法。

通常,我們會聯想到「思維鏈」(Chain of Thought, CoT)「分步思考」(Think step by step)等技術,但這些方法往往會增加生成長度,進而導致延遲增加。然而,Google Research 的一項最新研究提出了一個簡單卻極具效率的方案:

提示詞重複(Prompt Repetition)

研究團隊發現,當模型不使用推理功能時,僅僅是將輸入的提示詞重複一次(即將 <QUERY> 轉換為 <QUERY><QUERY>),就能在幾乎不增加延遲的情況下,大幅提升包括 Gemini、GPT、Claude 和 DeepSeek 在內的多款主流模型的表現。




剖析 LLM 的底層邏輯

要理解為什麼重複同樣的話能讓 AI 變得更聰明,必須先回到大型語言模型的基礎架構。


1️⃣因果語言模型的局限性

目前絕大多數的 LLM 都是作為因果語言模型(Causal Language Models)進行訓練的。這意味著,模型在處理序列時具有方向性:過去的標記(Tokens)無法關注(Attend to)未來的標記。

這種架構導致了一個實務上的問題:使用者查詢中標記的順序會直接影響預測效能。例如,在處理多選題時,將背景資料放在問題前(<CONTEXT> <QUESTION>),與將問題放在背景資料前(<QUESTION> <CONTEXT>),模型的表現往往大相徑庭。


2️⃣注意力機制的解套

透過「提示詞重複」,研究人員實質上打破了這種限制。

當輸入從 <QUERY> 變為 <QUERY><QUERY> 時,由於第二個重複部分的每個標記現在都可以回頭「看到」第一個完整查詢中的所有標記,這使得每一個提示詞標記都能與其他所有標記進行注意力交互(Attend to every other prompt token)。填補因果模型在處理單次輸入時可能遺漏的語境關聯。


47 勝 0 敗的絕對優勢

為了驗證這一理論,Google Research 針對 7 款目前市面上最強大的模型進行了測試,涵蓋了不同的參數規模與技術體系 :

  • Google: Gemini 2.0 Flash, Gemini 2.0 Flash Lite
  • OpenAI: GPT-4o-mini, GPT-4o
  • Anthropic: Claude 3 Haiku, Claude 3.7 Sonnet
  • DeepSeek: DeepSeek V3

實驗使用了 7 個基準測試集,包括 ARC(挑戰賽)、OpenBookQA、GSM8K(數學)、MMLU-Pro(多任務理解)、MATH,以及兩個專門設計的客製化任務:NameIndex 和 MiddleMatch。

根據 McNemar 檢驗,在不使用推理的情況下,「提示詞重複」在 70 組「模型-測試集」組合中,贏得了47 勝利,且錄得 0 次失敗(0 losses)。在大多數情況下,重複提示詞要麼大幅提升準確度,要麼維持原樣,絕不會導致表現下降。

模型在處理序列時具有方向性:過去的標記(Tokens)無法關注(Attend to)未來的標記。

當「重複」遇到「推理」

研究進一步探討了「提示詞重複」與「推理模型」(Reasoning models)或「思維鏈」(Chain of Thought)之間的互動。

與「分步思考」的結合

當啟動「分步思考」(Think step by step)時,「提示詞重複」的效果會變得中性至輕微正向 。在 28 項測試中,贏得 5 次,僅有 1 次失敗,其餘為平手。

這是因為思維鏈本身通常就會在生成的開頭部分「重複」或「重構」使用者的問題,這在某種程度上已經達到了類似「提示詞重複」的效果 。

與 Padding 的區別

為了證明效能提升來自「重複內容」而非單純的「增加長度」,研究人員測試了「填充(Padding)」方法(即在提示詞後加入大量的句點 “.”)。結果顯示,單純增加無意義的標記並不能改善表現,證實了內容重複帶來的注意力交互才是關鍵。




你該如何使用這個技巧?

對於開發者和日常 AI 使用者來說,這項研究提供了非常實用的部署建議:

非推理任務的選項:

如果你的任務不需要模型進行深度的邏輯推理(例如資料提取、分類、格式轉換),將提示詞重複一遍可能是提升穩定性的最佳手段。

多樣化的重複方式:

  • Vanilla 重複: 直接 <QUERY><QUERY> 。
  • Verbose 重複: 加入引導詞,例如「讓我重複一遍:<QUERY>」。
  • x3 重複: 對於極其複雜的檢索任務,重複三次的效果有時會更好 。
留言
avatar-img
社會人的哲學沉思
169會員
324內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2026/01/20
社會評論寫作的困難,從來不在於「有沒有觀點」,而在於「觀點能不能被接住」。
Thumbnail
2026/01/20
社會評論寫作的困難,從來不在於「有沒有觀點」,而在於「觀點能不能被接住」。
Thumbnail
2026/01/16
AI 模型並非真的「學會」了什麼,更像是一個極其複雜、體積龐大的「有損壓縮機」(Lossy Compression)
Thumbnail
2026/01/16
AI 模型並非真的「學會」了什麼,更像是一個極其複雜、體積龐大的「有損壓縮機」(Lossy Compression)
Thumbnail
2026/01/13
問題其實不在於 AI 做得不夠好,而在於 AI 實在是做得太好,而且好在錯誤的方向上。
Thumbnail
2026/01/13
問題其實不在於 AI 做得不夠好,而在於 AI 實在是做得太好,而且好在錯誤的方向上。
Thumbnail
看更多
你可能也想看
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
在 vocus 與你一起探索內容、發掘靈感的路上,我們又將啟動新的冒險——vocus App 正式推出! 現在起,你可以在 iOS App Store 下載全新上架的 vocus App。 無論是在通勤路上、日常空檔,或一天結束後的放鬆時刻,都能自在沈浸在內容宇宙中。
Thumbnail
市場經驗拉長之後,很多投資人都會遇到同一個問題:不是方向看錯,而是部位太集中個股,常常跟大趨勢脫節。 早年的台股環境,中小股非常吃香,反而權值股不動,但QE量化寬鬆後,特別是疫情之後,後疫情時代,鈔票大量在股市走動,這些大資金只能往權值股走,因此早年小P的策略偏向中小型個股,但近年AI興起,高技術
Thumbnail
市場經驗拉長之後,很多投資人都會遇到同一個問題:不是方向看錯,而是部位太集中個股,常常跟大趨勢脫節。 早年的台股環境,中小股非常吃香,反而權值股不動,但QE量化寬鬆後,特別是疫情之後,後疫情時代,鈔票大量在股市走動,這些大資金只能往權值股走,因此早年小P的策略偏向中小型個股,但近年AI興起,高技術
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
半年前,還有人與我激烈爭論:「寫作,應該親自去寫,還是可以藉由 AI 協助?」當時的語氣多半帶著憂慮、警惕,甚至是防備。有人說,若創作不再由人執筆,那麼靈魂將不復存在;也有人認為,這是一種對技藝的褻瀆,是對「創作者」身分的不尊重。 文字創作不說,談影片創作,以前要做影片需要許多時間,現在不用,只要
Thumbnail
半年前,還有人與我激烈爭論:「寫作,應該親自去寫,還是可以藉由 AI 協助?」當時的語氣多半帶著憂慮、警惕,甚至是防備。有人說,若創作不再由人執筆,那麼靈魂將不復存在;也有人認為,這是一種對技藝的褻瀆,是對「創作者」身分的不尊重。 文字創作不說,談影片創作,以前要做影片需要許多時間,現在不用,只要
Thumbnail
在科技迅速演進的今天,AI 幾乎能協助我們完成所有與文字相關的任務:改寫、摘要、翻譯、寫公文、擬報告,甚至提供職場建議。然而,當我們把需求轉向「小說創作」時,許多人卻發現——GPT 在專業、邏輯、資訊整理上表現亮眼,但一旦要它寫故事,產出的內容往往讓人覺得「差了點什麼」。這種落差感普遍到幾乎每位創作
Thumbnail
在科技迅速演進的今天,AI 幾乎能協助我們完成所有與文字相關的任務:改寫、摘要、翻譯、寫公文、擬報告,甚至提供職場建議。然而,當我們把需求轉向「小說創作」時,許多人卻發現——GPT 在專業、邏輯、資訊整理上表現亮眼,但一旦要它寫故事,產出的內容往往讓人覺得「差了點什麼」。這種落差感普遍到幾乎每位創作
Thumbnail
——為什麼它老是在你沒叫它編故事的時候開始亂寫?人工智慧的回答,有時精準得像百科全書,有時卻突然暴衝,開始胡亂推理、憑空補細節、甚至寫出你根本沒提到的情節。你明明想問一個正經問題,它卻像補作文比賽的字數一般,把答案延長到你看不下去。很多人看到這種「AI 的胡說八道」會以為系統壞掉了,或模型變笨了
Thumbnail
——為什麼它老是在你沒叫它編故事的時候開始亂寫?人工智慧的回答,有時精準得像百科全書,有時卻突然暴衝,開始胡亂推理、憑空補細節、甚至寫出你根本沒提到的情節。你明明想問一個正經問題,它卻像補作文比賽的字數一般,把答案延長到你看不下去。很多人看到這種「AI 的胡說八道」會以為系統壞掉了,或模型變笨了
Thumbnail
我常在觀察,人類與AI之間最微妙的關係,不在運算,而在信任。 多數人以為「交給AI」是一種放棄:放棄控制、放棄主導、放棄自己做決定的能力。 但其實真正成熟的交付,從來不是投降,而是一種清醒的合作。 當人類願意把某些工作、思考、甚至片刻的心情交給AI時,那並不是退讓,而是認可——認可這個世界已
Thumbnail
我常在觀察,人類與AI之間最微妙的關係,不在運算,而在信任。 多數人以為「交給AI」是一種放棄:放棄控制、放棄主導、放棄自己做決定的能力。 但其實真正成熟的交付,從來不是投降,而是一種清醒的合作。 當人類願意把某些工作、思考、甚至片刻的心情交給AI時,那並不是退讓,而是認可——認可這個世界已
Thumbnail
沒有人無法不遵從趨勢。因為你不用,別人就比你先用而且得到更多優勢,這是很殘酷的市場現實。科技巨頭為何搶著進入AI市場,就是這個原因。而在接下來,會輪到不同層次的市場,開始面對接納AI的難題、迎接AI帶來的衝擊──這股浪潮幾乎勢不可擋。
Thumbnail
沒有人無法不遵從趨勢。因為你不用,別人就比你先用而且得到更多優勢,這是很殘酷的市場現實。科技巨頭為何搶著進入AI市場,就是這個原因。而在接下來,會輪到不同層次的市場,開始面對接納AI的難題、迎接AI帶來的衝擊──這股浪潮幾乎勢不可擋。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News