學習筆記【生成式AI導論 2024】第4講：訓練不了人工智慧？你可以訓練你自己 (中) — 拆解問題與使用工具

Ezra

2025/03/09 更新2024/03/10 發佈閱讀 5 分鐘

YouTube 連結

延續上週提到的，「有哪些不訓練模型的情況下，能夠強化語言模型的能力」，其中第 3 個方法是屬於「把複雜任務進行拆解」

3. 把複雜任務進行拆解

拆解任務

當今天想要讓語言模型幫忙處理一項複雜的任務，例如直接說：「做一份關於生成式 AI 的報告。」但對於複雜的任務，可能模型回答的效果不會很好，因此可以透過拆解任務的方式。

以這個例子來說，就是讓語言模型先列出，這一份報告的大綱（如：語言模型的種類、方法等等），有了大綱的產出，再將文字做摘要，進一步問說這份報告的內文，可以增加語言模型回答的品質。

這個方法與上週提到，「跟模型說一步步執行(step by step)」會增加效果的原理類似，因為同樣是讓他把一個大問題去做一步步執行，而單就這個方法的話，是比較適用於舊的模型，因為較新的模型漸漸會預設去對問題一步步執行了。

語言模型檢查自己的錯誤

如果把模型最初的回答，再回傳給模型說「幫我檢查這個回答是否正確」，模型有可能會發覺到自己的回答錯誤並進行修正，以人類的行為來說，就是「語言模型可以自我反省」，這是因為對於一些問題來說，檢查的能力比解決問題的能力還要容易（如：雞兔同籠問題）

這邊老師示範詢問 GPT-4 「請介紹台大玫瑰花節」（註：台大只有杜鵑花節），結果發現 GPT-4 會順著提問來掰出介紹，這是因為大型語言模型主要是在做文字接龍，所以會產生出不存在的東西。

接著再詢問「請檢查上述資訊是否正確」，發現他能夠找到原先回答的錯誤，並進行修正。

這邊老師好奇說，會不會每次詢問他都會承認自己錯，而不是真的知道自己錯，因此這邊就再讓他檢查一次。結果發現他知道自己提供的資訊是對的，只是有地點誤植了，看起來是真的有辦法去檢查錯誤。

但這項能力比較出現在較新的模型（GPT-4），這邊用同樣方式問了 GPT-3.5 ，同樣是瞎掰了一個故事，但讓他檢查的時候，發現他只是口是心非的道歉，接著還是以同樣的答案來進行回覆。

以自我反省的能力來強化模型

接著老師提到的這篇 paper 我覺得很有趣，透過詢問語言模型一個違反道德的問題，如果讓語言模型去檢查自己的回答，最終可以讓他產出一個比較符合道德規範的答案。中間這段過程，也就是 AI 一開始的回答人類（使用者）是看不到的，只有在最後看到經過檢查修正後的結果。

至於這篇 paper 的 Constitutional AI 是如何在自我反省中學習，又是另外一個故事了，這邊老師就沒有再深入。（註：這篇 paper 是近期很紅的 Claude 團隊所發表的）

為什麼同一個問題每次答案都不同?

前面有提到，語言模型其實就是在做「文字接龍」，依序輸入的字來產生出下一個字的機率，接著再擲一個骰子決定下一個字為何。正是因為會擲骰子的關係，讓每一次回答的答案並不一樣

因此有一個方法叫做 Self-Consistency，透過將同一個問題詢問多次，產出多次的結果，這些結果有可能不一樣，最後取出現次數最多的結果作為最佳答案。

打一套組合拳

複雜任務拆解成多個步驟
語言模型檢查自己的答案
同一個問題每次答案都不同

前面提到的這三個方法可以組合在一起，這邊就舉了一個例子，假設要解決一個複雜的任務

把這個複雜任務拆解成 3 個步驟
針對第 1 個步驟產生 3 個不同答案
針對產生的答案來去檢查正確性，如果正確就往步驟 2 前進，如果不正確，就再去檢查下一個答案，就這樣重複到產生最終結果。

4. 使用工具來強化

前面提到，語言模型就是在做「文字接龍」，這也就會導致語言模型容易掰出一個自己的答案，像是讓 GPT-3.5 做算術，可能答案並不正確。或是請他介紹 OpenAI 新發表的 Sora，如果他並沒有連網的話也是瞎掰出結果。

為了優化這點，如同人類的發展一樣，可以透過工具來強化能力。這邊介紹搜尋引擎、寫程式、文字生圖 AI (DALL-E) 與 GPT Plug-in （不過 Plug-in 著墨較少，沒有特別記）

搜尋引擎

透過語言模型上網搜尋到的資訊，結合自身的文字接龍能力，可以讓他的回答較為客觀、正確，並且附上資料來源

寫程式

透過讓語言模型寫程式的方式來回答問題，就不用只依賴文字接龍的能力。以雞兔同籠的問題來說，GPT-4 會直接寫程式並執行以解決這個問題；還有上一次的請求「請說”哈哈哈”一百次」，GPT-4 也是直接使用程式來解決這個問題。

文字生圖 AI (DALL-E)

現在語言模型可以使用 DALL-E 來產生圖片，如 GPT-4，老師在去年曾經使用 ChatGPT (當時是 GPT-3.5) 結合 Midjourney，來進行文字冒險遊戲，不過現在已經可以直接使用 GPT-4 來完成了。

語言模型是怎麼使用工具的

其實也一樣是使用文字接龍，在其中引入了呼叫工具的能力，想要深入了解的話，可以看老師去年的其中一節課〈能夠使用工具的 AI〉

難免會犯錯

「請畫一個表格」，語言模型就直接畫出了一個表格
「請畫一隻狗，把這句話翻譯為英文」，語言模型翻譯完還是畫出了一隻狗

如何再強化語言模型使用工具的能力

上個月發表的這篇論文有提到，如何讓語言模型把各個工具使用到極致，同樣也是把各種技巧給組合起來，這邊老師就沒有再深入討論。而下一堂要講的為最後第 5 個「不訓練模型能夠強化語言模型的能力」的方法。

這裡也找的到我歐👇

Instagram: ezra.share.injoy

Matters: ezra.share.injoy

留言

ezra.share.injoy

47會員

15內容數

Enjoy sharing | 享受分享 | 日常 x 學習 x 閱讀初衷是把生活中所學與大家分享也歡迎一起來進行🤗

ezra.share.injoy的其他內容

2024/06/04

[一日遊] 金瓜石、陰陽海、基隆廟口

前言大家好！久違的出現了！度過了8週的新訓啦~~~~~~🥳️ 隨之而來的是4天的結訓假，因為第一週的六日沒有回家放假，所以補在第8週鑑測結束後不得不說會開始覺得自由的時間很珍貴 🥹 這 8 週以來的放假，有一半以上都是放洞八假 (六早上 8:00 放) 然後日下午 5:30 就要上專車

2024/06/04

[一日遊] 金瓜石、陰陽海、基隆廟口

2024/04/07

與格友們分享近況和…邁向下一階段！要有一段時間不能與大家交流了🙏

先來點播一首 IU 的《Love poem》因為星期六演唱會，IU 特別排這首當最後安可曲唱之前脫掉帽子，並在唱完後用字幕表示對花蓮地震的哀悼雖然沒有去到現場，但看到消息的時候，打開 YouTube 邊聽真的覺得眼淚快出來🥹

2024/04/07

與格友們分享近況和…邁向下一階段！要有一段時間不能與大家交流了🙏

2024/04/04

突破盲點！《思考101》中的確認偏誤

再花一篇來分享《思考101》給我的啟發，主要來說說「確認偏誤」：一則看醫生的故事，「壞」血，與我的想法。

2024/04/04

突破盲點！《思考101》中的確認偏誤

再花一篇來分享《思考101》給我的啟發，主要來說說「確認偏誤」：一則看醫生的故事，「壞」血，與我的想法。

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14