學習筆記【生成式AI導論 2024】第4講：訓練不了人工智慧？你可以訓練你自己 (中) — 拆解問題與使用工具

Ezra

更新於 2024/03/10發佈於 2024/03/10閱讀時間約 5 分鐘

YouTube 連結

延續上週提到的，「有哪些不訓練模型的情況下，能夠強化語言模型的能力」，其中第 3 個方法是屬於「把複雜任務進行拆解」

3. 把複雜任務進行拆解

拆解任務

當今天想要讓語言模型幫忙處理一項複雜的任務，例如直接說：「做一份關於生成式 AI 的報告。」但對於複雜的任務，可能模型回答的效果不會很好，因此可以透過拆解任務的方式。

以這個例子來說，就是讓語言模型先列出，這一份報告的大綱（如：語言模型的種類、方法等等），有了大綱的產出，再將文字做摘要，進一步問說這份報告的內文，可以增加語言模型回答的品質。

這個方法與上週提到，「跟模型說一步步執行(step by step)」會增加效果的原理類似，因為同樣是讓他把一個大問題去做一步步執行，而單就這個方法的話，是比較適用於舊的模型，因為較新的模型漸漸會預設去對問題一步步執行了。

語言模型檢查自己的錯誤

如果把模型最初的回答，再回傳給模型說「幫我檢查這個回答是否正確」，模型有可能會發覺到自己的回答錯誤並進行修正，以人類的行為來說，就是「語言模型可以自我反省」，這是因為對於一些問題來說，檢查的能力比解決問題的能力還要容易（如：雞兔同籠問題）

這邊老師示範詢問 GPT-4 「請介紹台大玫瑰花節」（註：台大只有杜鵑花節），結果發現 GPT-4 會順著提問來掰出介紹，這是因為大型語言模型主要是在做文字接龍，所以會產生出不存在的東西。

接著再詢問「請檢查上述資訊是否正確」，發現他能夠找到原先回答的錯誤，並進行修正。

這邊老師好奇說，會不會每次詢問他都會承認自己錯，而不是真的知道自己錯，因此這邊就再讓他檢查一次。結果發現他知道自己提供的資訊是對的，只是有地點誤植了，看起來是真的有辦法去檢查錯誤。

但這項能力比較出現在較新的模型（GPT-4），這邊用同樣方式問了 GPT-3.5 ，同樣是瞎掰了一個故事，但讓他檢查的時候，發現他只是口是心非的道歉，接著還是以同樣的答案來進行回覆。

以自我反省的能力來強化模型

接著老師提到的這篇 paper 我覺得很有趣，透過詢問語言模型一個違反道德的問題，如果讓語言模型去檢查自己的回答，最終可以讓他產出一個比較符合道德規範的答案。中間這段過程，也就是 AI 一開始的回答人類（使用者）是看不到的，只有在最後看到經過檢查修正後的結果。

至於這篇 paper 的 Constitutional AI 是如何在自我反省中學習，又是另外一個故事了，這邊老師就沒有再深入。（註：這篇 paper 是近期很紅的 Claude 團隊所發表的）

為什麼同一個問題每次答案都不同?

前面有提到，語言模型其實就是在做「文字接龍」，依序輸入的字來產生出下一個字的機率，接著再擲一個骰子決定下一個字為何。正是因為會擲骰子的關係，讓每一次回答的答案並不一樣

因此有一個方法叫做 Self-Consistency，透過將同一個問題詢問多次，產出多次的結果，這些結果有可能不一樣，最後取出現次數最多的結果作為最佳答案。

打一套組合拳

複雜任務拆解成多個步驟
語言模型檢查自己的答案
同一個問題每次答案都不同

前面提到的這三個方法可以組合在一起，這邊就舉了一個例子，假設要解決一個複雜的任務

把這個複雜任務拆解成 3 個步驟
針對第 1 個步驟產生 3 個不同答案
針對產生的答案來去檢查正確性，如果正確就往步驟 2 前進，如果不正確，就再去檢查下一個答案，就這樣重複到產生最終結果。

4. 使用工具來強化

前面提到，語言模型就是在做「文字接龍」，這也就會導致語言模型容易掰出一個自己的答案，像是讓 GPT-3.5 做算術，可能答案並不正確。或是請他介紹 OpenAI 新發表的 Sora，如果他並沒有連網的話也是瞎掰出結果。

為了優化這點，如同人類的發展一樣，可以透過工具來強化能力。這邊介紹搜尋引擎、寫程式、文字生圖 AI (DALL-E) 與 GPT Plug-in （不過 Plug-in 著墨較少，沒有特別記）

搜尋引擎

透過語言模型上網搜尋到的資訊，結合自身的文字接龍能力，可以讓他的回答較為客觀、正確，並且附上資料來源

寫程式

透過讓語言模型寫程式的方式來回答問題，就不用只依賴文字接龍的能力。以雞兔同籠的問題來說，GPT-4 會直接寫程式並執行以解決這個問題；還有上一次的請求「請說”哈哈哈”一百次」，GPT-4 也是直接使用程式來解決這個問題。

文字生圖 AI (DALL-E)

現在語言模型可以使用 DALL-E 來產生圖片，如 GPT-4，老師在去年曾經使用 ChatGPT (當時是 GPT-3.5) 結合 Midjourney，來進行文字冒險遊戲，不過現在已經可以直接使用 GPT-4 來完成了。

語言模型是怎麼使用工具的

其實也一樣是使用文字接龍，在其中引入了呼叫工具的能力，想要深入了解的話，可以看老師去年的其中一節課〈能夠使用工具的 AI〉

難免會犯錯

「請畫一個表格」，語言模型就直接畫出了一個表格
「請畫一隻狗，把這句話翻譯為英文」，語言模型翻譯完還是畫出了一隻狗

如何再強化語言模型使用工具的能力

上個月發表的這篇論文有提到，如何讓語言模型把各個工具使用到極致，同樣也是把各種技巧給組合起來，這邊老師就沒有再深入討論。而下一堂要講的為最後第 5 個「不訓練模型能夠強化語言模型的能力」的方法。

這裡也找的到我歐👇

Instagram: ezra.share.injoy

Matters: ezra.share.injoy

45會員

15內容數

Enjoy sharing | 享受分享 | 日常 x 學習 x 閱讀初衷是把生活中所學與大家分享也歡迎一起來進行🤗

留言4

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

ezra.share.injoy 的其他內容

《25歲存到100萬》閱讀筆記

一開始會對這本書有興趣，是因為看了博客來評論發現這本似乎很適合作為理財新手入門，再加上以前有看過李勛的 Youtube，覺得是一位很認真的作者。🌟

#投資理財 #閱讀 #筆記

閒聊 & 書籍分享《放過那個卡關的自己，先出門走走》&《走路的人，河正宇》

睡前來簡單分享與紀錄~

#閒聊 #書籍分享 #走路

學習筆記【生成式AI導論 2024】第3講：訓練不了人工智慧？你可以訓練你自己 (上) — 神奇咒語與提供更多資訊

這一節課說明，如何透過改變給模型的指示或咒語（prompt），來得到不同的結果。如果直接說結論的話會是，在今天語言模型的能力之下，我們只要交代清楚任務就好，可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD

#AI #生成式AI #學習

簡介 & 筆記【生成式AI導論 2024】第2講：今日的生成式人工智慧厲害在哪裡？從「工具」變為「工具人」

最近打算跟著李宏毅老師上傳至 Youtube 上的課程【生成式AI導論 2024】來做學習，算是邊做個記錄~

#AI #生成式AI #YouTube

《有錢人想的和你不一樣》閱讀心得

- 前言自己在以前沒有學習與「錢」有關的知識與管理方法，所以其實在投資、理財、財商、金錢的相處上，完全還是小白，只有平常會記帳，追蹤花費的習慣。正好自己現在處於下一個階段的轉換時期，覺得該來開始學習相關的知識了。因為平時有關注過一些理財書籍（但完全沒有去讀😅），找了好幾本適合剛開始入門...

#有錢人想的和你不一樣 #閱讀 #筆記

《親密恐懼》閱讀心得

最近，在生活中碰上了過去發生過的相似場景，觸發了以前的陰影回憶，在那個當下焦慮感竄滿全身，同時也冒出了很複雜的情緒「注意！注意！為了保護自己，趕緊做出回應唷！」身體心理基於保護機制，催促著我趕緊做出決定，不論是趕緊以言語與對方進行理論（戰），或是低聲下氣的與對方拜託（討好）......

#閱讀 #筆記 #心得

《25歲存到100萬》閱讀筆記

#投資理財 #閱讀 #筆記

閒聊 & 書籍分享《放過那個卡關的自己，先出門走走》&《走路的人，河正宇》

睡前來簡單分享與紀錄~

#閒聊 #書籍分享 #走路

學習筆記【生成式AI導論 2024】第3講：訓練不了人工智慧？你可以訓練你自己 (上) — 神奇咒語與提供更多資訊

#AI #生成式AI #學習

簡介 & 筆記【生成式AI導論 2024】第2講：今日的生成式人工智慧厲害在哪裡？從「工具」變為「工具人」

最近打算跟著李宏毅老師上傳至 Youtube 上的課程【生成式AI導論 2024】來做學習，算是邊做個記錄~

#閱讀 #筆記 #心得

你可能也想看

Google News 追蹤

凱茜女孩的沙龍

2024/07/26

英文老是看過就忘？對 AI 下這3個指令幫你把英文牢牢記住

分享我怎麼「用 AI 設計一個學習流程」讓我把學過的英文「真的記住，並且用的出來」這個過程不會碰到複雜的技術，只需結合基本學習原則，還有在ChatGPT用中文下指令的技巧這樣你以後就可以針對自己想學的英文內容設計客製化的學習材料跟練習過程喔！

因為 AI 領域的技術不斷地迭代更新，無法避免的是需要一直去追新的技術並且需要在一個有限的時間學會，或是實作應用導入到專案之中。那我覺得在學習新技術可通過以下步驟: 1. 找一個讀得懂的教學資源現在網路上的教學資源很多，或是書籍的資源也很豐富，同時也有像是 chatgpt 的 AI

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。繼 AI說書 - 從0開始 - 82 與 xxx ，我們談論了衡量 AI 模型的方式，那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時，需要

#AI #ai #PromptEngineering

莎姐的矽谷茶棧

2024/06/14

你開始使用AI了嗎？

最新的AI趨勢讓人眼花撩亂，不知要如何開始學習？本文介紹了作者對AI的使用和體驗，以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具，可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心，不停止學習，並提出了對健康生活和開心生活的祝福。

#ChatGPT #學習 #AI

《專家事業研究室》沙龍

2024/06/09

【新手ＡＩ行銷線上課，簡單快速製文製圖製影片】

#啟發隨想 #新手AI行銷線上課 #銷售頁

每日發車

2024/05/06

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

大語言模型能夠生成文本，因此被認為是生成式人工智慧的一種形式。人工智慧的學科任務，是製作機器，使其能執行需要人類智慧才能執行的任務，例如理解語言，便是模式，做出決策。除了大語言模型，人工智慧也包含了深度學習以及機器學習。機器學習的學科任務，是透過演算法來實踐AI。特別

#大語言模型 #ChatGPT #人工智慧

陳星晴老師-教育斜棟人生

2024/04/23

[附教案及教學影片]運用AI 生成圖片功能，學習描寫文寫作

在學習描寫文的過程中，將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能，教師能夠幫助學生將抽象的描述轉化為具體的圖像。

這個頻道將提供以下服務：深入介紹各種Machine Learning技術深入介紹各種Deep Learning技術深入介紹各種Reinforcement Learning技術深入介紹Probabilistic Graphical Model技術不定時提供讀書筆記讓我們一起在未

#學習 #職場 #AI人工智慧

易樂的沙龍

2024/03/24

加油！以生成式AI 創建，各式各樣客製化精準學習AI BOT！

這篇文章介紹瞭如何利用生成式AI（GenAI）來提高學習效率，包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度，保持學術誠信，適當運用GenAI能大幅提升工作效率。

#學習 #生成式AI #文章

凱茜女孩的沙龍

2024/07/26

英文老是看過就忘？對 AI 下這3個指令幫你把英文牢牢記住

#AI #ai #PromptEngineering

【新手ＡＩ行銷線上課，簡單快速製文製圖製影片】

#啟發隨想 #新手AI行銷線上課 #銷售頁

每日發車

2024/05/06

筆記-曲博談AI模型.群聯-24.05.05

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

#大語言模型 #ChatGPT #人工智慧

陳星晴老師-教育斜棟人生

2024/04/23

[附教案及教學影片]運用AI 生成圖片功能，學習描寫文寫作

在學習描寫文的過程中，將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能，教師能夠幫助學生將抽象的描述轉化為具體的圖像。

加油！以生成式AI 創建，各式各樣客製化精準學習AI BOT！

#學習 #生成式AI #文章