學習筆記【生成式AI導論 2024】第4講:訓練不了人工智慧?你可以訓練你自己 (中) — 拆解問題與使用工具

更新於 發佈於 閱讀時間約 5 分鐘
raw-image

YouTube 連結

延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,其中第 3 個方法是屬於「把複雜任務進行拆解」


3. 把複雜任務進行拆解

拆解任務

當今天想要讓語言模型幫忙處理一項複雜的任務,例如直接說:「做一份關於生成式 AI 的報告。」但對於複雜的任務,可能模型回答的效果不會很好,因此可以透過拆解任務的方式。

以這個例子來說,就是讓語言模型先列出,這一份報告的大綱(如:語言模型的種類、方法等等),有了大綱的產出,再將文字做摘要,進一步問說這份報告的內文,可以增加語言模型回答的品質。

這個方法與上週提到,「跟模型說一步步執行(step by step)」會增加效果的原理類似,因為同樣是讓他把一個大問題去做一步步執行,而單就這個方法的話,是比較適用於舊的模型,因為較新的模型漸漸會預設去對問題一步步執行了。

語言模型檢查自己的錯誤

如果把模型最初的回答,再回傳給模型說「幫我檢查這個回答是否正確」,模型有可能會發覺到自己的回答錯誤並進行修正,以人類的行為來說,就是「語言模型可以自我反省」,這是因為對於一些問題來說,檢查的能力比解決問題的能力還要容易(如:雞兔同籠問題)

這邊老師示範詢問 GPT-4 「請介紹台大玫瑰花節」(註:台大只有杜鵑花節),結果發現 GPT-4 會順著提問來掰出介紹,這是因為大型語言模型主要是在做文字接龍,所以會產生出不存在的東西。

raw-image

接著再詢問「請檢查上述資訊是否正確」,發現他能夠找到原先回答的錯誤,並進行修正。

raw-image

這邊老師好奇說,會不會每次詢問他都會承認自己錯,而不是真的知道自己錯,因此這邊就再讓他檢查一次。結果發現他知道自己提供的資訊是對的,只是有地點誤植了,看起來是真的有辦法去檢查錯誤。

raw-image

但這項能力比較出現在較新的模型(GPT-4),這邊用同樣方式問了 GPT-3.5 ,同樣是瞎掰了一個故事,但讓他檢查的時候,發現他只是口是心非的道歉,接著還是以同樣的答案來進行回覆。


以自我反省的能力來強化模型

接著老師提到的這篇 paper 我覺得很有趣,透過詢問語言模型一個違反道德的問題,如果讓語言模型去檢查自己的回答,最終可以讓他產出一個比較符合道德規範的答案。中間這段過程,也就是 AI 一開始的回答人類(使用者)是看不到的,只有在最後看到經過檢查修正後的結果。

至於這篇 paper 的 Constitutional AI 是如何在自我反省中學習,又是另外一個故事了,這邊老師就沒有再深入。(註:這篇 paper 是近期很紅的 Claude 團隊所發表的)

raw-image


為什麼同一個問題每次答案都不同?

前面有提到,語言模型其實就是在做「文字接龍」,依序輸入的字來產生出下一個字的機率,接著再擲一個骰子決定下一個字為何。正是因為會擲骰子的關係,讓每一次回答的答案並不一樣

因此有一個方法叫做 Self-Consistency,透過將同一個問題詢問多次,產出多次的結果,這些結果有可能不一樣,最後取出現次數最多的結果作為最佳答案。

raw-image


打一套組合拳

  • 複雜任務拆解成多個步驟
  • 語言模型檢查自己的答案
  • 同一個問題每次答案都不同

前面提到的這三個方法可以組合在一起,這邊就舉了一個例子,假設要解決一個複雜的任務

  1. 把這個複雜任務拆解成 3 個步驟
  2. 針對第 1 個步驟產生 3 個不同答案
  3. 針對產生的答案來去檢查正確性,如果正確就往步驟 2 前進,如果不正確,就再去檢查下一個答案,就這樣重複到產生最終結果。

4. 使用工具來強化

raw-image

前面提到,語言模型就是在做「文字接龍」,這也就會導致語言模型容易掰出一個自己的答案,像是讓 GPT-3.5 做算術,可能答案並不正確。或是請他介紹 OpenAI 新發表的 Sora,如果他並沒有連網的話也是瞎掰出結果。


為了優化這點,如同人類的發展一樣,可以透過工具來強化能力。這邊介紹 搜尋引擎、寫程式、文字生圖 AI (DALL-E) 與 GPT Plug-in (不過 Plug-in 著墨較少,沒有特別記)

搜尋引擎

透過語言模型上網搜尋到的資訊,結合自身的文字接龍能力,可以讓他的回答較為客觀、正確,並且附上資料來源

寫程式

透過讓語言模型寫程式的方式來回答問題,就不用只依賴文字接龍的能力。以雞兔同籠的問題來說,GPT-4 會直接寫程式並執行以解決這個問題;還有上一次的請求「請說”哈哈哈”一百次」,GPT-4 也是直接使用程式來解決這個問題。

文字生圖 AI (DALL-E)

現在語言模型可以使用 DALL-E 來產生圖片,如 GPT-4,老師在去年曾經使用 ChatGPT (當時是 GPT-3.5) 結合 Midjourney,來進行文字冒險遊戲,不過現在已經可以直接使用 GPT-4 來完成了。

語言模型是怎麼使用工具的

其實也一樣是使用文字接龍,在其中引入了呼叫工具的能力,想要深入了解的話,可以看老師去年的其中一節課〈能夠使用工具的 AI〉

難免會犯錯

  • 「請畫一個表格」,語言模型就直接畫出了一個表格
  • 「請畫一隻狗,把這句話翻譯為英文」,語言模型翻譯完還是畫出了一隻狗
raw-image

如何再強化語言模型使用工具的能力

上個月發表的這篇論文有提到,如何讓語言模型把各個工具使用到極致,同樣也是把各種技巧給組合起來,這邊老師就沒有再深入討論。而下一堂要講的為最後第 5 個「不訓練模型能夠強化語言模型的能力」的方法。

raw-image


raw-image


-

這裡也找的到我歐👇

Instagram: ezra.share.injoy

Matters: ezra.share.injoy


留言
avatar-img
留言分享你的想法!
媗日-avatar-img
2024/03/10
話說Chatgpt 的DALLE 的限制是真的多🥲
Ezra-avatar-img
發文者
2024/03/13
媗日 歐!真的是實際用才知道的細節呢~
avatar-img
ezra.share.injoy
45會員
15內容數
Enjoy sharing | 享受分享 | 日常 x 學習 x 閱讀 初衷是把生活中所學與大家分享 也歡迎一起來進行🤗
ezra.share.injoy的其他內容
2024/06/04
前言 大家好!久違的出現了!度過了8週的新訓啦~~~~~~🥳️ 隨之而來的是4天的結訓假,因為第一週的六日沒有回家放假,所以補在第8週鑑測結束後 不得不說會開始覺得自由的時間很珍貴 🥹 這 8 週以來的放假,有一半以上都是放洞八假 (六早上 8:00 放) 然後日下午 5:30 就要上專車
Thumbnail
2024/06/04
前言 大家好!久違的出現了!度過了8週的新訓啦~~~~~~🥳️ 隨之而來的是4天的結訓假,因為第一週的六日沒有回家放假,所以補在第8週鑑測結束後 不得不說會開始覺得自由的時間很珍貴 🥹 這 8 週以來的放假,有一半以上都是放洞八假 (六早上 8:00 放) 然後日下午 5:30 就要上專車
Thumbnail
2024/04/07
先來點播一首 IU 的《Love poem》 因為星期六演唱會,IU 特別排這首當最後安可曲 唱之前脫掉帽子,並在唱完後用字幕表示對花蓮地震的哀悼 雖然沒有去到現場,但看到消息的時候,打開 YouTube 邊聽真的覺得眼淚快出來🥹
Thumbnail
2024/04/07
先來點播一首 IU 的《Love poem》 因為星期六演唱會,IU 特別排這首當最後安可曲 唱之前脫掉帽子,並在唱完後用字幕表示對花蓮地震的哀悼 雖然沒有去到現場,但看到消息的時候,打開 YouTube 邊聽真的覺得眼淚快出來🥹
Thumbnail
2024/04/04
再花一篇來分享《思考101》給我的啟發,主要來說說「確認偏誤」:一則看醫生的故事,「壞」血,與我的想法。
Thumbnail
2024/04/04
再花一篇來分享《思考101》給我的啟發,主要來說說「確認偏誤」:一則看醫生的故事,「壞」血,與我的想法。
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
今天想分享我怎麼「用 AI 設計一個學習流程」讓我把學過的英文「真的記住,並且用的出來」 這個過程不會碰到複雜的技術,只需結合基本學習原則,還有在ChatGPT用中文下指令的技巧,這樣你以後就可以針對自己想學的英文內容設計客製化的學習材料跟練習過程喔!
Thumbnail
今天想分享我怎麼「用 AI 設計一個學習流程」讓我把學過的英文「真的記住,並且用的出來」 這個過程不會碰到複雜的技術,只需結合基本學習原則,還有在ChatGPT用中文下指令的技巧,這樣你以後就可以針對自己想學的英文內容設計客製化的學習材料跟練習過程喔!
Thumbnail
因為 AI 領域的技術不斷地迭代更新,無法避免的是需要一直去追新的技術 並且需要在一個有限的時間學會,或是實作應用導入到專案之中。 那我覺得在學習新技術可通過以下步驟: 1. 找一個讀得懂的教學資源 現在網路上的教學資源很多,或是書籍的資源也很豐富, 同時也有像是 chatgpt 的 AI
Thumbnail
因為 AI 領域的技術不斷地迭代更新,無法避免的是需要一直去追新的技術 並且需要在一個有限的時間學會,或是實作應用導入到專案之中。 那我覺得在學習新技術可通過以下步驟: 1. 找一個讀得懂的教學資源 現在網路上的教學資源很多,或是書籍的資源也很豐富, 同時也有像是 chatgpt 的 AI
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
為了充分發揮AI的潛力,我們必須深入瞭解其運作模式和思考邏輯,並學會與AI對話的技巧。《ChatGPT提問課,做個懂AI的高效工作者》這本書提供了豐富的實例,讓讀者更容易學會如何提出精準的問題,並享有提問課程的閱讀回饋。這對於想成為懂AI的高效工作者的人來說,是一本值得一看的書。
Thumbnail
為了充分發揮AI的潛力,我們必須深入瞭解其運作模式和思考邏輯,並學會與AI對話的技巧。《ChatGPT提問課,做個懂AI的高效工作者》這本書提供了豐富的實例,讓讀者更容易學會如何提出精準的問題,並享有提問課程的閱讀回饋。這對於想成為懂AI的高效工作者的人來說,是一本值得一看的書。
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及更多即將面世的AI運用場景,每一項都將對人類社會產生重大的影響。 很多人已經感受到AI的威力,並且因為擔心工作不保,所以急著參加各種AI教學課程。 我會以大量使用、測試AI的經驗,輔以田野調查的結果,詳細解釋為什麼在這個時代「AI教學課程」(幾乎)沒用。
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及更多即將面世的AI運用場景,每一項都將對人類社會產生重大的影響。 很多人已經感受到AI的威力,並且因為擔心工作不保,所以急著參加各種AI教學課程。 我會以大量使用、測試AI的經驗,輔以田野調查的結果,詳細解釋為什麼在這個時代「AI教學課程」(幾乎)沒用。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News