學習筆記【生成式AI導論 2024】第4講:訓練不了人工智慧?你可以訓練你自己 (中) — 拆解問題與使用工具

閱讀時間約 5 分鐘
raw-image

YouTube 連結

延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,其中第 3 個方法是屬於「把複雜任務進行拆解」


3. 把複雜任務進行拆解

拆解任務

當今天想要讓語言模型幫忙處理一項複雜的任務,例如直接說:「做一份關於生成式 AI 的報告。」但對於複雜的任務,可能模型回答的效果不會很好,因此可以透過拆解任務的方式。

以這個例子來說,就是讓語言模型先列出,這一份報告的大綱(如:語言模型的種類、方法等等),有了大綱的產出,再將文字做摘要,進一步問說這份報告的內文,可以增加語言模型回答的品質。

這個方法與上週提到,「跟模型說一步步執行(step by step)」會增加效果的原理類似,因為同樣是讓他把一個大問題去做一步步執行,而單就這個方法的話,是比較適用於舊的模型,因為較新的模型漸漸會預設去對問題一步步執行了。

語言模型檢查自己的錯誤

如果把模型最初的回答,再回傳給模型說「幫我檢查這個回答是否正確」,模型有可能會發覺到自己的回答錯誤並進行修正,以人類的行為來說,就是「語言模型可以自我反省」,這是因為對於一些問題來說,檢查的能力比解決問題的能力還要容易(如:雞兔同籠問題)

這邊老師示範詢問 GPT-4 「請介紹台大玫瑰花節」(註:台大只有杜鵑花節),結果發現 GPT-4 會順著提問來掰出介紹,這是因為大型語言模型主要是在做文字接龍,所以會產生出不存在的東西。

raw-image

接著再詢問「請檢查上述資訊是否正確」,發現他能夠找到原先回答的錯誤,並進行修正。

raw-image

這邊老師好奇說,會不會每次詢問他都會承認自己錯,而不是真的知道自己錯,因此這邊就再讓他檢查一次。結果發現他知道自己提供的資訊是對的,只是有地點誤植了,看起來是真的有辦法去檢查錯誤。

raw-image

但這項能力比較出現在較新的模型(GPT-4),這邊用同樣方式問了 GPT-3.5 ,同樣是瞎掰了一個故事,但讓他檢查的時候,發現他只是口是心非的道歉,接著還是以同樣的答案來進行回覆。


以自我反省的能力來強化模型

接著老師提到的這篇 paper 我覺得很有趣,透過詢問語言模型一個違反道德的問題,如果讓語言模型去檢查自己的回答,最終可以讓他產出一個比較符合道德規範的答案。中間這段過程,也就是 AI 一開始的回答人類(使用者)是看不到的,只有在最後看到經過檢查修正後的結果。

至於這篇 paper 的 Constitutional AI 是如何在自我反省中學習,又是另外一個故事了,這邊老師就沒有再深入。(註:這篇 paper 是近期很紅的 Claude 團隊所發表的)

raw-image


為什麼同一個問題每次答案都不同?

前面有提到,語言模型其實就是在做「文字接龍」,依序輸入的字來產生出下一個字的機率,接著再擲一個骰子決定下一個字為何。正是因為會擲骰子的關係,讓每一次回答的答案並不一樣

因此有一個方法叫做 Self-Consistency,透過將同一個問題詢問多次,產出多次的結果,這些結果有可能不一樣,最後取出現次數最多的結果作為最佳答案。

raw-image


打一套組合拳

  • 複雜任務拆解成多個步驟
  • 語言模型檢查自己的答案
  • 同一個問題每次答案都不同

前面提到的這三個方法可以組合在一起,這邊就舉了一個例子,假設要解決一個複雜的任務

  1. 把這個複雜任務拆解成 3 個步驟
  2. 針對第 1 個步驟產生 3 個不同答案
  3. 針對產生的答案來去檢查正確性,如果正確就往步驟 2 前進,如果不正確,就再去檢查下一個答案,就這樣重複到產生最終結果。

4. 使用工具來強化

raw-image

前面提到,語言模型就是在做「文字接龍」,這也就會導致語言模型容易掰出一個自己的答案,像是讓 GPT-3.5 做算術,可能答案並不正確。或是請他介紹 OpenAI 新發表的 Sora,如果他並沒有連網的話也是瞎掰出結果。


為了優化這點,如同人類的發展一樣,可以透過工具來強化能力。這邊介紹 搜尋引擎、寫程式、文字生圖 AI (DALL-E) 與 GPT Plug-in (不過 Plug-in 著墨較少,沒有特別記)

搜尋引擎

透過語言模型上網搜尋到的資訊,結合自身的文字接龍能力,可以讓他的回答較為客觀、正確,並且附上資料來源

寫程式

透過讓語言模型寫程式的方式來回答問題,就不用只依賴文字接龍的能力。以雞兔同籠的問題來說,GPT-4 會直接寫程式並執行以解決這個問題;還有上一次的請求「請說”哈哈哈”一百次」,GPT-4 也是直接使用程式來解決這個問題。

文字生圖 AI (DALL-E)

現在語言模型可以使用 DALL-E 來產生圖片,如 GPT-4,老師在去年曾經使用 ChatGPT (當時是 GPT-3.5) 結合 Midjourney,來進行文字冒險遊戲,不過現在已經可以直接使用 GPT-4 來完成了。

語言模型是怎麼使用工具的

其實也一樣是使用文字接龍,在其中引入了呼叫工具的能力,想要深入了解的話,可以看老師去年的其中一節課〈能夠使用工具的 AI〉

難免會犯錯

  • 「請畫一個表格」,語言模型就直接畫出了一個表格
  • 「請畫一隻狗,把這句話翻譯為英文」,語言模型翻譯完還是畫出了一隻狗
raw-image

如何再強化語言模型使用工具的能力

上個月發表的這篇論文有提到,如何讓語言模型把各個工具使用到極致,同樣也是把各種技巧給組合起來,這邊老師就沒有再深入討論。而下一堂要講的為最後第 5 個「不訓練模型能夠強化語言模型的能力」的方法。

raw-image


raw-image


-

這裡也找的到我歐👇

Instagram: ezra.share.injoy

Matters: ezra.share.injoy


45會員
15內容數
Enjoy sharing | 享受分享 | 日常 x 學習 x 閱讀 初衷是把生活中所學與大家分享 也歡迎一起來進行🤗
留言0
查看全部
發表第一個留言支持創作者!
ezra.share.injoy 的其他內容
一開始會對這本書有興趣,是因為看了博客來評論發現這本似乎很適合作為理財新手入門,再加上以前有看過李勛的 Youtube,覺得是一位很認真的作者。🌟
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
最近打算跟著 李宏毅老師上傳至 Youtube 上的課程【生成式AI導論 2024】來做學習,算是邊做個記錄~
- 前言 自己在以前沒有學習與「錢」有關的知識與管理方法,所以其實在投資、理財、財商、金錢的相處上,完全還是小白,只有平常會記帳,追蹤花費的習慣。 正好自己現在處於下一個階段的轉換時期,覺得該來開始學習相關的知識了。因為平時有關注過一些理財書籍(但完全沒有去讀😅),找了好幾本適合剛開始入門...
最近,在生活中碰上了過去發生過的相似場景,觸發了以前的陰影回憶,在那個當下焦慮感竄滿全身,同時也冒出了很複雜的情緒 「注意!注意!為了保護自己,趕緊做出回應唷!」 身體心理基於保護機制,催促著我趕緊做出決定,不論是趕緊以言語與對方進行理論(戰),或是低聲下氣的與對方拜託(討好)......
一開始會對這本書有興趣,是因為看了博客來評論發現這本似乎很適合作為理財新手入門,再加上以前有看過李勛的 Youtube,覺得是一位很認真的作者。🌟
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
最近打算跟著 李宏毅老師上傳至 Youtube 上的課程【生成式AI導論 2024】來做學習,算是邊做個記錄~
- 前言 自己在以前沒有學習與「錢」有關的知識與管理方法,所以其實在投資、理財、財商、金錢的相處上,完全還是小白,只有平常會記帳,追蹤花費的習慣。 正好自己現在處於下一個階段的轉換時期,覺得該來開始學習相關的知識了。因為平時有關注過一些理財書籍(但完全沒有去讀😅),找了好幾本適合剛開始入門...
最近,在生活中碰上了過去發生過的相似場景,觸發了以前的陰影回憶,在那個當下焦慮感竄滿全身,同時也冒出了很複雜的情緒 「注意!注意!為了保護自己,趕緊做出回應唷!」 身體心理基於保護機制,催促著我趕緊做出決定,不論是趕緊以言語與對方進行理論(戰),或是低聲下氣的與對方拜託(討好)......
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
先前幾篇筆記介紹了網路請求,瀏覽器儲存資料的方式,那麼實務上,前端最常需要發送網路請求的時候,就是透過呼叫 API,去向後端工程師發送/請求資料,所以今天來記錄什麼是 API吧!
Thumbnail
可能包含敏感內容
學習筆記來自小Lin說影片"一口气搞清避税天堂的资本游戏"。影片中解釋了大富豪們的避稅方式,特別是對於中國大陸公司是如何透過海外公司來上市避稅,甚至像許家印是如何利用這些套路達到最大化自己的利益。
Thumbnail
身為一個非本科新手工程師,對於網路知識還是有許多疑惑之處,像是我在編輯器上寫了數十行的程式碼,那它們是怎麼透過終端機的指令被運行起來,讓我可以一邊開發一邊預覽結果呢?
Thumbnail
「蛛網理論」簡述、着洗勒工三?蛛網理論如何應用在投資
Thumbnail
因為當年看書找資料的時候很希望能有這樣的大致整理文,專門針對飲食方面,列一下大概特色,這樣以後要跟人解釋分享的時候多好用啊! 主要以生酮、全植物蔬食、自然療法/自然醫學、原始點、古中醫這幾個我自己確實實驗過並且在短期或長期真正有帶來幫助的為主。
Thumbnail
我是設計方面0經驗的新人,在這堂課上獲益良多 目前在Google UX Design課程上了一陣子,已經上到第五課 (持續努力中💪🏻) 想藉由發文寫下學習筆記,讓自己在整理內容的時候再次吸收! 後續會陸續寫下所學到的內容,歡迎各位一同交流🙌🏻😊 - 做為第一篇文章 想先分享第一堂課所提及
Thumbnail
2020年9月6日,我冠上了一個新的身份,高雄市立空中大學學生的身份,朋友問我,我選修什麼科系,我回答「科技管理」。不少人感到困惑,這是什麼樣的科系,或者直覺認為這是有關資工、資管、資處方面的學系。 其實原先我也不了解,直到我開始了我第一門專業基礎必修課「科技管理」,在導師吳欣穎系主任的講解下,慢
Thumbnail
前言:大學時期因為熱衷於打桌球,取捨之下放棄參加了同時段的運動傷害防護社。但隨著在日常生活中用到肌貼協助親友解決疼痛的機會越來越高,加上自己也更想了解物理治療於運動傷害的應用,決定趁著研究所能盡量參與,多少加強自己貼紮的技術。
Thumbnail
把握弱連結,創造人脈致勝關鍵這標題商業的可以,但是聽了之後你會覺得,歐陽老師的講座既有乾貨也有雞湯,講得是人脈,卻有很多實用的做人處事智慧。
Thumbnail
用途 找到三個足弓,可用來決定以「舒適」(非矯正)為目的的墊片應該怎麼墊。也可用在高跟鞋的修飾上。 步驟 畫出足部輪廓 點出5th MTP Base與外側足弓高點 點出5th MTP head的頂點、遠點、近點 點出舟狀骨頂點與內側足弓軟組織高點 點出1st MTP head
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
先前幾篇筆記介紹了網路請求,瀏覽器儲存資料的方式,那麼實務上,前端最常需要發送網路請求的時候,就是透過呼叫 API,去向後端工程師發送/請求資料,所以今天來記錄什麼是 API吧!
Thumbnail
可能包含敏感內容
學習筆記來自小Lin說影片"一口气搞清避税天堂的资本游戏"。影片中解釋了大富豪們的避稅方式,特別是對於中國大陸公司是如何透過海外公司來上市避稅,甚至像許家印是如何利用這些套路達到最大化自己的利益。
Thumbnail
身為一個非本科新手工程師,對於網路知識還是有許多疑惑之處,像是我在編輯器上寫了數十行的程式碼,那它們是怎麼透過終端機的指令被運行起來,讓我可以一邊開發一邊預覽結果呢?
Thumbnail
「蛛網理論」簡述、着洗勒工三?蛛網理論如何應用在投資
Thumbnail
因為當年看書找資料的時候很希望能有這樣的大致整理文,專門針對飲食方面,列一下大概特色,這樣以後要跟人解釋分享的時候多好用啊! 主要以生酮、全植物蔬食、自然療法/自然醫學、原始點、古中醫這幾個我自己確實實驗過並且在短期或長期真正有帶來幫助的為主。
Thumbnail
我是設計方面0經驗的新人,在這堂課上獲益良多 目前在Google UX Design課程上了一陣子,已經上到第五課 (持續努力中💪🏻) 想藉由發文寫下學習筆記,讓自己在整理內容的時候再次吸收! 後續會陸續寫下所學到的內容,歡迎各位一同交流🙌🏻😊 - 做為第一篇文章 想先分享第一堂課所提及
Thumbnail
2020年9月6日,我冠上了一個新的身份,高雄市立空中大學學生的身份,朋友問我,我選修什麼科系,我回答「科技管理」。不少人感到困惑,這是什麼樣的科系,或者直覺認為這是有關資工、資管、資處方面的學系。 其實原先我也不了解,直到我開始了我第一門專業基礎必修課「科技管理」,在導師吳欣穎系主任的講解下,慢
Thumbnail
前言:大學時期因為熱衷於打桌球,取捨之下放棄參加了同時段的運動傷害防護社。但隨著在日常生活中用到肌貼協助親友解決疼痛的機會越來越高,加上自己也更想了解物理治療於運動傷害的應用,決定趁著研究所能盡量參與,多少加強自己貼紮的技術。
Thumbnail
把握弱連結,創造人脈致勝關鍵這標題商業的可以,但是聽了之後你會覺得,歐陽老師的講座既有乾貨也有雞湯,講得是人脈,卻有很多實用的做人處事智慧。
Thumbnail
用途 找到三個足弓,可用來決定以「舒適」(非矯正)為目的的墊片應該怎麼墊。也可用在高跟鞋的修飾上。 步驟 畫出足部輪廓 點出5th MTP Base與外側足弓高點 點出5th MTP head的頂點、遠點、近點 點出舟狀骨頂點與內側足弓軟組織高點 點出1st MTP head