AI說書 - 從0開始 - 609 | 第十九章額外閱讀

更新 發佈閱讀 4 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。


我們首先定義了 F-AGI (Functional Artificial General Intelligence),描述其在封閉生態系統中完成特定實際任務的能力。接著,實驗從驗證數據集中下載了三張圖像 (簡單、困難、非常困難),這些圖像中包含汽車,目的是尋找方法在模擬輔助駕駛 AI 代理的情境下,識別非常困難的圖像中的車輛。我們使用了 HuggingGPT,它是一個創新的系統,能以 ChatGPT 作為控制器來處理輸入、選擇模型、執行任務並生成結果。雖然展示了 HuggingGPT 能分析的圖像以及系統的局限性,但仍未能完全解決問題。於是,我們構建了 CustomGPT,一個定製的跨平台鏈式建模系統。儘管 Google Cloud Vision 提供了有價值的見解,但它也未能在霧夜中的汽車圖像中清晰識別車輛,HuggingGPT 在這種情況下也面臨了類似的挑戰。問題最終透過跨平台鏈式模型方法解決:將 Google Cloud Vision 的輸出提交給 ChatGPT 分析處理。這次,ChatGPT 成功識別了霧夜中的汽車,並提供了適合輔助駕駛車輛的駕駛員訊息。


AI說書 - 從0開始 - 581 | 第十九章前言AI說書 - 從0開始 - 608 | Midjourney 與 Runway Gen-2 串接,我們完成書籍:Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024 第十九章說明。


以下附上參考項目:


以下附上額外閱讀項目:

  • Yongliang Shen, Kaitao Song, Xu Tan, Dongsheng Li, Weiming Lu, Yueting Zhuang, 2023, HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face: https://arxiv.org/abs/2303.17580
留言
avatar-img
Learn AI 不 BI
249會員
1.1K內容數
這裡將提供: AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹,一起在未來AI的世界擁抱AI技術,不BI。
Learn AI 不 BI的其他內容
2026/02/05
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 607 | Midjourney 與 Runway Gen-2 串接 的圖片,將其匯入 Runway Gen-2 並使用 Promp
Thumbnail
2026/02/05
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 AI說書 - 從0開始 - 607 | Midjourney 與 Runway Gen-2 串接 的圖片,將其匯入 Runway Gen-2 並使用 Promp
Thumbnail
2026/02/04
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 首先先從 Midjourney 產出圖片,可透過以下程式下載: !curl -L https://raw.githubusercontent.com/Denis205
Thumbnail
2026/02/04
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 首先先從 Midjourney 產出圖片,可透過以下程式下載: !curl -L https://raw.githubusercontent.com/Denis205
Thumbnail
2026/02/03
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 整理目前手上有的素材: AI說書 - 從0開始 - 598 | CustomGPT 前言 AI說書 - 從0開始 - 599 | Google Cloud Visi
Thumbnail
2026/02/03
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 整理目前手上有的素材: AI說書 - 從0開始 - 598 | CustomGPT 前言 AI說書 - 從0開始 - 599 | Google Cloud Visi
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
厭倦了手動複製貼上提示詞?本文介紹如何運用「多任務複合型提示詞架構」,結合「注入式模組」與「調度邏輯」,在 Gemini 或 ChatGPT 中建立一人 AI 公司,大幅提升工作效率。文章詳述了模組化指令、Agent Orchestrator 的設計、角色混亂防護技巧,以及跨平臺協作的 ...
Thumbnail
厭倦了手動複製貼上提示詞?本文介紹如何運用「多任務複合型提示詞架構」,結合「注入式模組」與「調度邏輯」,在 Gemini 或 ChatGPT 中建立一人 AI 公司,大幅提升工作效率。文章詳述了模組化指令、Agent Orchestrator 的設計、角色混亂防護技巧,以及跨平臺協作的 ...
Thumbnail
本文介紹如何運用 Nano Banana Pro (Gemini) 的強大自然語言處理能力,建立一套自動化的 AI 繪圖提示詞產生機制。作者透過定義提示詞架構、建立風格資料庫、以及運用逆向工程,將 AI 從單純的繪圖工具,轉變為能自主生成精美插圖的「提示詞工程師」,大幅提升內容製作效率。
Thumbnail
本文介紹如何運用 Nano Banana Pro (Gemini) 的強大自然語言處理能力,建立一套自動化的 AI 繪圖提示詞產生機制。作者透過定義提示詞架構、建立風格資料庫、以及運用逆向工程,將 AI 從單純的繪圖工具,轉變為能自主生成精美插圖的「提示詞工程師」,大幅提升內容製作效率。
Thumbnail
💬 那種被時代拋下的窒息感 上週五晚上,我在台中的一間居酒屋,和幾位老朋友聚餐。 大家原本還在抱怨最近蛋價又漲了、房貸利率升息讓每個月的寬限期變得岌岌可危,突然間,做行銷設計的朋友阿豪,默默地把手機遞給我們看。螢幕上是一張精美絕倫的活動海報,光影細膩,構圖大膽。 「這是我請那個新來的實習生做
Thumbnail
💬 那種被時代拋下的窒息感 上週五晚上,我在台中的一間居酒屋,和幾位老朋友聚餐。 大家原本還在抱怨最近蛋價又漲了、房貸利率升息讓每個月的寬限期變得岌岌可危,突然間,做行銷設計的朋友阿豪,默默地把手機遞給我們看。螢幕上是一張精美絕倫的活動海報,光影細膩,構圖大膽。 「這是我請那個新來的實習生做
Thumbnail
你是否覺得與 AI 對話總是辭不達意?本文將分享一套「科技通靈」的實踐儀式,拆解四個關鍵步驟,教你如何超越單純的提示詞詠唱。這不只是一篇教學,而是一場心態的轉變,引導你從操作者蛻變為能與 AI 共同創造、真正「賦靈」的數位鍊金術士。
Thumbnail
你是否覺得與 AI 對話總是辭不達意?本文將分享一套「科技通靈」的實踐儀式,拆解四個關鍵步驟,教你如何超越單純的提示詞詠唱。這不只是一篇教學,而是一場心態的轉變,引導你從操作者蛻變為能與 AI 共同創造、真正「賦靈」的數位鍊金術士。
Thumbnail
這場講座將帶領你逐步入門生成式AI,從認識AI到實際應用,包含五大提問技巧、圖像生成實戰、工作流應用案例、真實經驗分享以及講師自身的轉變經驗,讓你輕鬆學會使用AI提升生活和工作效率。
Thumbnail
這場講座將帶領你逐步入門生成式AI,從認識AI到實際應用,包含五大提問技巧、圖像生成實戰、工作流應用案例、真實經驗分享以及講師自身的轉變經驗,讓你輕鬆學會使用AI提升生活和工作效率。
Thumbnail
這份 AI 學習路線圖,從 Prompt Engineering 到全自動 AI 應用開發,循序漸進,適合各個背景的人學習。
Thumbnail
這份 AI 學習路線圖,從 Prompt Engineering 到全自動 AI 應用開發,循序漸進,適合各個背景的人學習。
Thumbnail
善用SCENE模型,提升AI回覆的創意和專業度!SCENE模型包含五個元素:Story(場景設定)、Context(背景資訊)、Expert(專業角色)、Need(具體需求)、Emotion(情感元素)。透過設定這些元素,讓AI更瞭解你的需求,產生更貼近你預期的結果。
Thumbnail
善用SCENE模型,提升AI回覆的創意和專業度!SCENE模型包含五個元素:Story(場景設定)、Context(背景資訊)、Expert(專業角色)、Need(具體需求)、Emotion(情感元素)。透過設定這些元素,讓AI更瞭解你的需求,產生更貼近你預期的結果。
Thumbnail
利用 Stable Diffusion 每日免費的十個 Credits 練習 AI 繪圖詠唱 (Prompt Engineering)
Thumbnail
利用 Stable Diffusion 每日免費的十個 Credits 練習 AI 繪圖詠唱 (Prompt Engineering)
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News