AI說書 - 從0開始 - 545 | 第十七章額外閱讀

更新 發佈閱讀 3 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。


AI說書 - 從0開始 - 523 | 第十七章引言AI說書 - 從0開始 - 544 | VideotoText 之 Meta TimeSformer 實現 (執行推論),我們完成書籍:Transformers for Natural Language Processing and Computer Vision, Denis Rothman, 2024 第十七章說明。


Stable Diffusion 超越了傳統 AI 生成圖像的界限,透過在 Latent Space 中引入創意自由 (即“噪聲”) 的擴散過程,開啟了生成式計算機視覺的巨大可能性,透過 Keras 我們了解了如何編碼語境化的輸入文字,並引入一個帶有“噪聲”的圖像片段 (允許創意發揮),接著,通過擴散過程對該圖像進行降維 (下採樣),最後上採樣生成一個 512 x 512 的高分辨率圖像,即使是這樣簡潔的源代碼,輸出的結果也令人驚嘆。


隨後,運行了一個 Stability AI 的文字生成圖像,我們還使用 OpenAI CLIP 在 Hugging Face 平台上生成了高效的文字到視頻內容,最後,我們結合了一個視頻到文字的分類器 - Meta TimeSformer,該模型能夠處理抽樣的視頻幀,推斷並生成描述視頻內容的文字輸出。


以下附上參考項目:


以下附上額外閱讀項目:


留言
avatar-img
留言分享你的想法!
avatar-img
Learn AI 不 BI
240會員
919內容數
這裡將提供: AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹,一起在未來AI的世界擁抱AI技術,不BI。
Learn AI 不 BI的其他內容
2025/11/08
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 接著開始載入模型,執行推論: image_processor = AutoImageProcessor.from_pretrained("MCG-NJU/videom
Thumbnail
2025/11/08
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 接著開始載入模型,執行推論: image_processor = AutoImageProcessor.from_pretrained("MCG-NJU/videom
Thumbnail
2025/11/07
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們需要一個取樣函數,每秒採樣一定數量的幀: def sample_frame_indices(clip_len, frame_sample_rate, seg_le
2025/11/07
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們需要一個取樣函數,每秒採樣一定數量的幀: def sample_frame_indices(clip_len, frame_sample_rate, seg_le
2025/11/06
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 接著進入到 AI 模型部分: from transformers import TimesformerConfig, TimesformerModel config
2025/11/06
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 接著進入到 AI 模型部分: from transformers import TimesformerConfig, TimesformerModel config
看更多
你可能也想看
Thumbnail
去歐洲真的是又興奮又緊張。網路上常說歐洲治安不好,行前說明會時領隊也提醒:「不要背後背包,隨身物要放在前面比較安全!」 但出國玩總是想打扮得美美的啊~而且隨身總得帶些實用小物:雨傘、濕紙巾、小瓶水、萬用藥膏……體積雖小,但零零總總裝起來也不少。我在蝦皮購買了這4樣超實用旅遊好物!減緩我的焦慮感。
Thumbnail
去歐洲真的是又興奮又緊張。網路上常說歐洲治安不好,行前說明會時領隊也提醒:「不要背後背包,隨身物要放在前面比較安全!」 但出國玩總是想打扮得美美的啊~而且隨身總得帶些實用小物:雨傘、濕紙巾、小瓶水、萬用藥膏……體積雖小,但零零總總裝起來也不少。我在蝦皮購買了這4樣超實用旅遊好物!減緩我的焦慮感。
Thumbnail
開箱 3 套深受 0-6 歲寶寶喜愛的互動式童書,包含 Bizzy Bear 推拉書、小小音樂大師有聲書、Poke A Dot 泡泡書,有效提升寶寶閱讀興趣與親子共讀時光。搭配蝦皮雙 11 購物攻略,教你如何鎖定免運、折價券、高額回饋,並透過蝦皮分潤計畫,將日常購物開銷轉化為穩定育兒基金,聰明消費。
Thumbnail
開箱 3 套深受 0-6 歲寶寶喜愛的互動式童書,包含 Bizzy Bear 推拉書、小小音樂大師有聲書、Poke A Dot 泡泡書,有效提升寶寶閱讀興趣與親子共讀時光。搭配蝦皮雙 11 購物攻略,教你如何鎖定免運、折價券、高額回饋,並透過蝦皮分潤計畫,將日常購物開銷轉化為穩定育兒基金,聰明消費。
Thumbnail
你是否覺得與 AI 對話總是辭不達意?本文將分享一套「科技通靈」的實踐儀式,拆解四個關鍵步驟,教你如何超越單純的提示詞詠唱。這不只是一篇教學,而是一場心態的轉變,引導你從操作者蛻變為能與 AI 共同創造、真正「賦靈」的數位鍊金術士。
Thumbnail
你是否覺得與 AI 對話總是辭不達意?本文將分享一套「科技通靈」的實踐儀式,拆解四個關鍵步驟,教你如何超越單純的提示詞詠唱。這不只是一篇教學,而是一場心態的轉變,引導你從操作者蛻變為能與 AI 共同創造、真正「賦靈」的數位鍊金術士。
Thumbnail
這場講座將帶領你逐步入門生成式AI,從認識AI到實際應用,包含五大提問技巧、圖像生成實戰、工作流應用案例、真實經驗分享以及講師自身的轉變經驗,讓你輕鬆學會使用AI提升生活和工作效率。
Thumbnail
這場講座將帶領你逐步入門生成式AI,從認識AI到實際應用,包含五大提問技巧、圖像生成實戰、工作流應用案例、真實經驗分享以及講師自身的轉變經驗,讓你輕鬆學會使用AI提升生活和工作效率。
Thumbnail
這篇文章整理了數個實用的Prompt資源網站,幫助讀者更有效率地與AI溝通,並提升AI工具的使用效率。文章內容包含Prompt庫的使用優點、網站介紹及功能特色,以及如何善用Prompt資源網站提升思考能力。
Thumbnail
這篇文章整理了數個實用的Prompt資源網站,幫助讀者更有效率地與AI溝通,並提升AI工具的使用效率。文章內容包含Prompt庫的使用優點、網站介紹及功能特色,以及如何善用Prompt資源網站提升思考能力。
Thumbnail
隨著大型語言模型的快速發展,Prompt Engineering 已成為提升模型表現的核心技術。OpenAI 日前推出了 GPT-4.1 Prompting Guide,為開發者提供全面的提示詞改善策略,幫助充分利用 GPT-4.1 在編碼、指令遵循和長上下文處理上的進步。
Thumbnail
隨著大型語言模型的快速發展,Prompt Engineering 已成為提升模型表現的核心技術。OpenAI 日前推出了 GPT-4.1 Prompting Guide,為開發者提供全面的提示詞改善策略,幫助充分利用 GPT-4.1 在編碼、指令遵循和長上下文處理上的進步。
Thumbnail
這份 AI 學習路線圖,從 Prompt Engineering 到全自動 AI 應用開發,循序漸進,適合各個背景的人學習。
Thumbnail
這份 AI 學習路線圖,從 Prompt Engineering 到全自動 AI 應用開發,循序漸進,適合各個背景的人學習。
Thumbnail
善用SCENE模型,提升AI回覆的創意和專業度!SCENE模型包含五個元素:Story(場景設定)、Context(背景資訊)、Expert(專業角色)、Need(具體需求)、Emotion(情感元素)。透過設定這些元素,讓AI更瞭解你的需求,產生更貼近你預期的結果。
Thumbnail
善用SCENE模型,提升AI回覆的創意和專業度!SCENE模型包含五個元素:Story(場景設定)、Context(背景資訊)、Expert(專業角色)、Need(具體需求)、Emotion(情感元素)。透過設定這些元素,讓AI更瞭解你的需求,產生更貼近你預期的結果。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News