AI說書 - 從0開始 - 503 | DALL-E 模型架構

2025/08/24 更新2025/08/24 發佈閱讀 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

DALL-E 與 CLIP 一樣，是一種多模態模型，CLIP 處理文本-圖像對，而 DALL-E 對文本和圖像 Token 的處理方式有所不同，DALL-E 1 的輸入為 1280 個 Token 的單一文本和圖像流，其中 256 個 Token 用於文本，1024 個 Token 用於圖像，DALL-E 的名字來源於薩爾瓦多·達利和皮克斯的《瓦力》，DALL-E 的用途是輸入文本提示並生成圖像。DALL-E 必須先學會如何通過文本生成圖像，此 Transformer 使用包含文本-圖像對的數據集，從文本描述生成圖像，我們將探討 DALL-E 的基本架構，以了解模型如何運作：

Learn AI 不 BI三分鐘學AI (3)AI從0開始-十六章

留言

留言分享你的想法！

Learn AI 不 BI

240會員

917內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2025/08/23

AI說書 - 從0開始 - 502 | CLIP 模型架構

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。要視覺化 CLIP 模型的架構，可以使用程式碼： model 結果摘錄為：

2025/08/23

AI說書 - 從0開始 - 502 | CLIP 模型架構

2025/08/22

AI說書 - 從0開始 - 501 | CLIP 程式之推論部分

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。輸入資料特徵計算： with torch.no_grad(): image_features = model.encode_image(image_input)

2025/08/22

AI說書 - 從0開始 - 501 | CLIP 程式之推論部分

2025/08/21

AI說書 - 從0開始 - 500 | CLIP 程式之輸入資料部分

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。首先載入模型： device = "cuda" if torch.cuda.is_available() else "cpu" model, preprocess

2025/08/21

AI說書 - 從0開始 - 500 | CLIP 程式之輸入資料部分

#AI 的其他內容

Google Stitch：生成 UI 介面設計，加速產品原型開發與協作

張紹宏

Gemini Pro 學生方案怎麼一直申請失敗? 原來是少做了「這件事」!

你可能也想看

Oren

咖啡控的0元回血實驗：加入蝦皮分潤計畫後，我的1111購物車能回本嗎？

這篇文章是一位咖啡愛好者分享他在雙11前的購物規劃。他不僅推薦了自己喜愛的咖啡豆品牌（如李董、音樂家系列）與手沖器材，還分享了實用的挑豆技巧。同時，他記錄了一項個人實驗：剛加入「蝦皮分潤計畫」，想測試透過分享真心喜愛的商品，是否能為自己的咖啡開銷「回血」。

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

Oren

咖啡控的0元回血實驗：加入蝦皮分潤計畫後，我的1111購物車能回本嗎？

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

吃喝玩樂皮丹媽媽(๑´ڡ`๑)

完整出國行李清單｜出國旅行必備物品＆蝦皮購物攻略

出國旅行時，準備充分的行李能讓旅程更加輕鬆愉快！本文整理了大人旅行的全方位行李清單，從護照、信用卡到各種旅行好物一應俱全。特別是防盜小物、瞬熱熱水壺和過濾蓮蓬頭等必備單品，讓你的旅行更舒適、安全。此外，還介紹了蝦皮分潤計劃，讓你在購物的同時還能輕鬆賺取分潤，無論是準備行李還是購物分享，都是不錯的選擇

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05

吃喝玩樂皮丹媽媽(๑´ڡ`๑)

完整出國行李清單｜出國旅行必備物品＆蝦皮購物攻略

#蝦皮分潤計畫#蝦皮1111#蝦皮免運

2025/11/05