瞬間生圖的SDXL-Turbo有什麼重要性?

閱讀時間約 4 分鐘
raw-image


最近 Stability.Ai 這間公司又發表了一個新的Model 叫做 SDXL Turbo。眾所周知SDXL 對比過去的 SD 1.5 的特性是,Model比較大,不但可以產生構圖較好的AI畫作,也能夠產生較高解析度的圖片。 但是這款SDXL Turbo 主打的確是完全不同的方向,SDXL Turbo主打可以1 step就產生一定品質的圖片 (圖片品質比SDXL甚至SD 1.5還要低),完全是以速度取勝,那麼SDXL Turbo這個技術代表的是怎樣的突破呢? 究竟秒出圖的技術能夠有什麼實際的應用呢? 這就是我們這篇想要探討的。

首先我們還是來看看SDXL Turbo實際上操作的樣子,我們這篇不是教學怎麼使用SDXL Turbo所以不會討論到安裝的部分,實際上使用需要去下載SDXL Turbo的Model,並且推薦使用Comfyui 較為彈性。 能夠做到的狀態,大概就是如下圖

SDXL Turbo Prompt

SDXL Turbo Prompt

雖然Gif檔的解析度不夠高,但是大家是可以看到,隨著我自己一邊改變提示詞(prompt),圖片裡的畫面就會即時更新,為什麼可以做到這樣呢? 因為SDXL Turbo的產圖速度太快了,如果顯卡夠力甚至可以0.1秒就產一張圖,就可以做到一邊改提示詞一邊馬上看到圖片更新。

再來SDXL Turbo本身也能加上導引的Painting node,那麼就能做到底下的效果

SDXL Turbo Painter Node

SDXL Turbo Painter Node

也就是除了提示詞以外,我一邊畫用作導引的圖,右邊的AI生圖也能即時更新。導引圖可以針對顏色,構圖等等的做出導引,可以說是非常有意思的應用。

那麼,究竟AI秒出圖的意義在那邊呢? 這才是我想要探討的議題,粗淺的稍為思考了一下,我想針對幾個情境來思考。

第一個情境是,原本就對於需要產生畫作的工作,這有可能是2D/3D設計師,插畫師,美工排版人員,小編等等。SDXL Turbo 這種秒產圖的能力可以說是有非常直接的貢獻,畢竟你可以在固定其他參數的狀態下,快速的微調你的提示詞,甚至是與ChatGPT一起協做發想提示詞,用超快的速度產出各式各樣不同的圖案,再從滿意的風格/提示詞中選擇大的Model 如SDXL 去產生好的高解析度圖案。 而 SDXL with painter node 也提供了可以有效的控制產出的方式,可以說是讓設計師從簡單的構圖還有色彩馬上就能看到成果,可以讓設計師更為集中精力在如何傳達產品/圖片的精神上。

第二個情境我們就要跳脫"設計師"還有"美工"這個領域了,我們來思考確實需要圖片創作但是卻不是直接與設計相關的部分,能否應用到這個新技術呢? 最直觀馬上可以想到的就是類似Powerpoint 投影片創作的部分,相信很多上班族都看夠了平淡無奇僅僅有文字的投影片吧? 如果說搭配上這樣秒產圖的技術,讓你一邊創作投影片的時候,AI立刻自動替你補上圖片說明,讓你的投影片一看就能理解,那麼是不是有很大的幫助呢?

raw-image

這應該是馬上就能夠實現的,不過我認為這個功能,應該是會由Microsoft Office 的Office copilot 直接實現,而其他所有的設計或是簡報類的軟體,應該都會馬上導入這個技術的。

最後一個我們要探討的,就是跳脫傳統設計領域,且傳統上也不需要圖片的應用領域,那麼這包含什麼領域呢? 其實我覺得這應該才是最有意思且潛力最大的,舉例來說 Meta(Facebook)就有在他們發表的演說裡面提到,將來會將這種繪圖的應用用到類似messenger的即時通訊之中,那麼只要交談的人有意願,AI隨時可以把你們談論到的事物具象化,或是把你的表情即時的產出一個emoji。

另外這樣的技術也能夠應用到譬如電子小說/電子遊戲之中,讓原本只有文字介面的小說/文字型電玩直接變成是圖文並茂(或是理所當然的搭配AI產生的音樂的產品),而在娛樂的範疇或社交網路的範疇,更有無限多的應用,並且讓 content creator 的想像力能夠解放。 ​

最後的想法就是,這樣超快速產圖的科技,會讓Generative AI快速的下放到手機/平板等隨身的設備上面,而這樣可以激盪出怎樣的火花呢? 這就是我們可以持續思考(也應該是潛力無窮的地方了)






技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?
本篇文章是 以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章,並且稍微加上修飾而來的,是一篇相當好的該如何使用AI的引言,分享給各位。 我們學到的就是,只要使用AI,你就會學會如何使用AI。你只需大量使用AI,直到你弄清楚它的優點和缺點,就可以成為你領域的AI應用專家。
本篇文章是翻譯自 AI大神 吳恩達 Andrew Ng 的電子信件,吳恩達是史丹福大學計算機科學系和電氣工程系的客座教授,曾任斯坦福人工智慧實驗室主任。他與達芙妮·科勒一起創建了在線教育平台Coursera。本篇文章吳恩達談到AI與邊緣運算。
本篇文章是筆者近期聽過的一篇非常好的Podcast,為了想要記錄下來於是找了Podcast Note並且配合ChatGPT進行翻譯,想要聽Podcast或是參考原文的請看這邊。 本篇文章從神經心理學上面探討如何增強你的意志力跟監韌性,我覺得非常值得參考,分享給大家。 如何增強你的意志力和堅韌
ChatGPT背後的技術 大型語言模型 是否與我們前面介紹的神經網路相同呢? 答案是不同的,這也是我們想要進一步探討了解的課題。今天會先解釋什麼是語言模型,想要做到的是哪些事情。
今天要介紹的是一款免費好用的AI圖片放大器。 這款AI圖片放大器不但是完全免費的,而且好心人士還編譯了Windows/Linux/MacOS等各種版本,讓大家可以直接一鍵下載安裝,可是說是非常的佛心。
這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?
本篇文章是 以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章,並且稍微加上修飾而來的,是一篇相當好的該如何使用AI的引言,分享給各位。 我們學到的就是,只要使用AI,你就會學會如何使用AI。你只需大量使用AI,直到你弄清楚它的優點和缺點,就可以成為你領域的AI應用專家。
本篇文章是翻譯自 AI大神 吳恩達 Andrew Ng 的電子信件,吳恩達是史丹福大學計算機科學系和電氣工程系的客座教授,曾任斯坦福人工智慧實驗室主任。他與達芙妮·科勒一起創建了在線教育平台Coursera。本篇文章吳恩達談到AI與邊緣運算。
本篇文章是筆者近期聽過的一篇非常好的Podcast,為了想要記錄下來於是找了Podcast Note並且配合ChatGPT進行翻譯,想要聽Podcast或是參考原文的請看這邊。 本篇文章從神經心理學上面探討如何增強你的意志力跟監韌性,我覺得非常值得參考,分享給大家。 如何增強你的意志力和堅韌
ChatGPT背後的技術 大型語言模型 是否與我們前面介紹的神經網路相同呢? 答案是不同的,這也是我們想要進一步探討了解的課題。今天會先解釋什麼是語言模型,想要做到的是哪些事情。
今天要介紹的是一款免費好用的AI圖片放大器。 這款AI圖片放大器不但是完全免費的,而且好心人士還編譯了Windows/Linux/MacOS等各種版本,讓大家可以直接一鍵下載安裝,可是說是非常的佛心。
本篇參與的主題活動
  從開始經營方格子到現在已經十個月了。說實話,這是從我淡出巴哈姆特四年後,再次有意識的經營作品。   雖然從事小說創作,我卻是一個只要講述自己的情感就會有些嘴笨的人,心中有太多太多感受,很難一次表達出來,只能再次說,非常謝謝大家的支持,沒有你們,我走不到現在。   今年是很特別的一年,我的沙龍
剛剛看到一部非常有幫助的影片,整理了十五個事情,是新手奇幻小說作者最好要避免的,我邊看邊點頭,覺得這影片太有用了,因此想要來整理分享一下:  https://www.youtube.com/watch?v=fo40-m03WVg 以下是身為奇幻小說作者,最好避免的十五件事情: 1. 設定狂
Carry Kuo 透過文字將自己的職涯經歷與心得化為對他人的啟發。他的作品聚焦於「第一次」的挑戰,特別是那些初入職場、初當主管、初創業的朋友。CK 希望用自己的經歷幫助更多人在職涯迷霧中找到方向。在這次的訪問中,我們將探索他的創作起點、核心理念與未來的創作規劃。 創作的起點:從迷惘中找到力量
歡迎來到方格新手村第一站!參加方格主題活動,發表任何一篇貼文、文章加上指定標籤, 就有機會得到免費禮券,或是讓 vocus 把你的創作推薦給全站會員! 現在就完成新手村任務,讓更多人認識你!
時間是2123年,那是一個下著雨的夜晚,冷風一波接著一波颳起,碩大的雨滴一滴滴地落在金屬上。多拉格睜開了雙眼,眼前是一扇窗戶,窗外一片黑暗,他發現自己在一個狹窄的空間裡,那是一個冷凍艙……
  從開始經營方格子到現在已經十個月了。說實話,這是從我淡出巴哈姆特四年後,再次有意識的經營作品。   雖然從事小說創作,我卻是一個只要講述自己的情感就會有些嘴笨的人,心中有太多太多感受,很難一次表達出來,只能再次說,非常謝謝大家的支持,沒有你們,我走不到現在。   今年是很特別的一年,我的沙龍
剛剛看到一部非常有幫助的影片,整理了十五個事情,是新手奇幻小說作者最好要避免的,我邊看邊點頭,覺得這影片太有用了,因此想要來整理分享一下:  https://www.youtube.com/watch?v=fo40-m03WVg 以下是身為奇幻小說作者,最好避免的十五件事情: 1. 設定狂
Carry Kuo 透過文字將自己的職涯經歷與心得化為對他人的啟發。他的作品聚焦於「第一次」的挑戰,特別是那些初入職場、初當主管、初創業的朋友。CK 希望用自己的經歷幫助更多人在職涯迷霧中找到方向。在這次的訪問中,我們將探索他的創作起點、核心理念與未來的創作規劃。 創作的起點:從迷惘中找到力量
歡迎來到方格新手村第一站!參加方格主題活動,發表任何一篇貼文、文章加上指定標籤, 就有機會得到免費禮券,或是讓 vocus 把你的創作推薦給全站會員! 現在就完成新手村任務,讓更多人認識你!
時間是2123年,那是一個下著雨的夜晚,冷風一波接著一波颳起,碩大的雨滴一滴滴地落在金屬上。多拉格睜開了雙眼,眼前是一扇窗戶,窗外一片黑暗,他發現自己在一個狹窄的空間裡,那是一個冷凍艙……
你可能也想看
Google News 追蹤
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
Enhance This HiDiffusion SDXL是一個AI模型,結合HiDiffusion和SDXL兩種圖像生成模型,可以根據既有影像和文字描述生成新的圖像,可用來提高圖像解析度、修復瑕疵、轉換風格和自由創造新的圖像。
Thumbnail
當你下定決心想要創作完美的圖片時,是否總是感到生圖製圖工具太過複雜、難以使用?別擔心!今天我們將介紹一款簡單直覺的 AI 生圖工具,幫助大家輕鬆製作出美美的圖片!   Stylar.ai 是一款極具多功能的 AI 圖片生成工具,旨在讓圖像處理變得更加容易且具有創造性。無論是要匯入圖片還是文
Thumbnail
隨著人工智能技術的發展,AI 繪圖已經變得常見。Fast Stable Diffusion XL on TPUv5e 是在 Hugging Face 平臺上建立的演示模型,使用 TPU v5e 運行 SDXL 模型,大幅提高了圖像生成速度,生成一張 1024x1024 圖像只需約 10 秒。
Thumbnail
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
AI圖形工具 今天分享一些常用的AI圖形工具。現在的圖形工具非常多,不可能全部都熟悉,因為真的太多了。所以介紹幾個比較常用的工具來供參考。算是我工作室的員工。 取代部分繪圖的工作 AI圖形工具基本上可以取代一部分繪圖的工作。就像速寫一樣,本身長年在畫速寫,但再怎麼說速度也不會比AI生成圖片來得
Thumbnail
Stylar AI是一個輔助圖像生成工具,可以將我們的照片快速轉換成不同風格,提供超過40種風格做選擇,就像簡易版的Photoshop,有圖層管理、去背、選取、文字等多種功能,可以新增圖像素材,或是透過AI技術來生成圖層進行排版,輕鬆創造獨特的視覺作品。
Thumbnail
生成式AI工具即將邁入三年,除了ChatGPT以外,也進化了許多GenAI工具,如Sora影片生成等。 你知道Stable Diffusion嗎? 從詠唱魔法師Prompts的玩家或職務,AI浪潮持續推進下,SD-WebUI並沒有停滯或被淘汰。 結果告訴了我們一件事情...
Thumbnail
Enhance This HiDiffusion SDXL是一個AI模型,結合HiDiffusion和SDXL兩種圖像生成模型,可以根據既有影像和文字描述生成新的圖像,可用來提高圖像解析度、修復瑕疵、轉換風格和自由創造新的圖像。
Thumbnail
當你下定決心想要創作完美的圖片時,是否總是感到生圖製圖工具太過複雜、難以使用?別擔心!今天我們將介紹一款簡單直覺的 AI 生圖工具,幫助大家輕鬆製作出美美的圖片!   Stylar.ai 是一款極具多功能的 AI 圖片生成工具,旨在讓圖像處理變得更加容易且具有創造性。無論是要匯入圖片還是文
Thumbnail
隨著人工智能技術的發展,AI 繪圖已經變得常見。Fast Stable Diffusion XL on TPUv5e 是在 Hugging Face 平臺上建立的演示模型,使用 TPU v5e 運行 SDXL 模型,大幅提高了圖像生成速度,生成一張 1024x1024 圖像只需約 10 秒。
Thumbnail
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
Thumbnail
Tensor Art 使用 Stable Diffusion 的各種模型,也能使用ControlNet 和 LoRA功能,根據使用者的輸入來文生圖、圖生圖,生成各種風格的高質量圖像,包括人像、動人的風景、創意的抽象畫等。
Thumbnail
AI圖形工具 今天分享一些常用的AI圖形工具。現在的圖形工具非常多,不可能全部都熟悉,因為真的太多了。所以介紹幾個比較常用的工具來供參考。算是我工作室的員工。 取代部分繪圖的工作 AI圖形工具基本上可以取代一部分繪圖的工作。就像速寫一樣,本身長年在畫速寫,但再怎麼說速度也不會比AI生成圖片來得
Thumbnail
Stylar AI是一個輔助圖像生成工具,可以將我們的照片快速轉換成不同風格,提供超過40種風格做選擇,就像簡易版的Photoshop,有圖層管理、去背、選取、文字等多種功能,可以新增圖像素材,或是透過AI技術來生成圖層進行排版,輕鬆創造獨特的視覺作品。