SD-WebUI|AnimateDiff|[生成概念影像:你在說什麼?讓彼此認知貼近,討論(或教育)才有意義。]

D&Y熊繪生-avatar-img
發佈於心情繪本 個房間
更新 發佈閱讀 11 分鐘

擁抱AI

擁抱AI


溝通失敗,在於彼此認知與立場的不同。


一張圖,勝過千言萬語。


註1:窮解釋說明再多,一張好的影像(圖表、影片),除了幫助說明提醒,重點是要讓對方能夠馬上理解,你所表達的用意與目的。


傳達產品或者施工,以前有美編、剪輯、影像製作、CAD專人幫忙,確實畫出來專業(操作CAD、美術概念、工程流程配置等需要有經驗)。


討論過程不知幾百回合註1,版本一改再改10幾版以上,最終要第一、二版本。


由此可見...

立場相同,認知到位,我們再來好好談。

立場不同,就別浪費時間。


生成式AI技術正在普及,與下游端市場的應用持續碰撞火花。

今天我們可以用生成AI協作完成許多事情,生活中有太多事務需要有畫面才能討論,例:概念影像可說明你的天馬行空想法如何實踐、建築物及裝潢景物畫面、設備水電配置流程圖等。


閱讀說明

  • 生成影片成果 (Autonomous Electric Car and Drone)
    • 圖片多(以輪播圖片呈現)
  • 過程畫面 (AnimateDiff [Generation])
    • 生成影片DEMO
  • Nvidia RTX4060 8GB實測參數
    • 系統資訊
    • SDWebUI介面
    • Prompt



Autonomous Electric Car and Drone

生成概念畫面:自動駕駛電動車與無人機


生成概念影片:自然保護與產業發展

raw-image


生成概念影片:變形+機構系列

黏土變形

黏土變形


機構變形

機構變形


AnimateDiff [Generation]

SDWebUI 生成影片畫面

SDWebUI 生成影片畫面

GPU使用狀態

很重要!!維持在專屬GPU記憶體範圍,如此生成圖才有效率。

補充說明,為什麼要維持在專屬GPU記憶體內:

散熱

聽見GPU風扇"維持高速散熱"就是了!

GPU效能最大化 = 維持在專屬GPU記憶體範圍

GPU效能最大化 = 維持在專屬GPU記憶體範圍



類變形金剛

Similar to Transformers (interp X: 5)

Similar to Transformers (interp X: 5)



如果你設定可行,歡迎留言分享並點擊充電小額鼓勵。


[GPU] RTX4060 8GB實測參數設定

系統資訊

Steps: 30, Sampler: DPM++ 2M, Schedule type: Karras,

CFG scale: 7, Seed: 1989930546,

Size: 792x448, Model hash: f47e942ad4,

Model: realisticVisionV60B1_v51HyperVAE,

AnimateDiff: "model: mm_sd15_v3.safetensors,

video_length: 120, fps: 24, loop_number: 0, closed_loop: N,

batch_size: 8, stride: 1, overlap: 2, freeinit_enable: False, mm_hash: a8ca0ead, version: v2.0.1-a-1-ga88e889",

Pad conds: True, Version: v1.10.1


SDWebUI介面畫面


raw-image


Prompts

(masterpiece:1.5), best quality, ultra-detailed, 8k, cinematic, a futuristic self-driving electric car, [sleek silver|predominantly white with teal accents|matte black with glowing blue lines], transforming into a flying car with complex mechanical movements, (the car's roof [elegantly|swiftly|smoothly] retracting and folding away, revealing [intricate gears and pistons|glowing energy conduits]), (the drone, a large [white|grey|black] structure with four prominent black propellers and [teal|blue|red] lighting, [smoothly|quickly] extending upwards from the car's chassis and locking firmly into place with visible, realistic [joints and locking mechanisms|magnetic connections]), (aerodynamic wings with [teal|blue|red] lighting [smoothly|rapidly] unfolding from the car's sides with a distinct mechanical [sound|hiss]), (powerful [teal|blue|red] thrusters [immediately|gradually] activating and emitting a [soft glow|bright flare] and [subtle heat distortion|energy trails]), (the transformed vehicle [slowly and steadily|swiftly] lifting off the ground, with visible adjustments in the mechanical structure to maintain balance), parked on a modern [asphalt road|concrete platform] with [subtle road markings|glowing lines], a [blurred futuristic cityscape|night cityscape with neon lights|clear daytime sky with distant clouds] in the background, (dynamic camera angle focusing on the transformation and lift-off, showcasing the mechanical complexity), (smooth and continuous camera movement, initially a [medium shot|close-up], quickly panning upwards with the ascending vehicle, highlighting the [mechanical details|glowing elements]), (emphasize the [realistic|powerful|seamless] nature of the mechanical transformation), (clear but brief view of the connecting mechanisms as they lock, avoiding any unrealistic morphing or stretching), (subtle ambient light reflecting off the car's surface and the mechanical components), (short animation sequence showcasing the transformation and initial ascent, focusing on the mechanical actions).


Negative prompt

low quality, blurry, bad anatomy, deformed, mutated hands, extra fingers, cartoonish, unrealistic, multiple cars, multiple drones, text, watermark, signature, logo, artist name, poorly drawn, bad proportions, out of frame, cropped, noisy, artifacts, jpeg artifacts, oversaturated, underexposed, overexposed, blurry background (when car and drone should be in focus), distorted car, distorted drone, static drone, drone not taking off, roof not opening, unrealistic reflections, bad lighting, unnatural colors, people, animals, plants (unless specifically desired and subtle), wide shot of the entire city (unless specifically desired later), distant car, tiny drone, motion blur (unless intentional for rotors), shaky camera, jerky movement, still image, morphing, stretching, unrealistic deformations, organic transformation.


留言
avatar-img
D&Y熊繪生的沙龍
56會員
427內容數
ChatGPT問世,使用DALL.E生成圖像,描述短篇趣味故事,當故事描述完,心情也愉快了。
D&Y熊繪生的沙龍的其他內容
2025/04/24
這篇文章簡要說明如何在Windows 10及更高版本作業系統上使用SDWebUI-GPU,並提供硬體運作、安裝擴充套件以及其他補充資訊,例如使用VRAM-Estimator改善GPU記憶體使用效能,以及在老舊Macbook Pro上搭建ML系統環境的經驗分享。
Thumbnail
2025/04/24
這篇文章簡要說明如何在Windows 10及更高版本作業系統上使用SDWebUI-GPU,並提供硬體運作、安裝擴充套件以及其他補充資訊,例如使用VRAM-Estimator改善GPU記憶體使用效能,以及在老舊Macbook Pro上搭建ML系統環境的經驗分享。
Thumbnail
2025/04/21
本教學文章提供在SD-WebUI環境下建置及應用模型套件,特別針對Animatediff擴展與SDXL模型的兼容性問題,提供解決方案與詳細步驟,並以〈燃燒吧小宇宙〉為例,示範如何生成動畫影片。文末提醒需具備Nvidia RTX 4060 8GB或更高階顯卡才能順利執行。
Thumbnail
2025/04/21
本教學文章提供在SD-WebUI環境下建置及應用模型套件,特別針對Animatediff擴展與SDXL模型的兼容性問題,提供解決方案與詳細步驟,並以〈燃燒吧小宇宙〉為例,示範如何生成動畫影片。文末提醒需具備Nvidia RTX 4060 8GB或更高階顯卡才能順利執行。
Thumbnail
2025/04/02
ChatGPT持續影響全球趨勢,而Stable Diffusion則在圖像生成領域佔據領導地位,本文探討兩者差異與自行架設LINE的txt2img功能。
Thumbnail
2025/04/02
ChatGPT持續影響全球趨勢,而Stable Diffusion則在圖像生成領域佔據領導地位,本文探討兩者差異與自行架設LINE的txt2img功能。
Thumbnail
看更多
你可能也想看
Thumbnail
此篇調查論文探討了Diffusion模型在文字、圖片和聲音轉換為影片,以及影片衍生和編輯的應用類型。作者也介紹了U-Net架構和Vision Transformer等生成圖像架構,並詳細探討了訓練模型的方法以及不同的影像資料集來源。
Thumbnail
此篇調查論文探討了Diffusion模型在文字、圖片和聲音轉換為影片,以及影片衍生和編輯的應用類型。作者也介紹了U-Net架構和Vision Transformer等生成圖像架構,並詳細探討了訓練模型的方法以及不同的影像資料集來源。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
課程中除了滿載實用的影音製作技巧 更安排實作環節,與導師和其他學員互動交流,製作屬於自己品牌的影片 助您打造出引人入勝的視覺內容,讓您的品牌在競爭激烈的市場中脫穎而出!
Thumbnail
課程中除了滿載實用的影音製作技巧 更安排實作環節,與導師和其他學員互動交流,製作屬於自己品牌的影片 助您打造出引人入勝的視覺內容,讓您的品牌在競爭激烈的市場中脫穎而出!
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
​ 【線上報名表: https://reurl.cc/2zVoL6】 🔖過去要花許多時間或經費製作的企業/品牌/產品簡介有聲影片,現在透過AI程式AutoMedia,企業影片DIY可以變的很easy!本課程將手把手教導學員如何將PPT簡報轉成有字幕及語音的簡介影片,無須委外就能輕鬆製作出自己想
Thumbnail
​ 【線上報名表: https://reurl.cc/2zVoL6】 🔖過去要花許多時間或經費製作的企業/品牌/產品簡介有聲影片,現在透過AI程式AutoMedia,企業影片DIY可以變的很easy!本課程將手把手教導學員如何將PPT簡報轉成有字幕及語音的簡介影片,無須委外就能輕鬆製作出自己想
Thumbnail
我們將從四個角度切入,深度理解虛擬製作的核心主題與模式
Thumbnail
我們將從四個角度切入,深度理解虛擬製作的核心主題與模式
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
本文探討了影像生成模型的多種應用,包括文字、圖像和聲音到影片的生成,涵蓋了GAN、Transformer和Diffusion等技術。透過回顧相關研究,分析影像生成技術的未來趨勢與挑戰,為讀者提供全面的理解與啟示。
Thumbnail
本文探討了影像生成模型的多種應用,包括文字、圖像和聲音到影片的生成,涵蓋了GAN、Transformer和Diffusion等技術。透過回顧相關研究,分析影像生成技術的未來趨勢與挑戰,為讀者提供全面的理解與啟示。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News