此篇調查論文探討了Diffusion模型在文字、圖片和聲音轉換為影片，以及影片衍生和編輯的應用類型。作者也介紹了U-Net架構和Vision Transformer等生成圖像架構，並詳細探討了訓練模型的方法以及不同的影像資料集來源。

音樂藝文

電影戲劇

職場

以行動支持創作者！付費即可解鎖

科技

Hello 我是黃仁和 就讀於國立台北科技大學 資財系 目前剛升上大四 我的專長為資料科學領域目前專攻於影像 並且於台灣大哥大擔任影像AI實習生

仁和的論文整理

AI影像論文(06)：AI如何生成影片?Diffusion模型生成影片方法調查

<div class="draft-block draft--p left">一戳即破</div>
<div class="draft-block draft--p left">你的謊言比薄情堅韌</div>
<div class="draft-block draft--p left"></div>
<div class="draft-block draft--p left">我用力忘記你了</div>
<div class="draft-block draft--p left">在眼淚流乾的那一秒</div>
<div class="draft-block draft--p left"></div>
<div class="draft-block draft--p left">後記：拿舊作小詩玩一下AI生成圖像。</div>
<div class="draft-block draft--p left">這是用微軟的Copilot，請它生成符合詩意的AI圖，再用pixlr線上修圖軟體去掉Copilot自動翻譯的英文，改回中文原作。</div>
<div class="draft-block draft--p left">目前AI生成圖片，Copliot確實夠強大了，大概一次可以生成四張圖中，有一到兩張能合乎敘述美感要求。其它AI 都是丟給我捲筒衛生紙圖充數.....😑</div>
<div class="draft--imgNormal draft-block"><div><div style="height:754px" class="image-block-prerender" data-src="https://images.vocus.cc/1193eec3-e6b8-4822-b4ea-a0cd3b0f39ae.jpg" data-width="754" data-height="756" data-position="center"></div><figcaption class="imageCaption draft-block" style="cursor:text;display:block"></figcaption></div></div>
<div class="draft--imgNormal draft-block"><div><div style="height:1024px" class="image-block-prerender" data-src="https://images.vocus.cc/368c4df8-b3be-416e-95e5-f97a44905ef9.jpg" data-width="1024" data-height="1024" data-position="center"></div><figcaption class="imageCaption draft-block" style="cursor:text;display:block"></figcaption></div></div>
<div class="draft-block draft--p left"></div>

「漫」：無拘無束、放縱胡亂。

隨心書寫、隨意閱讀 。試圖讓日常生活有趣點。 有書有詩有影像。

聊聊電影、旅遊、人生各面向。



漫書寫

衛生紙

本文介紹了生成式學習中的兩種策略：「各個擊破」和「一次到位」。這兩種策略在生成速度和品質之間達到平衡。為了提高速度，可以採用"N次到位"的Diffusion Model策略。在語音和影像生成中，可以結合這兩種策略以充分利用優勢。融合策略可以同時確保品質和速度，展現人工智慧的潛力。