SD-SadTalker|超認真唱Jingle Bells!!

閱讀時間約 1 分鐘

Stable Diffusion (簡稱SD) 一款強大的開源圖像生成軟體,用於影像修復、修改、生成或辨識等用途。

SadTalker就是深偽技術之一,可以透過人物圖像與音檔或模仿人物講話口吻表情動作的套件或分支軟體。

raw-image


使用技術:

  1. StableDiffusion (圖像生成)

https://github.com/AUTOMATIC1111/stable-diffusion-webui

2. audacity (音源剪輯)

audacity 音源剪輯

audacity 音源剪輯

  1. Clipchamp (影片剪輯)
Clipchamp 影片剪輯

Clipchamp 影片剪輯


成果展示Youtube影片如下:


祝福 聖誕平安&新年快樂
avatar-img
54會員
375內容數
ChatGPT問世,使用DALL.E生成圖像,描述短篇趣味故事,當故事描述完,心情也愉快了。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
D&Y熊繪生的沙龍 的其他內容
本文探討未來大型語言模型 (LLM) 在化學合成中的潛力,特別是如何生成新化合物以應對散熱系統的挑戰。透過分析新生成的化合物水魔素,文章闡述其在冷熱傳導性上的應用,並指出該技術有望顛覆傳統散熱設計,從而提升散熱效率。實驗結果成功發表於論文期刊,標誌著化學合成領域的創新突破。
本文介紹了特斯拉全自動駕駛計程車 Cybercab 的最新消息,以及其未來的應用和影響。Cybercab 以其3AR技術架構(自動化、人工智能、擴增實境)和3R理念(機器人、取代、回收)正在改變交通運輸市場。文章探討了這一技術在未來幾年的發展方向及伴隨的挑戰,尤其是在勞動力和交通安全方面潛在影響。
本篇文章探討臺灣獨特的乖乖文化,特別是乖乖餅乾(五香乖乖)在臺灣企業中的象徵意義以及其祈求設備運作正常的習俗。同時提及創作洗腦歌曲“乖乖Marlene”的靈感與技術應用,特別是透過Suno生成獨特歌曲的過程。文章還強調了讓小朋友能夠乖乖聽話的重要性,寓教於樂的方式啟發孩子們的想像力。
本文介紹了SonicLight Guardian產品開發過程,涵蓋現代協作工具Google雲端、ChatGPT和Gamma AI的應用,透過這些工具提升產品開發效率與創造力。強調即時備份與追蹤修改的重要性,以及如何利用POE平臺和GPT模型進行程式碼生成和簡報製作,讓開發團隊能夠專注於各自的任務。
本篇文章介紹了嫦娥妖怪與月餅之間的有趣故事,並探討ChatGPT如何在聊天畫面中生成圖像。此外,文章還講解了使用Luma ai - Genie創建3D模型的格式選擇,包括blend和stl,可應用於Blender編輯及3D列印。本文不僅提供知識,也帶來創意靈感,適合對3D設計及數字藝術有興趣的讀者。
傷腦筋的3D設計? 利用3D繪圖軟體設計模型,並且存儲STL副檔名,如SolidWorks。 網上抓模型來改會快一點。 3D列印G-code檔 3D印表機切片軟體,模擬最佳時效的模型擺放位置,儲存成G-code副檔名,提供3D Printer進行模型列印製作。 實際情況
本文探討未來大型語言模型 (LLM) 在化學合成中的潛力,特別是如何生成新化合物以應對散熱系統的挑戰。透過分析新生成的化合物水魔素,文章闡述其在冷熱傳導性上的應用,並指出該技術有望顛覆傳統散熱設計,從而提升散熱效率。實驗結果成功發表於論文期刊,標誌著化學合成領域的創新突破。
本文介紹了特斯拉全自動駕駛計程車 Cybercab 的最新消息,以及其未來的應用和影響。Cybercab 以其3AR技術架構(自動化、人工智能、擴增實境)和3R理念(機器人、取代、回收)正在改變交通運輸市場。文章探討了這一技術在未來幾年的發展方向及伴隨的挑戰,尤其是在勞動力和交通安全方面潛在影響。
本篇文章探討臺灣獨特的乖乖文化,特別是乖乖餅乾(五香乖乖)在臺灣企業中的象徵意義以及其祈求設備運作正常的習俗。同時提及創作洗腦歌曲“乖乖Marlene”的靈感與技術應用,特別是透過Suno生成獨特歌曲的過程。文章還強調了讓小朋友能夠乖乖聽話的重要性,寓教於樂的方式啟發孩子們的想像力。
本文介紹了SonicLight Guardian產品開發過程,涵蓋現代協作工具Google雲端、ChatGPT和Gamma AI的應用,透過這些工具提升產品開發效率與創造力。強調即時備份與追蹤修改的重要性,以及如何利用POE平臺和GPT模型進行程式碼生成和簡報製作,讓開發團隊能夠專注於各自的任務。
本篇文章介紹了嫦娥妖怪與月餅之間的有趣故事,並探討ChatGPT如何在聊天畫面中生成圖像。此外,文章還講解了使用Luma ai - Genie創建3D模型的格式選擇,包括blend和stl,可應用於Blender編輯及3D列印。本文不僅提供知識,也帶來創意靈感,適合對3D設計及數字藝術有興趣的讀者。
傷腦筋的3D設計? 利用3D繪圖軟體設計模型,並且存儲STL副檔名,如SolidWorks。 網上抓模型來改會快一點。 3D列印G-code檔 3D印表機切片軟體,模擬最佳時效的模型擺放位置,儲存成G-code副檔名,提供3D Printer進行模型列印製作。 實際情況
你可能也想看
Google News 追蹤
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
我們前面幾篇已經講完TTS技術的一大半架構了,知道了如何將聲學特徵重建回音訊波形,也從中可以知道要是聲學特徵不完善,最終取得的結果也會不自然,剩下要探討該如何將文字轉換成聲學特徵,且能夠自然地表現停頓及細節變化,讓我們開始吧。
Thumbnail
Enhance This HiDiffusion SDXL是一個AI模型,結合HiDiffusion和SDXL兩種圖像生成模型,可以根據既有影像和文字描述生成新的圖像,可用來提高圖像解析度、修復瑕疵、轉換風格和自由創造新的圖像。
Thumbnail
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
Thumbnail
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
Thumbnail
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
Thumbnail
這篇要來分享使用Stable Diffusion加上拼貼擴展技巧如何製作自己想要的情境圖。以用於日後的小說封面
Thumbnail
文字生成圖片的擴散生成模型,實際應用上並沒有想像中好用,原因在於,文字能夠乘載的訊息量太少,要產生好的生成結果一定程度仰賴特定的Prompt描述方法,如DALL-E3使用GPT4不斷增加描述的細節,讓文生圖的結果更好,有沒有更有效率的方式呢?
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
最近在嘗試使用不同的AI生圖方式混合出圖的方式,採用A平台的優點,並用B平台後製的手法截長補短,創造出自己更想要的小說場景,效果不錯,現在以這張圖為例,來講一下我的製作步驟。
Thumbnail
我們前面幾篇已經講完TTS技術的一大半架構了,知道了如何將聲學特徵重建回音訊波形,也從中可以知道要是聲學特徵不完善,最終取得的結果也會不自然,剩下要探討該如何將文字轉換成聲學特徵,且能夠自然地表現停頓及細節變化,讓我們開始吧。
Thumbnail
Enhance This HiDiffusion SDXL是一個AI模型,結合HiDiffusion和SDXL兩種圖像生成模型,可以根據既有影像和文字描述生成新的圖像,可用來提高圖像解析度、修復瑕疵、轉換風格和自由創造新的圖像。
Thumbnail
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
Thumbnail
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
Thumbnail
這篇要介紹AI生成影片的兩個方式:SVD 跟 AnimateDiff。
Thumbnail
這篇要來分享使用Stable Diffusion加上拼貼擴展技巧如何製作自己想要的情境圖。以用於日後的小說封面
Thumbnail
文字生成圖片的擴散生成模型,實際應用上並沒有想像中好用,原因在於,文字能夠乘載的訊息量太少,要產生好的生成結果一定程度仰賴特定的Prompt描述方法,如DALL-E3使用GPT4不斷增加描述的細節,讓文生圖的結果更好,有沒有更有效率的方式呢?