圖片也能「開口說話」了?Hedra AI 工具介紹

更新 發佈閱讀 3 分鐘

大家好,我是東東!今天要和大家分享一款可以讓圖片開口說話的AI工具——Hedra AI。接下來就讓我帶大家一起了解它的操作流程吧!


首先,在頁面的右上角找到並點擊「登入」按鈕,選擇 Google 登入即可。登入成功後,會進入主畫面,我們先點擊「Create」開始創作。

vocus|新世代的創作平台


簡潔易用的界面設計

Hedra AI 的界面簡潔明瞭,左側是語音內容設定區,提供兩種方式供選擇:「Generate audio」和「Import audio」。

vocus|新世代的創作平台


  1. Generate audio:可以輸入文字,並選擇聲音來生成語音。
vocus|新世代的創作平台


  1. Import audio:可上傳音檔,讓系統配合圖片來生成說話效果。
vocus|新世代的創作平台


方式一:Generate audio

在「Generate audio」模式中,內文支援多種語言,但目前語音以歐美英文配音為主。如果輸入中文,生成的語音會帶點外國口音(XD)。經測試,系統支援日文、英文和中文,大家可以多嘗試不同語言,或許會有意想不到的效果!

vocus|新世代的創作平台


為了更快完成生成,建議大家從簡短句子開始測試,這樣能節省時間,並檢查圖片的嘴部動作是否符合預期。

vocus|新世代的創作平台


至於聲音選擇,可以根據圖片需求選擇男聲或女聲,每個選項都有標明是「male」(男聲)還是「female」(女聲),方便對應選擇。

vocus|新世代的創作平台


此外,聲音下方還標示了口音和風格,可以根據需求進一步挑選。

vocus|新世代的創作平台


在文字設置完成後,接下來我選了一位女性聲音「Charlotte」,並準備生成一張女性圖片,以便達到更好的配合效果。

vocus|新世代的創作平台


圖像生成角色設置

接下來進入圖像設置區域,這裡有兩種方式可以選擇:

  1. 點擊中間的「+」號上傳圖片,系統會自動辨識人臉。
  2. 在下方輸入提示詞來生成圖像。
vocus|新世代的創作平台


小提醒:上傳的圖片會被自動裁切至人臉位置,因此建議選擇正面且主體清晰的大圖片。此外,系統提供範例可供參考。

vocus|新世代的創作平台


選好圖片後,點擊「Generate video」進行生成。

vocus|新世代的創作平台


注意事項

需要提醒大家的是,這個工具的生成效果偶爾會出現「翻車」,建議多次嘗試,找到理想的效果。我自己測試時,圖片嘴巴沒有動反而眼睛在動,所以一定要選擇清晰的「有嘴巴」圖片,這樣才能生成出理想的效果!

vocus|新世代的創作平台


使用另一種方式進行圖像生成

接下來,我們來嘗試另一種生成方式。首先,在左側一樣先設定好想要的語音和角色選項。中間部分則會看到提示詞輸入框,可以在此輸入想要的提示詞,由 AI 來生成圖片。

vocus|新世代的創作平台


輸入完提示詞後,點擊「Create」,系統就會根據設定生成圖片囉!

vocus|新世代的創作平台


生成圖片後,接下來的步驟相同,按下「Generate video」就能開始生成影片!

vocus|新世代的創作平台


以上就是本次的工具介紹,下一篇文章將介紹其他生成方式,千萬不要錯過!如果喜歡這篇文章,請記得按讚、訂閱和分享哦!



留言
avatar-img
東東旁邊蹲
2會員
13內容數
大家好,我是東東!我熱愛生活,也喜歡學習,方格子成為了我記錄成長的地方。在這裡,我會用心分享自己的經歷和學到的知識,讓彼此在交流中成長、學習,共同探索更廣闊的世界。希望我的分享能帶給大家一些靈感與收穫!
東東旁邊蹲的其他內容
2024/11/01
大家好,我是東東!你有沒有注意到,AI技術的進步速度快得驚人?尤其是在影片生成領域,新工具層出不窮。今天我要介紹一款簡單好用的工具——VIVA。現在它還處於免費測試階段,如果你想搶先體驗,趕快跟著我一起深入了解吧! 首先,我們可以從右上角登入,支持使用Google帳號快速登入。登入後,你會看到
Thumbnail
2024/11/01
大家好,我是東東!你有沒有注意到,AI技術的進步速度快得驚人?尤其是在影片生成領域,新工具層出不窮。今天我要介紹一款簡單好用的工具——VIVA。現在它還處於免費測試階段,如果你想搶先體驗,趕快跟著我一起深入了解吧! 首先,我們可以從右上角登入,支持使用Google帳號快速登入。登入後,你會看到
Thumbnail
2024/10/30
大家好,我是東東!今天要來介紹 Ideogram AI 的 Logo 設計 和 動漫角色創作。有個好消息,就是這個工具居然不限制生成 IP 角色!讓我們可以進行更有趣的創作。 不過在這裡,我並不鼓勵大家去生成一些不合適的內容,比如血腥或暴露的圖片哦! 在撰寫提示詞時,大家可以想像自己在和
Thumbnail
2024/10/30
大家好,我是東東!今天要來介紹 Ideogram AI 的 Logo 設計 和 動漫角色創作。有個好消息,就是這個工具居然不限制生成 IP 角色!讓我們可以進行更有趣的創作。 不過在這裡,我並不鼓勵大家去生成一些不合適的內容,比如血腥或暴露的圖片哦! 在撰寫提示詞時,大家可以想像自己在和
Thumbnail
2024/10/29
大家好,我是東東!上一篇文章我們介紹了 Ideogram AI 的基本功能,今天要帶大家進一步測試它對創意性的理解能力。 如果你還不太了解 Ideogram AI,可以先回顧我上一篇的介紹,裡面有關於這款工具的基本認識與使用方式。 這次,我在提示詞中加入了很多有趣的元素,讓 AI 幫我生成一
Thumbnail
2024/10/29
大家好,我是東東!上一篇文章我們介紹了 Ideogram AI 的基本功能,今天要帶大家進一步測試它對創意性的理解能力。 如果你還不太了解 Ideogram AI,可以先回顧我上一篇的介紹,裡面有關於這款工具的基本認識與使用方式。 這次,我在提示詞中加入了很多有趣的元素,讓 AI 幫我生成一
Thumbnail
看更多
你可能也想看
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
Thumbnail
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
Thumbnail
Tenge AI是一款免費的AI圖像生成器,支持中文和英文提示詞或圖像上傳生成。它提供了19種風格,並可以用於商業用途。
Thumbnail
Tenge AI是一款免費的AI圖像生成器,支持中文和英文提示詞或圖像上傳生成。它提供了19種風格,並可以用於商業用途。
Thumbnail
大家好,我是東東!今天要和大家分享一款可以讓圖片開口說話的AI工具——Hedra AI。接下來就讓我帶大家一起了解它的操作流程吧! 首先,在頁面的右上角找到並點擊「登入」按鈕,選擇 Google 登入即可。登入成功後,會進入主畫面,我們先點擊「Create」開始創作。 簡潔易用的界面設計
Thumbnail
大家好,我是東東!今天要和大家分享一款可以讓圖片開口說話的AI工具——Hedra AI。接下來就讓我帶大家一起了解它的操作流程吧! 首先,在頁面的右上角找到並點擊「登入」按鈕,選擇 Google 登入即可。登入成功後,會進入主畫面,我們先點擊「Create」開始創作。 簡潔易用的界面設計
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News