圖片也能「開口說話」了?Hedra AI 工具介紹

更新於 發佈於 閱讀時間約 3 分鐘

大家好,我是東東!今天要和大家分享一款可以讓圖片開口說話的AI工具——Hedra AI。接下來就讓我帶大家一起了解它的操作流程吧!


首先,在頁面的右上角找到並點擊「登入」按鈕,選擇 Google 登入即可。登入成功後,會進入主畫面,我們先點擊「Create」開始創作。

raw-image


簡潔易用的界面設計

Hedra AI 的界面簡潔明瞭,左側是語音內容設定區,提供兩種方式供選擇:「Generate audio」和「Import audio」。

raw-image


  1. Generate audio:可以輸入文字,並選擇聲音來生成語音。
raw-image


  1. Import audio:可上傳音檔,讓系統配合圖片來生成說話效果。
raw-image


方式一:Generate audio

在「Generate audio」模式中,內文支援多種語言,但目前語音以歐美英文配音為主。如果輸入中文,生成的語音會帶點外國口音(XD)。經測試,系統支援日文、英文和中文,大家可以多嘗試不同語言,或許會有意想不到的效果!

raw-image


為了更快完成生成,建議大家從簡短句子開始測試,這樣能節省時間,並檢查圖片的嘴部動作是否符合預期。

raw-image


至於聲音選擇,可以根據圖片需求選擇男聲或女聲,每個選項都有標明是「male」(男聲)還是「female」(女聲),方便對應選擇。

raw-image


此外,聲音下方還標示了口音和風格,可以根據需求進一步挑選。

raw-image


在文字設置完成後,接下來我選了一位女性聲音「Charlotte」,並準備生成一張女性圖片,以便達到更好的配合效果。

raw-image


圖像生成角色設置

接下來進入圖像設置區域,這裡有兩種方式可以選擇:

  1. 點擊中間的「+」號上傳圖片,系統會自動辨識人臉。
  2. 在下方輸入提示詞來生成圖像。
raw-image


小提醒:上傳的圖片會被自動裁切至人臉位置,因此建議選擇正面且主體清晰的大圖片。此外,系統提供範例可供參考。

raw-image


選好圖片後,點擊「Generate video」進行生成。

raw-image


注意事項

需要提醒大家的是,這個工具的生成效果偶爾會出現「翻車」,建議多次嘗試,找到理想的效果。我自己測試時,圖片嘴巴沒有動反而眼睛在動,所以一定要選擇清晰的「有嘴巴」圖片,這樣才能生成出理想的效果!

raw-image


使用另一種方式進行圖像生成

接下來,我們來嘗試另一種生成方式。首先,在左側一樣先設定好想要的語音和角色選項。中間部分則會看到提示詞輸入框,可以在此輸入想要的提示詞,由 AI 來生成圖片。

raw-image


輸入完提示詞後,點擊「Create」,系統就會根據設定生成圖片囉!

raw-image


生成圖片後,接下來的步驟相同,按下「Generate video」就能開始生成影片!

raw-image


以上就是本次的工具介紹,下一篇文章將介紹其他生成方式,千萬不要錯過!如果喜歡這篇文章,請記得按讚、訂閱和分享哦!



留言
avatar-img
留言分享你的想法!
avatar-img
東東旁邊蹲
2會員
13內容數
大家好,我是東東!我熱愛生活,也喜歡學習,方格子成為了我記錄成長的地方。在這裡,我會用心分享自己的經歷和學到的知識,讓彼此在交流中成長、學習,共同探索更廣闊的世界。希望我的分享能帶給大家一些靈感與收穫!
東東旁邊蹲的其他內容
2024/11/01
大家好,我是東東!你有沒有注意到,AI技術的進步速度快得驚人?尤其是在影片生成領域,新工具層出不窮。今天我要介紹一款簡單好用的工具——VIVA。現在它還處於免費測試階段,如果你想搶先體驗,趕快跟著我一起深入了解吧! 首先,我們可以從右上角登入,支持使用Google帳號快速登入。登入後,你會看到
Thumbnail
2024/11/01
大家好,我是東東!你有沒有注意到,AI技術的進步速度快得驚人?尤其是在影片生成領域,新工具層出不窮。今天我要介紹一款簡單好用的工具——VIVA。現在它還處於免費測試階段,如果你想搶先體驗,趕快跟著我一起深入了解吧! 首先,我們可以從右上角登入,支持使用Google帳號快速登入。登入後,你會看到
Thumbnail
2024/10/30
大家好,我是東東!今天要來介紹 Ideogram AI 的 Logo 設計 和 動漫角色創作。有個好消息,就是這個工具居然不限制生成 IP 角色!讓我們可以進行更有趣的創作。 不過在這裡,我並不鼓勵大家去生成一些不合適的內容,比如血腥或暴露的圖片哦! 在撰寫提示詞時,大家可以想像自己在和
Thumbnail
2024/10/30
大家好,我是東東!今天要來介紹 Ideogram AI 的 Logo 設計 和 動漫角色創作。有個好消息,就是這個工具居然不限制生成 IP 角色!讓我們可以進行更有趣的創作。 不過在這裡,我並不鼓勵大家去生成一些不合適的內容,比如血腥或暴露的圖片哦! 在撰寫提示詞時,大家可以想像自己在和
Thumbnail
2024/10/29
大家好,我是東東!上一篇文章我們介紹了 Ideogram AI 的基本功能,今天要帶大家進一步測試它對創意性的理解能力。 如果你還不太了解 Ideogram AI,可以先回顧我上一篇的介紹,裡面有關於這款工具的基本認識與使用方式。 這次,我在提示詞中加入了很多有趣的元素,讓 AI 幫我生成一
Thumbnail
2024/10/29
大家好,我是東東!上一篇文章我們介紹了 Ideogram AI 的基本功能,今天要帶大家進一步測試它對創意性的理解能力。 如果你還不太了解 Ideogram AI,可以先回顧我上一篇的介紹,裡面有關於這款工具的基本認識與使用方式。 這次,我在提示詞中加入了很多有趣的元素,讓 AI 幫我生成一
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
大家好,我是東東!今天要和大家分享一款可以讓圖片開口說話的AI工具——Hedra AI。接下來就讓我帶大家一起了解它的操作流程吧! 首先,在頁面的右上角找到並點擊「登入」按鈕,選擇 Google 登入即可。登入成功後,會進入主畫面,我們先點擊「Create」開始創作。 簡潔易用的界面設計
Thumbnail
大家好,我是東東!今天要和大家分享一款可以讓圖片開口說話的AI工具——Hedra AI。接下來就讓我帶大家一起了解它的操作流程吧! 首先,在頁面的右上角找到並點擊「登入」按鈕,選擇 Google 登入即可。登入成功後,會進入主畫面,我們先點擊「Create」開始創作。 簡潔易用的界面設計
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
免費文字轉語音(Free text to speech)免費的線上語音合成工具,使用微軟 AI 語音庫生成仿真人語音,支援 129 種語言,提供三百多種聲音,輸入文本即可線上聆聽和下載 MP3 檔案。
Thumbnail
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
Thumbnail
文字MP3專業版是簡單且強大的工具,會編輯文字就能創造出專業級配音。簡單 ﹑容易上手,像使用Word,無需剪輯經驗,輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇,包括純正的臺灣口音。這個工具能應用於各種情境,如教育訓練簡報、有聲書、Podcast等。
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
DeepAI 提供「聊天機器人」及「生成圖像」兩種服務,不用註冊就可以免費使用,聊天機器人有多種角色做選擇,能為你的創作和思考過程帶來新的靈感;至於圖像生成功能,也提供多種風格供你選擇,讓你每次生成的圖像都有不同的風格和特色。
Thumbnail
Tenge AI是一款免費的AI圖像生成器,支持中文和英文提示詞或圖像上傳生成。它提供了19種風格,並可以用於商業用途。
Thumbnail
Tenge AI是一款免費的AI圖像生成器,支持中文和英文提示詞或圖像上傳生成。它提供了19種風格,並可以用於商業用途。
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
OpenAI最新推出的「Sora」是一款文本生成影像的AI模型,只要輸入幾句簡單的文字描述,就能自動生成出影像,影片內容可以包含多名角色,搭配特定的動態場景,且影片長度最高可達60秒,同時還能展示複雜的攝影機運動。Sora還能夠根據靜態圖片來製作動畫,功能十分強大。目前Sora還沒有開放給大眾使
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
好玩的來了,AI即時繪畫目前可以做到透過提示詞配合網路攝影機進行即時的AI轉換。 今天教你怎麼用這個工具 以下有整合包 https://drive.google.com/drive/folders/1Uz8QNDgYjfDjoYcAdxZYD0KIoxsaX_s6?usp=drive_link
Thumbnail
好玩的來了,AI即時繪畫目前可以做到透過提示詞配合網路攝影機進行即時的AI轉換。 今天教你怎麼用這個工具 以下有整合包 https://drive.google.com/drive/folders/1Uz8QNDgYjfDjoYcAdxZYD0KIoxsaX_s6?usp=drive_link
Thumbnail
1. 選擇您的頭像或建立一個。 →造訪:http:// heygen.com 並開立帳戶。 →從120+頭像中選擇您最喜歡的頭像。 →或者您可以建立自己的頭像。 2. 新增文字腳本。 →超過40種語言和300 +語音可用。 →新增文字輸入並檢查音訊。 3. 提交您的影片以進行最終輸出。
Thumbnail
1. 選擇您的頭像或建立一個。 →造訪:http:// heygen.com 並開立帳戶。 →從120+頭像中選擇您最喜歡的頭像。 →或者您可以建立自己的頭像。 2. 新增文字腳本。 →超過40種語言和300 +語音可用。 →新增文字輸入並檢查音訊。 3. 提交您的影片以進行最終輸出。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News