Gemini 正式推出了音樂生成功能: Lyria 3 音樂模型

更新 發佈閱讀 5 分鐘

Gemini 已經正式推出了音樂生成功能,這背後是由 Google DeepMind 開發的最新音樂模型 Lyria 3 所驅動。
這項功能讓 Gemini 從單純的「文字/圖片處理」進化到能理解並創作出具備節奏、旋律、人聲甚至歌詞的完整音樂。
以下連結為Lyria 3替我產生的歌曲: Prompt: 「一首關於台北雨夜的爵士樂」
https://gemini.google.com/share/59d40158a347

曲目資訊:

  • 標題: 雨夜台北 (Rainy Night Taipei)
  • 風格: 流暢爵士 / 華語流行
  • 氛圍: 溫柔、懷舊、都市感
raw-image

以下為你詳細解析其技術原理與具體使用方式:


技術原理:Lyria 3 是如何運作的?

不同於早期的 AI 只是簡單地拼接音訊片段,Lyria 3 採用了更深層的架構來處理音樂的複雜性:

1. 結構化音樂生成 (Structured Generation)

音樂包含極高的資訊密度,每一秒都涉及節拍、音符與和聲的細微變化。Lyria 3 具備 長程一致性 (Long-range Coherence),能確保一段 30 秒的音樂從開頭到結尾在旋律與節奏上邏輯一致,而不會出現突兀的斷裂感。

2. 多模態編碼與擴散模型

Lyria 3 的核心原理類似於圖像生成模型(如 Stable Diffusion),但應用在音訊波形上。

  • 音訊 Token 化: 將複雜的音訊信號轉換為離散的數學標記(Tokens)。潛在擴散模型 (Latent Diffusion): 在壓縮的潛在空間中進行去噪與生成。層次化處理: 分別處理底層的節奏(Rhythm)、中層的配器(Instrumentation)與高層的人聲旋律(Vocals)。

3. 安全性與 SynthID 浮水印

為了防止版權爭議與深度偽造,Google 引入了 SynthID 技術。這是一種「數位浮水印」,它直接嵌入在音訊的頻率中:

raw-image

其中delta(t) 對人類耳朵是完全不可察覺的,但專業軟體可以掃描並識別出該音樂是由 Google AI 生成。


如何使用 Gemini 生成音樂?

目前該功能已整合在 Gemini 的「工具」選單中,支援文字提示詞以及圖片/影片上傳。

使用步驟

  1. 進入功能: 在 Gemini 網頁版或行動 App 的輸入框下方,點擊「工具」圖示(或音樂符號)。
  2. 選擇/輸入指令: 純文字: 直接描述你想要的曲風。
    例如:「創作一段 80 年代復古合成器風格的音樂,帶有活力感。」
  3. 結合影像: 上傳一張照片(如:夕陽風景),並輸入:「根據這張照片的氛圍,製作一段柔和的鋼琴配樂。」
  4. 生成與調整: Gemini 會生成一段 30 秒 的音樂,並由 Nano Banana 模型自動生成一張專屬的專輯封面圖。
  5. 下載與分享: 你可以直接下載成 MP4(含封面影片)或 MP3(純音訊)格式。

提示詞 (Prompt) 撰寫訣竅

為了獲得更高品質的結果,建議在提示詞中包含以下元素:

  • 開頭動詞: 撰寫、編寫、創作。
  • 音樂類型: Lo-fi、爵士、Afrobeat、重金屬等。
  • 情緒與節奏: 懷舊的、輕快的、每分鐘 120 拍 (BPM 120)。
  • 特定樂器: 薩克斯風、電子鼓、合成器音色。


📊 功能規格快速對覽

核心模型Lyria 3 (Google DeepMind)
最大長度30 秒
支援格式MP4 (影片) / MP3 (音訊)
封面生成由 Nano Banana 模型負責
人聲/歌詞支援自動生成與演唱安全性內建 SynthID 浮水印,
禁止模仿特定藝人聲音使用門檻需年滿 18 歲,
支援多國語言(含中日韓、德法西等)


小撇步: 如果你發現生成的音樂不夠精確,可以嘗試增加「負面提示詞」(例如:不要有打擊樂器、不要有人聲),或者透過上傳圖片來引導 AI 理解你想要的「氛圍感」。


留言
avatar-img
Hank吳的沙龍
15會員
159內容數
這不僅僅是一個 Blog,更是一個交流與分享的空間。 期待在這裡與你相遇,一起探索科技、體驗生活、夢想旅行!💖
Hank吳的沙龍的其他內容
2026/02/13
Arrow Maze - Puzzle Escape(箭矢迷宮/逃脫)是一款以黑色背景與彩色箭頭為特色的極簡邏輯益智遊戲,玩家需依照箭頭指示的特定方向點擊、滑動並消除箭頭, 釋放空間以解開複雜纏繞的迷宮,最終將所有箭頭移除。
Thumbnail
2026/02/13
Arrow Maze - Puzzle Escape(箭矢迷宮/逃脫)是一款以黑色背景與彩色箭頭為特色的極簡邏輯益智遊戲,玩家需依照箭頭指示的特定方向點擊、滑動並消除箭頭, 釋放空間以解開複雜纏繞的迷宮,最終將所有箭頭移除。
Thumbnail
看更多
你可能也想看
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
在AI生成與人的溫度之間,在學習、抗拒、嘗試與妥協中,分享我點滴拼湊適用於音樂創作的AI協力工具(非AI圖文生成),並分享電腦科學家對AI的看法,2位AI女歌手與AI時代之前帶有人的溫度的歌曲~🎶。
Thumbnail
在AI生成與人的溫度之間,在學習、抗拒、嘗試與妥協中,分享我點滴拼湊適用於音樂創作的AI協力工具(非AI圖文生成),並分享電腦科學家對AI的看法,2位AI女歌手與AI時代之前帶有人的溫度的歌曲~🎶。
Thumbnail
「無需音樂基礎,輕鬆創作:AI 作曲工具推薦!」 「打破創作瓶頸!這些 AI 工具讓你輕鬆作曲!」 「音樂創作的未來:6 款 AI 工具助你一臂之力!」 🎼 AI 作曲工具推薦排行榜 🥇 1. AIVA(Artificial Intelligence Virtual Arti
Thumbnail
「無需音樂基礎,輕鬆創作:AI 作曲工具推薦!」 「打破創作瓶頸!這些 AI 工具讓你輕鬆作曲!」 「音樂創作的未來:6 款 AI 工具助你一臂之力!」 🎼 AI 作曲工具推薦排行榜 🥇 1. AIVA(Artificial Intelligence Virtual Arti
Thumbnail
SUNO AI 是一款強大的 AI 音樂生成工具,能根據歌詞或關鍵字自動生成旋律、編曲、甚至 AI 演唱。此懶人包提供完整教學,包含註冊、使用步驟、風格設定、小技巧、以及免費和付費方案的比較,適合想快速創作音樂、沒有音樂基礎但想玩 AI 作曲,或短影音創作者等族群。
Thumbnail
SUNO AI 是一款強大的 AI 音樂生成工具,能根據歌詞或關鍵字自動生成旋律、編曲、甚至 AI 演唱。此懶人包提供完整教學,包含註冊、使用步驟、風格設定、小技巧、以及免費和付費方案的比較,適合想快速創作音樂、沒有音樂基礎但想玩 AI 作曲,或短影音創作者等族群。
Thumbnail
在AI普及的時代,創作不再只是手的技藝,而是靈魂的意圖。只要你主導節奏、選擇內容、承擔結果,AI生成的作品也是你的原創。**AI是血液,你是靈魂;原創,是你召喚的節奏。**
Thumbnail
在AI普及的時代,創作不再只是手的技藝,而是靈魂的意圖。只要你主導節奏、選擇內容、承擔結果,AI生成的作品也是你的原創。**AI是血液,你是靈魂;原創,是你召喚的節奏。**
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News