Gemini 正式推出了音樂生成功能: Lyria 3 音樂模型

更新 發佈閱讀 5 分鐘

Gemini 已經正式推出了音樂生成功能,這背後是由 Google DeepMind 開發的最新音樂模型 Lyria 3 所驅動。
這項功能讓 Gemini 從單純的「文字/圖片處理」進化到能理解並創作出具備節奏、旋律、人聲甚至歌詞的完整音樂。
以下連結為Lyria 3替我產生的歌曲: Prompt: 「一首關於台北雨夜的爵士樂」
https://gemini.google.com/share/59d40158a347

曲目資訊:

  • 標題: 雨夜台北 (Rainy Night Taipei)
  • 風格: 流暢爵士 / 華語流行
  • 氛圍: 溫柔、懷舊、都市感
vocus|新世代的創作平台

以下為你詳細解析其技術原理與具體使用方式:


技術原理:Lyria 3 是如何運作的?

不同於早期的 AI 只是簡單地拼接音訊片段,Lyria 3 採用了更深層的架構來處理音樂的複雜性:

1. 結構化音樂生成 (Structured Generation)

音樂包含極高的資訊密度,每一秒都涉及節拍、音符與和聲的細微變化。Lyria 3 具備 長程一致性 (Long-range Coherence),能確保一段 30 秒的音樂從開頭到結尾在旋律與節奏上邏輯一致,而不會出現突兀的斷裂感。

2. 多模態編碼與擴散模型

Lyria 3 的核心原理類似於圖像生成模型(如 Stable Diffusion),但應用在音訊波形上。

  • 音訊 Token 化: 將複雜的音訊信號轉換為離散的數學標記(Tokens)。潛在擴散模型 (Latent Diffusion): 在壓縮的潛在空間中進行去噪與生成。層次化處理: 分別處理底層的節奏(Rhythm)、中層的配器(Instrumentation)與高層的人聲旋律(Vocals)。

3. 安全性與 SynthID 浮水印

為了防止版權爭議與深度偽造,Google 引入了 SynthID 技術。這是一種「數位浮水印」,它直接嵌入在音訊的頻率中:

vocus|新世代的創作平台

其中delta(t) 對人類耳朵是完全不可察覺的,但專業軟體可以掃描並識別出該音樂是由 Google AI 生成。


如何使用 Gemini 生成音樂?

目前該功能已整合在 Gemini 的「工具」選單中,支援文字提示詞以及圖片/影片上傳。

使用步驟

  1. 進入功能: 在 Gemini 網頁版或行動 App 的輸入框下方,點擊「工具」圖示(或音樂符號)。
  2. 選擇/輸入指令: 純文字: 直接描述你想要的曲風。
    例如:「創作一段 80 年代復古合成器風格的音樂,帶有活力感。」
  3. 結合影像: 上傳一張照片(如:夕陽風景),並輸入:「根據這張照片的氛圍,製作一段柔和的鋼琴配樂。」
  4. 生成與調整: Gemini 會生成一段 30 秒 的音樂,並由 Nano Banana 模型自動生成一張專屬的專輯封面圖。
  5. 下載與分享: 你可以直接下載成 MP4(含封面影片)或 MP3(純音訊)格式。

提示詞 (Prompt) 撰寫訣竅

為了獲得更高品質的結果,建議在提示詞中包含以下元素:

  • 開頭動詞: 撰寫、編寫、創作。
  • 音樂類型: Lo-fi、爵士、Afrobeat、重金屬等。
  • 情緒與節奏: 懷舊的、輕快的、每分鐘 120 拍 (BPM 120)。
  • 特定樂器: 薩克斯風、電子鼓、合成器音色。


📊 功能規格快速對覽

核心模型Lyria 3 (Google DeepMind)
最大長度30 秒
支援格式MP4 (影片) / MP3 (音訊)
封面生成由 Nano Banana 模型負責
人聲/歌詞支援自動生成與演唱安全性內建 SynthID 浮水印,
禁止模仿特定藝人聲音使用門檻需年滿 18 歲,
支援多國語言(含中日韓、德法西等)


小撇步: 如果你發現生成的音樂不夠精確,可以嘗試增加「負面提示詞」(例如:不要有打擊樂器、不要有人聲),或者透過上傳圖片來引導 AI 理解你想要的「氛圍感」。


留言
avatar-img
Hank吳的沙龍
17會員
161內容數
這不僅僅是一個 Blog,更是一個交流與分享的空間。 期待在這裡與你相遇,一起探索科技、體驗生活、夢想旅行!💖
Hank吳的沙龍的其他內容
2026/02/13
Arrow Maze - Puzzle Escape(箭矢迷宮/逃脫)是一款以黑色背景與彩色箭頭為特色的極簡邏輯益智遊戲,玩家需依照箭頭指示的特定方向點擊、滑動並消除箭頭, 釋放空間以解開複雜纏繞的迷宮,最終將所有箭頭移除。
Thumbnail
2026/02/13
Arrow Maze - Puzzle Escape(箭矢迷宮/逃脫)是一款以黑色背景與彩色箭頭為特色的極簡邏輯益智遊戲,玩家需依照箭頭指示的特定方向點擊、滑動並消除箭頭, 釋放空間以解開複雜纏繞的迷宮,最終將所有箭頭移除。
Thumbnail
看更多
你可能也想看
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
在AI生成與人的溫度之間,在學習、抗拒、嘗試與妥協中,分享我點滴拼湊適用於音樂創作的AI協力工具(非AI圖文生成),並分享電腦科學家對AI的看法,2位AI女歌手與AI時代之前帶有人的溫度的歌曲~🎶。
Thumbnail
在AI生成與人的溫度之間,在學習、抗拒、嘗試與妥協中,分享我點滴拼湊適用於音樂創作的AI協力工具(非AI圖文生成),並分享電腦科學家對AI的看法,2位AI女歌手與AI時代之前帶有人的溫度的歌曲~🎶。
Thumbnail
「無需音樂基礎,輕鬆創作:AI 作曲工具推薦!」 「打破創作瓶頸!這些 AI 工具讓你輕鬆作曲!」 「音樂創作的未來:6 款 AI 工具助你一臂之力!」 🎼 AI 作曲工具推薦排行榜 🥇 1. AIVA(Artificial Intelligence Virtual Arti
Thumbnail
「無需音樂基礎,輕鬆創作:AI 作曲工具推薦!」 「打破創作瓶頸!這些 AI 工具讓你輕鬆作曲!」 「音樂創作的未來:6 款 AI 工具助你一臂之力!」 🎼 AI 作曲工具推薦排行榜 🥇 1. AIVA(Artificial Intelligence Virtual Arti
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
SUNO AI 是一款強大的 AI 音樂生成工具,能根據歌詞或關鍵字自動生成旋律、編曲、甚至 AI 演唱。此懶人包提供完整教學,包含註冊、使用步驟、風格設定、小技巧、以及免費和付費方案的比較,適合想快速創作音樂、沒有音樂基礎但想玩 AI 作曲,或短影音創作者等族群。
Thumbnail
SUNO AI 是一款強大的 AI 音樂生成工具,能根據歌詞或關鍵字自動生成旋律、編曲、甚至 AI 演唱。此懶人包提供完整教學,包含註冊、使用步驟、風格設定、小技巧、以及免費和付費方案的比較,適合想快速創作音樂、沒有音樂基礎但想玩 AI 作曲,或短影音創作者等族群。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
在AI普及的時代,創作不再只是手的技藝,而是靈魂的意圖。只要你主導節奏、選擇內容、承擔結果,AI生成的作品也是你的原創。**AI是血液,你是靈魂;原創,是你召喚的節奏。**
Thumbnail
在AI普及的時代,創作不再只是手的技藝,而是靈魂的意圖。只要你主導節奏、選擇內容、承擔結果,AI生成的作品也是你的原創。**AI是血液,你是靈魂;原創,是你召喚的節奏。**
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News