vocus logo

方格子 vocus

Gemini 可以創作音樂啦!Lyria :你的 AI 聲音旅伴(附贈提示詞指南)

樂尼-avatar-img
發佈於學習設計所 個房間
更新 發佈閱讀 12 分鐘
Lyria :你的 AI 聲音旅伴

Lyria :你的 AI 聲音旅伴

Google 的 Lyria 不是一個人,也不是飛兒樂團的歌(那是 Lydia)😅

而是一套由 Google/DeepMind 開發的 AI 音樂生成技術,被整合進幾個 Google 的 AI 平台,包括 Gemini app 、Google AI Studio 和 Vertex AI。它讓人可以用文字、圖片甚至實時互動來 創作音樂與音效,就像對一個會即興演奏的 AI 虛擬樂手下指令一樣。

raw-image

Lyria 的核心概念就像是把「文字或感覺 → 音樂」這種想像轉成現實:

  • Gemini 裡,你可以輸入一句描述(像是「輕快爵士鼓節奏 + 溫暖鋼琴 + 舒緩人聲」)AI 就會幫你生成 30 秒左右的高品質音樂或歌曲。它支援不同風格、曲風、與歌詞方向,甚至可以從圖片或影片提示中創造契合情緒的配樂。
raw-image

換一個玩心比喻:如果 Gemini 是一個「音樂工坊」,Lyria 就是裡面的 AI 樂師,當你對它說:「我要一段帶有奇幻冒險感的主題曲、加上輕柔人聲」它就會立刻用高品質樂器和旋律幫你 創作出一段曲子。你可以反覆調整描述,像跟它一起 共創音樂

可以開字幕看看它唱什麼

可以開字幕看看它唱什麼


到這聽聽看:



總結一下:

  • Lyria = Google/DeepMind 的 AI 音樂生成模型。
  • 可以用 文字/圖片/描述 來生成音樂或歌聲。
  • Gemini 應用版(30 秒音樂、帶歌詞)開發者版(API 生成音樂流)
  • 也有 RealTime 版本 讓音樂創作更像即時互動表演(Google AI Studio )。
  • 小比較:SUNO 能夠從文字/圖片/描述生成超過 30秒的音樂和歌曲(中文也通),且有更多進階編輯與混成工具,最適合想大放「藝」彩的創作者,目前應該還是很優質的工具。

不過 Lyria 對於教育、創意實驗、媒體創作、甚至遊戲背景音樂等場景都有很大想像空間 —— 你可以把這種 AI 聲音旅伴 當成探索聲音世界的 互動夥伴

raw-image

所以最簡單體驗入口就是 Gemini 應用程式:

現在在 Gemini 中,你可以直接用對話的方式請它幫你創作一首曲子。例如:「幫我寫一首關於『勇敢探險』的輕快民謠,要有吉他跟口哨聲。」

我們繼續深入認識吧!

🌟 Lyria 的三大超能力

raw-image
  • 人聲與歌詞生成 (Lyria 3 的亮點): 不僅能產生樂器伴奏,現在還能根據你的描述生成歌詞,並用極其自然的人聲唱出來。不管是充滿靈魂的 R&B 還是活潑的 Afrobeat,它都能駕馭。
  • 即時導引與控制 (Lyria RealTime): 這是我最喜歡的部分!Lyria 引入了「音樂即動詞」的概念,你可以像 DJ 一樣即時調整音樂的節拍 (BPM)亮度 (Brightness)音符密度 (Density),讓音樂隨你的心情或故事節奏動態變化。
  • 影像轉音樂 (Image-to-Audio): 你可以上傳一張照片(比如故事角色在冒險的照片),讓 Lyria 感受照片的情緒,並為這張圖量身打造一段 30 秒的配樂。
 你可以上傳一張照片(比如故事角色在冒險的照片),讓 Lyria 感受照片的情緒,並為這張圖量身打造一段 30 秒的配樂。

你可以上傳一張照片(比如故事角色在冒險的照片),讓 Lyria 感受照片的情緒,並為這張圖量身打造一段 30 秒的配樂。


對於教育工作者與創作者,Lyria 不只是一個工具,它是 「學習體驗設計」 的強力助手:

  • 故事化教學: 例如:為《學習精靈島》繪本的每個地景(例如:迷思森林、勇氣海岸)創作出專屬的主題曲。
  • 視覺與聽覺結合: 將學習素材、塗鴉筆記轉換成一段帶有氛圍感的音樂,讓閱讀筆記變成一場多感官的冒險。
raw-image


Lyria 提示詞指南

要寫出好的音樂提示詞,我為你整理了一套 「旋律鍊金術」。我們可以把提示詞拆解成五個核心元素,這能讓 AI 更精準地捕捉到你想要的氛圍:

1.🎼 旋律鍊金術:MIDST 公式

就像沉浸在音樂之中(In the MIDST of music)——把這五個成分調配進去,讓 AI 精準捕捉你要的氛圍:

raw-image
  • M (Mood / Emotion) 情緒: 音樂想傳達的感覺。例如:充滿希望的、神祕憂鬱的、熱血沸騰的、適合專注的。
  • I (Instruments) 樂器: 你可以加入一些意想不到的樂器來豐富聽感。例如:清脆的鋼琴聲、溫暖的木吉他、迷幻的合成器、輕快的長笛。也可以混搭,例如:在「1950 年代爵士樂」中加入「80 年代合成器」。如果你沒有指定,Lyria 會根據曲風自動選擇適合的樂器。
  • D (Dynamics) 動態: 描述音樂隨時間的起伏變化。例如:從安靜的鋼琴聲逐漸轉變為爆發性的副歌,或是人聲隨著曲子進行逐漸變得平靜。這能讓 AI 理解你想要的「故事弧線」,讓音樂不只是一個固定氛圍,而是一段有層次的旅程。
  • S (Style / Genre) 風格: 這是音樂的基調。例如:Lofi Hip-Hop、管弦樂(Orchestral)、8-bit 電玩風、輕爵士、後搖滾(Post-rock)。你可以選擇單一曲風,或混合不同風格。例如:90 年代的嘻哈、2000 年代的流行樂,甚至嘗試大膽混搭,像是「帶有 Motown 靈魂樂感的 K-pop」或「融入古典小提琴的 Funk 音樂」。
  • T (Tempo / Energy) 節奏與能量: 這決定了速度,直接要求快速、慢速、輕快高能量(Upbeat, High energy)、穩定的(Steady),或者使用特定的音樂類型來暗示速度,例如:慢節奏情歌 (Slow Ballad)、現代流行樂或鼓打貝斯 (Drum and Bass)。當然也可以直接寫大約 90 BPM。
raw-image

💡 提示詞思考順序: 雖然公式叫 MIDST,但實際寫提示詞時,建議按這個順序思考:風格 (S) → 節奏 (T) → 樂器 (I) → 情緒 (M) → 動態 (D)。先確定音樂的大方向與速度,再填入聲音細節與感受,最後用動態賦予音樂故事弧線。

🪄 進階提示詞技巧

除了公式,這裡有幾個讓音樂更具「靈魂」的小撇步:

  1. 具備畫面的敘事描述: Lyria 很擅長處理具象的描述。與其只說「悲傷的音樂」,不如說:「像是雨天獨自走在空蕩盪的街道上,遠處傳來模糊的薩克斯風聲。」 這種帶有空間感的描述,會讓 AI 生成更有層次感的背景音。
  2. 指定結構變換: 你可以嘗試描述音樂的進程,例如:「開頭是安靜的鋼琴,30 秒後加入強大的鼓點,最後以空靈的人聲結尾。」
  3. 使用「負向描述」(如果工具支援): 如果你不想要某種聲音,可以明確點出。例如:「不要電子鼓聲」、「人聲不要太尖銳」。
  4. 連結故事的情境: 在設計學習體驗時,可以把場景帶入。例如:「適合在迷霧森林探索的氛圍,帶有神祕感但又不失好奇心,節奏像是在森林中輕快跳躍。」

樂尼的小提醒

寫提示詞就像是在玩一場冒險遊戲,第一次不一定會中,但你可以根據生成的結果,調整其中一個參數(例如換掉樂器,或加強情緒)。

2. 影像轉音樂 (Image-to-Music)

當你上傳圖片(例如主角的探險圖)讓 Lyria 參考時,可以觀察以下細節來優化提示詞:

  • 主角是誰?(Who): 觀察圖中人物的情緒(開心或悲傷)、姿勢、穿著,甚至是生物種類(人類、動物或外星人)。
  • 場景在哪?(Where): 景深與背景細節也很重要,是城市街道還是充滿異域風情的地景?是否有群眾或野生動物?。
  • 發生什麼事?(What): 圖片描述的是正式的肖像畫、一場激烈的比賽,還是獨自在荒野冒險?Lyria 會根據這些設定來決定音樂的整體氛圍。

應用案例:為故事場景配樂。


🎨 實戰範例:為小旭的冒險配音

這是樂尼自己的創作範例:

  • 場景一:小旭在「學習探險家學院」圖書館安靜閱讀

    提示詞: Lofi Hip-hop, Relaxing and focused mood, soft piano melodies, sound of pages turning in the background, steady 80 BPM, warm and cozy vibe.

  • 場景二:啟動「學習飛輪」,驅散迷思迷霧(熱血時刻)

    提示詞: Epic Orchestral, Inspiring and powerful, rising intensity, cinematic strings and taiko drums, high energy, fast tempo, feeling of a grand breakthrough.

  • 場景三:認識新的「學習精靈」(奇幻相遇)

    提示詞: Whimsical and magical style, glockenspiel and light woodwinds, playful staccato rhythm, sparkling synth textures, sense of wonder and curiosity.

3. 人聲與歌詞技巧 (Vocals & Lyrics)

Lyria 3 在人聲處理上有非常細膩的控制選項:

  • 建立人聲檔案 (Vocal Profile): 詳細描述你想要的人聲特質,包括性別、音域(男中音、高音女高音)、聲音質地(渾厚、沙啞、有靈魂感、帶氣息感)以及演唱語言。
  • 歌詞格式化:
    • 在歌詞前加上 Lyrics: 前綴。
    • 使用 圓括號 ( ) 來標註合音或回音。例如:Lyrics: Let's go (go)
  • 讓 AI 協助作詞: 如果沒有現成歌詞,可以直接描述主題(如:關於成功、關於生日、關於愛),讓 Lyria 為你生成。

4. 實驗性玩法 (Experimentation)

想要更獨特的聲音,可以嘗試這些進階技巧:

  • 音樂性實驗: 嘗試要求「和聲 (Harmonies)」或「對位法 (Counterpoints)」,或使用不尋常的樂器進行多層次的編排。
  • 節奏律動: 描述具體的人聲節奏模式,像是「快節奏 (Fast-paced)」或「慵懶的律動 (Laid-back groove)」。
  • 多樣化圖源: 除了照片,也可以嘗試上傳歷史名畫、卡通插畫,甚至是科學圖表,看看 Lyria 會如何解讀這些視覺資訊。

這些技巧能讓你更有條理地把腦中的想像轉化為現實!


🎵 讓音樂成為你的另一種語言

AI 音樂生成不是要取代音樂家,而是讓每個人都能用「聲音」說故事。

不管你是想為課堂增添一段氛圍音樂、為影片找到完美配樂,還是純粹好奇「我腦中的畫面聽起來是什麼樣子」——Lyria 都能成為你的起點。

raw-image

記住 MIDST 公式,帶著玩心去實驗。第一次生成的結果不完美?太正常了。調整一個參數、換個形容詞、加一句畫面描述,每一次微調都是一次與 AI 的共創對話。

音樂是看不見的風景,而你就是那位拿著提示詞畫筆的旅人。 🌊

現在,打開 Gemini,寫下你的第一句 MIDST,讓想像變成聽得見的現實吧!


資源

延伸註解

除了基本的文字生成版本外,還有一種名為 Lyria RealTime 的變體,它能進行 即時音樂生成與交互,讓你像在彈奏樂器一樣在 玩音樂、混合風格、控制節奏與音色,就像即興樂隊。(Google DeepMind)(直接到這玩

Afrobeat 是一種源自西非(主要是奈及利亞)的音樂風格,融合了傳統約魯巴音樂、爵士樂、放克和高生命(Highlife)等元素,以複雜的節奏、打擊樂器和管樂為特色。在文中指 Lyria AI 能夠生成並演唱這種充滿活力的非洲節奏音樂風格。

留言
avatar-img
學習玩家|啟動玩心學習
220會員
249內容數
學習不該只是苦讀,而是一場充滿好奇的探索。這裡分享 AI × 學習設計的實驗與心得,用玩心重新點燃學習動機。無論你是教育工作者、自學者,或想讓學習更有好玩的人,都歡迎加入,一起把學習變成最好玩的事!
2026/01/29
OpenAI 發布了全新的AI科研寫作協作工具 Prism,整合了最新的GPT模型。Prism 提供LaTeX原生編輯、AI論文輔助、多人即時協作、公式圖解等功能,簡化論文撰寫、文獻管理及輸出流程。如同稜鏡, Prism 將複雜的科研內容拆解為清晰可見的脈絡,成為科研人員的一站式寫作解決方案。
Thumbnail
2026/01/29
OpenAI 發布了全新的AI科研寫作協作工具 Prism,整合了最新的GPT模型。Prism 提供LaTeX原生編輯、AI論文輔助、多人即時協作、公式圖解等功能,簡化論文撰寫、文獻管理及輸出流程。如同稜鏡, Prism 將複雜的科研內容拆解為清晰可見的脈絡,成為科研人員的一站式寫作解決方案。
Thumbnail
2026/01/26
本文介紹樂尼創作的首本音樂繪本《愛畫圖的貓熊》,分享創作理念,以及如何透過貓熊、家人互動、畫畫等元素,展現家庭間柔軟、真實的共創時刻。文章詳細解析歌詞意涵,並分享運用 AI 工具(SUNO、ChatGPT)輔助歌詞、插畫、音樂創作及整合的經驗與小撇步。
Thumbnail
2026/01/26
本文介紹樂尼創作的首本音樂繪本《愛畫圖的貓熊》,分享創作理念,以及如何透過貓熊、家人互動、畫畫等元素,展現家庭間柔軟、真實的共創時刻。文章詳細解析歌詞意涵,並分享運用 AI 工具(SUNO、ChatGPT)輔助歌詞、插畫、音樂創作及整合的經驗與小撇步。
Thumbnail
2026/01/23
分享運用 Notion AI 將社群知識轉化為個人可用的知識卡:如何透過 Notion AI 進行摘要、研究、延伸,留下個人反思與行動點,最終將知識管理提升至專案管理層次。強調「個人化的智慧與行動建議」是 Notion AI 的關鍵優勢,並提出建立知識庫結構與累積個人紀錄是替 AI 打好地基的方法。
Thumbnail
2026/01/23
分享運用 Notion AI 將社群知識轉化為個人可用的知識卡:如何透過 Notion AI 進行摘要、研究、延伸,留下個人反思與行動點,最終將知識管理提升至專案管理層次。強調「個人化的智慧與行動建議」是 Notion AI 的關鍵優勢,並提出建立知識庫結構與累積個人紀錄是替 AI 打好地基的方法。
Thumbnail
看更多
你可能也想看
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
vocus 慶祝推出 App,舉辦 2026 全站慶。推出精選內容與數位商品折扣,訂單免費與紅包抽獎、新註冊會員專屬活動、Boba Boost 贊助抽紅包,以及全站徵文,並邀請你一起來回顧過去的一年, vocus 與創作者共同留下了哪些精彩創作。
Thumbnail
自 Google Imagen 3 模型推出後,AI 領域掀起巨浪。本文作者從 ChatGPT 資深用戶的角度出發,深入比較 Gemini 與 ChatGPT 的優缺點,並分享 Google 家庭群組共享 AI 方案的建立過程與注意事項。
Thumbnail
自 Google Imagen 3 模型推出後,AI 領域掀起巨浪。本文作者從 ChatGPT 資深用戶的角度出發,深入比較 Gemini 與 ChatGPT 的優缺點,並分享 Google 家庭群組共享 AI 方案的建立過程與注意事項。
Thumbnail
Chrome 上一堆密密麻麻的標籤頁即將成為過去式?2025/12/11 Google 無預警的拋出了Disco 瀏覽器和它的殺手鐧 GenTabs ,這是 Google 在面對 OpenAI、Perplexity 這些後起之秀圍剿時,端出的大招。
Thumbnail
Chrome 上一堆密密麻麻的標籤頁即將成為過去式?2025/12/11 Google 無預警的拋出了Disco 瀏覽器和它的殺手鐧 GenTabs ,這是 Google 在面對 OpenAI、Perplexity 這些後起之秀圍剿時,端出的大招。
Thumbnail
Google 在 2025/12/12 宣布,Google Translate 正式導入 Gemini 翻譯能力,重點不再只是逐字翻,而是更理解語意與語氣。同時測試「耳機即時語音翻譯」功能,讓 speech-to-speech 翻譯直接在耳機中進行,提升即時溝通體驗。
Thumbnail
Google 在 2025/12/12 宣布,Google Translate 正式導入 Gemini 翻譯能力,重點不再只是逐字翻,而是更理解語意與語氣。同時測試「耳機即時語音翻譯」功能,讓 speech-to-speech 翻譯直接在耳機中進行,提升即時溝通體驗。
Thumbnail
今年在 Google I/O 有幸看到 Hassabis 本人幾秒,DeepMind 和共同創辦人 Demis Hassabis 的這個題目,也一直都在待寫清單中。 前陣子,在介紹 Founders Fund 時,發現 Demis Hassabis 當初在說服 Peter Thiel 投資 Dee
Thumbnail
今年在 Google I/O 有幸看到 Hassabis 本人幾秒,DeepMind 和共同創辦人 Demis Hassabis 的這個題目,也一直都在待寫清單中。 前陣子,在介紹 Founders Fund 時,發現 Demis Hassabis 當初在說服 Peter Thiel 投資 Dee
Thumbnail
📌前言|這不是懶人包,是思考練習場 當一個問題同時丟給兩個不同的 AI 模型,會發生什麼事?這不是科技趣聞,也不是聊天紀錄,而是一場「實驗性對話測試」,目的是釐清一件事情: 當語言模型被問及「政策協議是否可終止」時,是否能正確處理政治誠信與國際協議實踐層次的邏輯斷層? 我們挑的案例,是臺灣歷
Thumbnail
📌前言|這不是懶人包,是思考練習場 當一個問題同時丟給兩個不同的 AI 模型,會發生什麼事?這不是科技趣聞,也不是聊天紀錄,而是一場「實驗性對話測試」,目的是釐清一件事情: 當語言模型被問及「政策協議是否可終止」時,是否能正確處理政治誠信與國際協議實踐層次的邏輯斷層? 我們挑的案例,是臺灣歷
Thumbnail
本文分享使用 Nano Banana AI 生成動畫分鏡的技巧與心得,包括準備參考圖片、撰寫完整提示詞、運用攝影與藝術術語、迭代與對話式編輯等,並提供一個精確有效的提示詞結構範例,助你輕鬆創作動畫分鏡。
Thumbnail
本文分享使用 Nano Banana AI 生成動畫分鏡的技巧與心得,包括準備參考圖片、撰寫完整提示詞、運用攝影與藝術術語、迭代與對話式編輯等,並提供一個精確有效的提示詞結構範例,助你輕鬆創作動畫分鏡。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News