Gemini 可以創作音樂啦！Lyria ：你的 AI 聲音旅伴（附贈提示詞指南）

發佈於學習設計所等個房間

2026/05/04 更新2026/02/19 發佈閱讀 13 分鐘

Lyria ：你的 AI 聲音旅伴

Google 的 Lyria 不是一個人，也不是飛兒樂團的歌（那是 Lydia）😅

而是一套由 Google/DeepMind 開發的 AI 音樂生成技術，被整合進幾個 Google 的 AI 平台，包括 Gemini app 、Google AI Studio 和 Vertex AI。它讓人可以用文字、圖片甚至實時互動來創作音樂與音效，就像對一個會即興演奏的 AI 虛擬樂手下指令一樣。

Lyria 的核心概念就像是把「文字或感覺 → 音樂」這種想像轉成現實：

在 Gemini 裡，你可以輸入一句描述（像是「輕快爵士鼓節奏 + 溫暖鋼琴 + 舒緩人聲」）AI 就會幫你生成 30 秒左右的高品質音樂或歌曲。它支援不同風格、曲風、與歌詞方向，甚至可以從圖片或影片提示中創造契合情緒的配樂。更新：模型選用「思考型」，就能製作超過 30秒的音樂囉！

換一個玩心比喻：如果 Gemini 是一個「音樂工坊」，Lyria 就是裡面的 AI 樂師，當你對它說：「我要一段帶有奇幻冒險感的主題曲、加上輕柔人聲」它就會立刻用高品質樂器和旋律幫你 創作出一段曲子。你可以反覆調整描述，像跟它一起 共創音樂。

可以開字幕看看它唱什麼

到這聽聽看：

總結一下：

Lyria = Google/DeepMind 的 AI 音樂生成模型。
可以用 文字/圖片/描述 來生成音樂或歌聲。
有 Gemini 應用版（30 秒音樂、帶歌詞） 和 開發者版（API 生成音樂流）。
也有 RealTime 版本 讓音樂創作更像即時互動表演（Google AI Studio ）。
小比較：SUNO 能夠從文字/圖片/描述生成超過 30秒的音樂和歌曲（中文也通），且有更多進階編輯與混成工具，最適合想大放「藝」彩的創作者，目前應該還是很優質的工具。

不過 Lyria 對於教育、創意實驗、媒體創作、甚至遊戲背景音樂等場景都有很大想像空間 —— 你可以把這種 AI 聲音旅伴 當成探索聲音世界的 互動夥伴。

所以最簡單體驗入口就是 Gemini 應用程式：

現在在 Gemini 中，你可以直接用對話的方式請它幫你創作一首曲子。例如：「幫我寫一首關於『勇敢探險』的輕快民謠，要有吉他跟口哨聲。」

我們繼續深入認識吧！

🌟 Lyria 的三大超能力

人聲與歌詞生成 (Lyria 3 的亮點)： 不僅能產生樂器伴奏，現在還能根據你的描述生成歌詞，並用極其自然的人聲唱出來。不管是充滿靈魂的 R&B 還是活潑的 Afrobeat，它都能駕馭。
即時導引與控制 (Lyria RealTime)： 這是我最喜歡的部分！Lyria 引入了「音樂即動詞」的概念，你可以像 DJ 一樣即時調整音樂的節拍 (BPM)、亮度 (Brightness) 或音符密度 (Density)，讓音樂隨你的心情或故事節奏動態變化。
影像轉音樂 (Image-to-Audio)： 你可以上傳一張照片（比如故事角色在冒險的照片），讓 Lyria 感受照片的情緒，並為這張圖量身打造一段 30 秒的配樂。

你可以上傳一張照片（比如故事角色在冒險的照片），讓 Lyria 感受照片的情緒，並為這張圖量身打造一段 30 秒的配樂。

對於教育工作者與創作者，Lyria 不只是一個工具，它是 「學習體驗設計」 的強力助手：

故事化教學： 例如：為《學習精靈島》繪本的每個地景（例如：迷思森林、勇氣海岸）創作出專屬的主題曲。
視覺與聽覺結合： 將學習素材、塗鴉筆記轉換成一段帶有氛圍感的音樂，讓閱讀筆記變成一場多感官的冒險。

▍Lyria 提示詞指南

要寫出好的音樂提示詞，我為你整理了一套 「旋律鍊金術」。我們可以把提示詞拆解成五個核心元素，這能讓 AI 更精準地捕捉到你想要的氛圍：

1.🎼 旋律鍊金術：MIDST 公式

就像沉浸在音樂之中（In the MIDST of music）——把這五個成分調配進去，讓 AI 精準捕捉你要的氛圍：

M (Mood / Emotion) 情緒： 音樂想傳達的感覺。例如：充滿希望的、神祕憂鬱的、熱血沸騰的、適合專注的。
I (Instruments) 樂器： 你可以加入一些意想不到的樂器來豐富聽感。例如：清脆的鋼琴聲、溫暖的木吉他、迷幻的合成器、輕快的長笛。也可以混搭，例如：在「1950 年代爵士樂」中加入「80 年代合成器」。如果你沒有指定，Lyria 會根據曲風自動選擇適合的樂器。
D (Dynamics) 動態： 描述音樂隨時間的起伏變化。例如：從安靜的鋼琴聲逐漸轉變為爆發性的副歌，或是人聲隨著曲子進行逐漸變得平靜。這能讓 AI 理解你想要的「故事弧線」，讓音樂不只是一個固定氛圍，而是一段有層次的旅程。
S (Style / Genre) 風格： 這是音樂的基調。例如：Lofi Hip-Hop、管弦樂（Orchestral）、8-bit 電玩風、輕爵士、後搖滾（Post-rock）。你可以選擇單一曲風，或混合不同風格。例如：90 年代的嘻哈、2000 年代的流行樂，甚至嘗試大膽混搭，像是「帶有 Motown 靈魂樂感的 K-pop」或「融入古典小提琴的 Funk 音樂」。
T (Tempo / Energy) 節奏與能量： 這決定了速度，直接要求快速、慢速、輕快高能量（Upbeat, High energy）、穩定的（Steady），或者使用特定的音樂類型來暗示速度，例如：慢節奏情歌 (Slow Ballad)、現代流行樂或鼓打貝斯 (Drum and Bass)。當然也可以直接寫大約 90 BPM。

💡 提示詞思考順序： 雖然公式叫 MIDST，但實際寫提示詞時，建議按這個順序思考：風格 (S) → 節奏 (T) → 樂器 (I) → 情緒 (M) → 動態 (D)。先確定音樂的大方向與速度，再填入聲音細節與感受，最後用動態賦予音樂故事弧線。

🪄 進階提示詞技巧

除了公式，這裡有幾個讓音樂更具「靈魂」的小撇步：

具備畫面的敘事描述： Lyria 很擅長處理具象的描述。與其只說「悲傷的音樂」，不如說：「像是雨天獨自走在空蕩盪的街道上，遠處傳來模糊的薩克斯風聲。」 這種帶有空間感的描述，會讓 AI 生成更有層次感的背景音。
指定結構變換： 你可以嘗試描述音樂的進程，例如：「開頭是安靜的鋼琴，30 秒後加入強大的鼓點，最後以空靈的人聲結尾。」
使用「負向描述」（如果工具支援）： 如果你不想要某種聲音，可以明確點出。例如：「不要電子鼓聲」、「人聲不要太尖銳」。
連結故事的情境： 在設計學習體驗時，可以把場景帶入。例如：「適合在迷霧森林探索的氛圍，帶有神祕感但又不失好奇心，節奏像是在森林中輕快跳躍。」

樂尼的小提醒

寫提示詞就像是在玩一場冒險遊戲，第一次不一定會中，但你可以根據生成的結果，調整其中一個參數（例如換掉樂器，或加強情緒）。

2. 影像轉音樂 (Image-to-Music)

當你上傳圖片（例如主角的探險圖）讓 Lyria 參考時，可以觀察以下細節來優化提示詞：

主角是誰？(Who)： 觀察圖中人物的情緒（開心或悲傷）、姿勢、穿著，甚至是生物種類（人類、動物或外星人）。
場景在哪？(Where)： 景深與背景細節也很重要，是城市街道還是充滿異域風情的地景？是否有群眾或野生動物？。
發生什麼事？(What)： 圖片描述的是正式的肖像畫、一場激烈的比賽，還是獨自在荒野冒險？Lyria 會根據這些設定來決定音樂的整體氛圍。

應用案例：為故事場景配樂。

🎨 實戰範例：為小旭的冒險配音

這是樂尼自己的創作範例：

場景一：小旭在「學習探險家學院」圖書館安靜閱讀
提示詞： Lofi Hip-hop, Relaxing and focused mood, soft piano melodies, sound of pages turning in the background, steady 80 BPM, warm and cozy vibe.
場景二：啟動「學習飛輪」，驅散迷思迷霧（熱血時刻）
提示詞： Epic Orchestral, Inspiring and powerful, rising intensity, cinematic strings and taiko drums, high energy, fast tempo, feeling of a grand breakthrough.
場景三：認識新的「學習精靈」（奇幻相遇）
提示詞： Whimsical and magical style, glockenspiel and light woodwinds, playful staccato rhythm, sparkling synth textures, sense of wonder and curiosity.

3. 人聲與歌詞技巧 (Vocals & Lyrics)

Lyria 3 在人聲處理上有非常細膩的控制選項：

建立人聲檔案 (Vocal Profile)： 詳細描述你想要的人聲特質，包括性別、音域（男中音、高音女高音）、聲音質地（渾厚、沙啞、有靈魂感、帶氣息感）以及演唱語言。
歌詞格式化：
- 在歌詞前加上 Lyrics: 前綴。
- 使用 圓括號 ( ) 來標註合音或回音。例如：Lyrics: Let's go (go)。
讓 AI 協助作詞： 如果沒有現成歌詞，可以直接描述主題（如：關於成功、關於生日、關於愛），讓 Lyria 為你生成。

4. 實驗性玩法 (Experimentation)

想要更獨特的聲音，可以嘗試這些進階技巧：

音樂性實驗： 嘗試要求「和聲 (Harmonies)」或「對位法 (Counterpoints)」，或使用不尋常的樂器進行多層次的編排。
節奏律動： 描述具體的人聲節奏模式，像是「快節奏 (Fast-paced)」或「慵懶的律動 (Laid-back groove)」。
多樣化圖源： 除了照片，也可以嘗試上傳歷史名畫、卡通插畫，甚至是科學圖表，看看 Lyria 會如何解讀這些視覺資訊。

這些技巧能讓你更有條理地把腦中的想像轉化為現實！

🎵 讓音樂成為你的另一種語言

AI 音樂生成不是要取代音樂家，而是讓每個人都能用「聲音」說故事。

不管你是想為課堂增添一段氛圍音樂、為影片找到完美配樂，還是純粹好奇「我腦中的畫面聽起來是什麼樣子」——Lyria 都能成為你的起點。

記住 MIDST 公式，帶著玩心去實驗。第一次生成的結果不完美？太正常了。調整一個參數、換個形容詞、加一句畫面描述，每一次微調都是一次與 AI 的共創對話。

音樂是看不見的風景，而你就是那位拿著提示詞畫筆的旅人。 🌊

現在，打開 Gemini，寫下你的第一句 MIDST，讓想像變成聽得見的現實吧！

資源

重點圖文小卡

延伸註解

除了基本的文字生成版本外，還有一種名為 Lyria RealTime 的變體，它能進行即時音樂生成與交互，讓你像在彈奏樂器一樣在玩音樂、混合風格、控制節奏與音色，就像即興樂隊。(Google DeepMind)（直接到這玩）

Afrobeat 是一種源自西非（主要是奈及利亞）的音樂風格,融合了傳統約魯巴音樂、爵士樂、放克和高生命(Highlife)等元素,以複雜的節奏、打擊樂器和管樂為特色。在文中指 Lyria AI 能夠生成並演唱這種充滿活力的非洲節奏音樂風格。

含 AI 應用內容

學習玩家｜啟動玩心學習AI 微學院啟動｜AI 工具增能學習玩家｜啟動玩心學習AI 微學院Google AI學習玩家｜啟動玩心學習學習設計所教育 AI 應用

留言

學習玩家｜啟動玩心學習

243會員

271內容數

Hi, 我是樂尼，一起把 AI 變成教學引擎，讓學習玩起來。我相信學習本來就可以很好玩...只是我們常常忘了怎麼玩。學習玩家是學習基地：分享 AI 教學應用、學習策略與學習體驗設計，共同找回教學的樂趣，創造讓學習者真正動起來的體驗。希望有一天，「喜歡學習」不再是少數人的特權，而是每個人都能找回的本能。

學習玩家｜啟動玩心學習的其他內容

2026/01/29

Prism：科研寫作 AI 協作空間，簡化論文寫作與文獻管理｜OpenAI 出品

OpenAI 發布了全新的AI科研寫作協作工具 Prism，整合了最新的GPT模型。Prism 提供LaTeX原生編輯、AI論文輔助、多人即時協作、公式圖解等功能，簡化論文撰寫、文獻管理及輸出流程。如同稜鏡， Prism 將複雜的科研內容拆解為清晰可見的脈絡，成為科研人員的一站式寫作解決方案。

2026/01/29

Prism：科研寫作 AI 協作空間，簡化論文寫作與文獻管理｜OpenAI 出品

2026/01/26

《愛畫圖的貓熊》音樂繪本創作｜保存親子共創時光｜SUNO x ChatGPT

本文介紹樂尼創作的首本音樂繪本《愛畫圖的貓熊》，分享創作理念，以及如何透過貓熊、家人互動、畫畫等元素，展現家庭間柔軟、真實的共創時刻。文章詳細解析歌詞意涵，並分享運用 AI 工具（SUNO、ChatGPT）輔助歌詞、插畫、音樂創作及整合的經驗與小撇步。

2026/01/26

《愛畫圖的貓熊》音樂繪本創作｜保存親子共創時光｜SUNO x ChatGPT

2026/01/23

將零碎的社群知識轉化為個人知識卡：利用 Notion AI 提升學習成效與行動力

分享運用 Notion AI 將社群知識轉化為個人可用的知識卡：如何透過 Notion AI 進行摘要、研究、延伸，留下個人反思與行動點，最終將知識管理提升至專案管理層次。強調「個人化的智慧與行動建議」是 Notion AI 的關鍵優勢，並提出建立知識庫結構與累積個人紀錄是替 AI 打好地基的方法。

2026/01/23

將零碎的社群知識轉化為個人知識卡：利用 Notion AI 提升學習成效與行動力

#AI 的其他內容

《穿著Prada的惡魔2》(The Devil Wears Prada 2) - 致我們這群過時的人

方格子 vocus 官方沙龍

2026 年 5 月 iPAS 考試倒數一個月🔥vocus 助你一臂之力，購買指定備考數位商品抽訂單全免 🎯

你可能也想看

AI.ESG.數位轉型顧問沈重宗

🌟【Google Gemini超狂新功能】圖片編輯+語言學習實驗室開箱！台灣用戶搶先玩✨ 📸 AI修圖神器上

2025/05/02

AI.ESG.數位轉型顧問沈重宗

🌟【Google Gemini超狂新功能】圖片編輯+語言學習實驗室開箱！台灣用戶搶先玩✨ 📸 AI修圖神器上

2025/05/02

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：流動、跨域、變形的「生存之道」

當代名導基里爾．賽勒布倫尼科夫身兼電影、劇場與歌劇導演，其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後，他持續以創作回應專制體制的壓迫。《傳奇：帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析，解構賽勒布倫尼科夫如何利用影劇雙棲的特質，在荒謬世道中尋找藝術的「生存之道」。

#釀電影#釀評論#藝術評論

2026/02/28