
Lyria :你的 AI 聲音旅伴
Google 的 Lyria 不是一個人,也不是飛兒樂團的歌(那是 Lydia)😅
而是一套由 Google/DeepMind 開發的 AI 音樂生成技術,被整合進幾個 Google 的 AI 平台,包括 Gemini app 、Google AI Studio 和 Vertex AI。它讓人可以用文字、圖片甚至實時互動來 創作音樂與音效,就像對一個會即興演奏的 AI 虛擬樂手下指令一樣。

- 在 Gemini 裡,你可以輸入一句描述(像是「輕快爵士鼓節奏 + 溫暖鋼琴 + 舒緩人聲」)AI 就會幫你生成 30 秒左右的高品質音樂或歌曲。它支援不同風格、曲風、與歌詞方向,甚至可以從圖片或影片提示中創造契合情緒的配樂。

換一個玩心比喻:如果 Gemini 是一個「音樂工坊」,Lyria 就是裡面的 AI 樂師,當你對它說:「我要一段帶有奇幻冒險感的主題曲、加上輕柔人聲」它就會立刻用高品質樂器和旋律幫你 創作出一段曲子。你可以反覆調整描述,像跟它一起 共創音樂。

可以開字幕看看它唱什麼
到這聽聽看:
總結一下:
- Lyria = Google/DeepMind 的 AI 音樂生成模型。
- 可以用 文字/圖片/描述 來生成音樂或歌聲。
- 有 Gemini 應用版(30 秒音樂、帶歌詞) 和 開發者版(API 生成音樂流)。
- 也有 RealTime 版本 讓音樂創作更像即時互動表演(Google AI Studio )。
- 小比較:SUNO 能夠從文字/圖片/描述生成超過 30秒的音樂和歌曲(中文也通),且有更多進階編輯與混成工具,最適合想大放「藝」彩的創作者,目前應該還是很優質的工具。
不過 Lyria 對於教育、創意實驗、媒體創作、甚至遊戲背景音樂等場景都有很大想像空間 —— 你可以把這種 AI 聲音旅伴 當成探索聲音世界的 互動夥伴。

所以最簡單體驗入口就是 Gemini 應用程式:
現在在 Gemini 中,你可以直接用對話的方式請它幫你創作一首曲子。例如:「幫我寫一首關於『勇敢探險』的輕快民謠,要有吉他跟口哨聲。」
我們繼續深入認識吧!
🌟 Lyria 的三大超能力

- 人聲與歌詞生成 (Lyria 3 的亮點): 不僅能產生樂器伴奏,現在還能根據你的描述生成歌詞,並用極其自然的人聲唱出來。不管是充滿靈魂的 R&B 還是活潑的 Afrobeat,它都能駕馭。
- 即時導引與控制 (Lyria RealTime): 這是我最喜歡的部分!Lyria 引入了「音樂即動詞」的概念,你可以像 DJ 一樣即時調整音樂的節拍 (BPM)、亮度 (Brightness) 或音符密度 (Density),讓音樂隨你的心情或故事節奏動態變化。
- 影像轉音樂 (Image-to-Audio): 你可以上傳一張照片(比如故事角色在冒險的照片),讓 Lyria 感受照片的情緒,並為這張圖量身打造一段 30 秒的配樂。

你可以上傳一張照片(比如故事角色在冒險的照片),讓 Lyria 感受照片的情緒,並為這張圖量身打造一段 30 秒的配樂。
對於教育工作者與創作者,Lyria 不只是一個工具,它是 「學習體驗設計」 的強力助手:
- 故事化教學: 例如:為《學習精靈島》繪本的每個地景(例如:迷思森林、勇氣海岸)創作出專屬的主題曲。
- 視覺與聽覺結合: 將學習素材、塗鴉筆記轉換成一段帶有氛圍感的音樂,讓閱讀筆記變成一場多感官的冒險。

▍Lyria 提示詞指南
要寫出好的音樂提示詞,我為你整理了一套 「旋律鍊金術」。我們可以把提示詞拆解成五個核心元素,這能讓 AI 更精準地捕捉到你想要的氛圍:
1.🎼 旋律鍊金術:MIDST 公式
就像沉浸在音樂之中(In the MIDST of music)——把這五個成分調配進去,讓 AI 精準捕捉你要的氛圍:

- M (Mood / Emotion) 情緒: 音樂想傳達的感覺。例如:充滿希望的、神祕憂鬱的、熱血沸騰的、適合專注的。
- I (Instruments) 樂器: 你可以加入一些意想不到的樂器來豐富聽感。例如:清脆的鋼琴聲、溫暖的木吉他、迷幻的合成器、輕快的長笛。也可以混搭,例如:在「1950 年代爵士樂」中加入「80 年代合成器」。如果你沒有指定,Lyria 會根據曲風自動選擇適合的樂器。
- D (Dynamics) 動態: 描述音樂隨時間的起伏變化。例如:從安靜的鋼琴聲逐漸轉變為爆發性的副歌,或是人聲隨著曲子進行逐漸變得平靜。這能讓 AI 理解你想要的「故事弧線」,讓音樂不只是一個固定氛圍,而是一段有層次的旅程。
- S (Style / Genre) 風格: 這是音樂的基調。例如:Lofi Hip-Hop、管弦樂(Orchestral)、8-bit 電玩風、輕爵士、後搖滾(Post-rock)。你可以選擇單一曲風,或混合不同風格。例如:90 年代的嘻哈、2000 年代的流行樂,甚至嘗試大膽混搭,像是「帶有 Motown 靈魂樂感的 K-pop」或「融入古典小提琴的 Funk 音樂」。
- T (Tempo / Energy) 節奏與能量: 這決定了速度,直接要求快速、慢速、輕快高能量(Upbeat, High energy)、穩定的(Steady),或者使用特定的音樂類型來暗示速度,例如:慢節奏情歌 (Slow Ballad)、現代流行樂或鼓打貝斯 (Drum and Bass)。當然也可以直接寫大約 90 BPM。

💡 提示詞思考順序: 雖然公式叫 MIDST,但實際寫提示詞時,建議按這個順序思考:風格 (S) → 節奏 (T) → 樂器 (I) → 情緒 (M) → 動態 (D)。先確定音樂的大方向與速度,再填入聲音細節與感受,最後用動態賦予音樂故事弧線。
🪄 進階提示詞技巧
除了公式,這裡有幾個讓音樂更具「靈魂」的小撇步:
- 具備畫面的敘事描述: Lyria 很擅長處理具象的描述。與其只說「悲傷的音樂」,不如說:「像是雨天獨自走在空蕩盪的街道上,遠處傳來模糊的薩克斯風聲。」 這種帶有空間感的描述,會讓 AI 生成更有層次感的背景音。
- 指定結構變換: 你可以嘗試描述音樂的進程,例如:「開頭是安靜的鋼琴,30 秒後加入強大的鼓點,最後以空靈的人聲結尾。」
- 使用「負向描述」(如果工具支援): 如果你不想要某種聲音,可以明確點出。例如:「不要電子鼓聲」、「人聲不要太尖銳」。
- 連結故事的情境: 在設計學習體驗時,可以把場景帶入。例如:「適合在迷霧森林探索的氛圍,帶有神祕感但又不失好奇心,節奏像是在森林中輕快跳躍。」
樂尼的小提醒
寫提示詞就像是在玩一場冒險遊戲,第一次不一定會中,但你可以根據生成的結果,調整其中一個參數(例如換掉樂器,或加強情緒)。
2. 影像轉音樂 (Image-to-Music)
當你上傳圖片(例如主角的探險圖)讓 Lyria 參考時,可以觀察以下細節來優化提示詞:
- 主角是誰?(Who): 觀察圖中人物的情緒(開心或悲傷)、姿勢、穿著,甚至是生物種類(人類、動物或外星人)。
- 場景在哪?(Where): 景深與背景細節也很重要,是城市街道還是充滿異域風情的地景?是否有群眾或野生動物?。
- 發生什麼事?(What): 圖片描述的是正式的肖像畫、一場激烈的比賽,還是獨自在荒野冒險?Lyria 會根據這些設定來決定音樂的整體氛圍。
應用案例:為故事場景配樂。
🎨 實戰範例:為小旭的冒險配音
這是樂尼自己的創作範例:
- 場景一:小旭在「學習探險家學院」圖書館安靜閱讀
提示詞: Lofi Hip-hop, Relaxing and focused mood, soft piano melodies, sound of pages turning in the background, steady 80 BPM, warm and cozy vibe.
- 場景二:啟動「學習飛輪」,驅散迷思迷霧(熱血時刻)
提示詞: Epic Orchestral, Inspiring and powerful, rising intensity, cinematic strings and taiko drums, high energy, fast tempo, feeling of a grand breakthrough.
- 場景三:認識新的「學習精靈」(奇幻相遇)
提示詞: Whimsical and magical style, glockenspiel and light woodwinds, playful staccato rhythm, sparkling synth textures, sense of wonder and curiosity.
3. 人聲與歌詞技巧 (Vocals & Lyrics)
Lyria 3 在人聲處理上有非常細膩的控制選項:
- 建立人聲檔案 (Vocal Profile): 詳細描述你想要的人聲特質,包括性別、音域(男中音、高音女高音)、聲音質地(渾厚、沙啞、有靈魂感、帶氣息感)以及演唱語言。
- 歌詞格式化:
- 在歌詞前加上
Lyrics:前綴。 - 使用 圓括號
( )來標註合音或回音。例如:Lyrics: Let's go (go)。
- 在歌詞前加上
- 讓 AI 協助作詞: 如果沒有現成歌詞,可以直接描述主題(如:關於成功、關於生日、關於愛),讓 Lyria 為你生成。
4. 實驗性玩法 (Experimentation)
想要更獨特的聲音,可以嘗試這些進階技巧:
- 音樂性實驗: 嘗試要求「和聲 (Harmonies)」或「對位法 (Counterpoints)」,或使用不尋常的樂器進行多層次的編排。
- 節奏律動: 描述具體的人聲節奏模式,像是「快節奏 (Fast-paced)」或「慵懶的律動 (Laid-back groove)」。
- 多樣化圖源: 除了照片,也可以嘗試上傳歷史名畫、卡通插畫,甚至是科學圖表,看看 Lyria 會如何解讀這些視覺資訊。
這些技巧能讓你更有條理地把腦中的想像轉化為現實!
🎵 讓音樂成為你的另一種語言
AI 音樂生成不是要取代音樂家,而是讓每個人都能用「聲音」說故事。
不管你是想為課堂增添一段氛圍音樂、為影片找到完美配樂,還是純粹好奇「我腦中的畫面聽起來是什麼樣子」——Lyria 都能成為你的起點。

記住 MIDST 公式,帶著玩心去實驗。第一次生成的結果不完美?太正常了。調整一個參數、換個形容詞、加一句畫面描述,每一次微調都是一次與 AI 的共創對話。
音樂是看不見的風景,而你就是那位拿著提示詞畫筆的旅人。 🌊
現在,打開 Gemini,寫下你的第一句 MIDST,讓想像變成聽得見的現實吧!
資源
延伸註解
除了基本的文字生成版本外,還有一種名為 Lyria RealTime 的變體,它能進行 即時音樂生成與交互,讓你像在彈奏樂器一樣在 玩音樂、混合風格、控制節奏與音色,就像即興樂隊。(Google DeepMind)(直接到這玩)
Afrobeat 是一種源自西非(主要是奈及利亞)的音樂風格,融合了傳統約魯巴音樂、爵士樂、放克和高生命(Highlife)等元素,以複雜的節奏、打擊樂器和管樂為特色。在文中指 Lyria AI 能夠生成並演唱這種充滿活力的非洲節奏音樂風格。




















