Gemini 推出了全新「音樂創作」功能,讓使用者只需輸入簡單的文字指令,就能自動生成一段結合音樂與畫面的影片內容。系統會根據提示情境、風格與氛圍,智慧生成對應的旋律、節奏與視覺元素,打造完整的多媒體作品。
創作完成後,使用者可依需求選擇下載「影片檔(含音樂)」或「純聲音檔」,方便應用於社群媒體內容、簡報專案、品牌行銷素材,或作為個人創作的背景音樂。整體流程直覺且快速,讓沒有音樂製作經驗的使用者,也能輕鬆產出具有風格與情緒層次的作品。

開始操作
連線:https://gemini.google.com/music,或是在 Gemini 首頁,選取:創作音樂。
也可以挑選一種音樂風格來混音:

輸入想要製作的音樂內容、風格、想法,即可產生音樂。製作的速度相當的快!但是,本例要求純音樂,但產製的內容仍有歌唱的部分。
製作好的音樂可以下載為:影片(MP4)和音樂(MP3)。

影片結尾會有 Gemini 的相關資訊。

後來我問了 Gemini,它教我如何產生無人聲的音樂。所以重新調整提示詞:
由鋼琴演奏的純音樂(BGM),不要有人聲,令人放鬆的音樂。
結果正確!你快來試試吧!

如果你都不下提示詞,也可以產生音樂,例如選取:健身。

也可以上傳一張圖像,再選取音樂風格製成音樂。

當然,你也可以給 Gemini 歌詞,讓它製成音樂(只能產生 30 秒)。提示詞:
將以下完整歌詞製作成歌曲,搭配女聲,名謠風格,以木吉他伴奏。(歌詞略)
目前,產生結果無法將每一個字準確的出現在歌曲中,但是,播放歌曲時,可以選取顯示字幕呢!

後來嘗試了幾次,選取 Pro,並且在歌詞中加入[Verce]、[Chorus]等歌曲結構標記,較能依原歌詞製作歌曲。例如提示詞:
將以下完整歌詞製作成歌曲,搭配女聲,清晰的發音(Clear vocals),名謠風格,以木吉他伴奏。
[Verse]
走過大半生,才慢慢明白,
熱鬧的時光,終會慢慢散開,
年輕的夢想,像風吹過大海,
回頭再看啊,只剩下幾張老照片。
[Chorus]
老友一杯酒,敬這真情依舊,
苦過累過,也從未放手,
人生啊,就是聚散匆匆,
能有你在左右,已是最大的收穫。
製作純音樂的技巧
1. 使用明確的否定指令
在提示詞中直接加入排除人聲的指令,這是最直接的方式:
- 關鍵字: 「純音樂」、「無人聲」、「不要歌唱」、「不要有人聲」。範例: 「請製作一段放鬆的 Lofi 音樂,純音樂,不要有人聲。」
2. 運用專業音樂術語
使用與器樂相關的術語,可以讓模型更準確地理解你的需求:
- Instrumental(器樂版): 這是最有效的國際通用術語。Backing Track(伴奏軌): 通常指僅有背景樂器而無主唱的音軌。Score / Soundtrack(配樂): 常用於電影或遊戲的純器樂描述。BGM(背景音樂): 預設通常為不干擾人語的純音樂。
3. 描述具體的樂器編制
透過細節描述樂器,能引導模型專注於合成器樂音色,從而降低產生人聲的可能性:
- 範例: 「製作一段由鋼琴、小提琴與木吉他合奏的輕音樂,強調弦樂的質感,全程無歌詞與唱腔。」
4. 選擇預設為純音樂的曲風
某些曲風本質上就以器樂為主,選擇這些曲風能有效避免人聲干擾:
- 古典樂 (Classical)氛圍音樂 (Ambient)後搖滾 (Post-Rock)流暢爵士 (Smooth Jazz)合成器波 (Synthwave)
5. 提示詞結構範例
為了獲得最佳效果,建議採用以下結構組合提示詞:
[曲風] + [情緒/節奏] + [指定樂器] + [排除指令]
- 實戰範例: 「製作一首賽博龐克風格的快速節奏音樂,使用大量電子合成器與重低音,Instrumental only, no vocals(純器樂,無人聲)。」
技巧提示:
如果生成出的音樂仍帶有模糊的類人聲(例如哼唱),可以嘗試在提示詞中加入 「僅限器樂演奏」(Strictly instrumental),這通常能進一步強化模型的判斷。

















