方格子 vocus

【Google MusicLM】只要文字與圖片就能生成音樂的AI工具

黑色鬱金香

發佈於不上進的我與上進的AI

2023/05/25 更新2023/05/24 發佈閱讀 10 分鐘

音樂屬性魔法師MusicLM

時至今日，文字不僅能生成圖像，還能生成音樂了。不會畫畫，不會作曲，只要出張嘴，就能當魔法師，還是自帶畫畫與音樂屬性的魔法師。

Google 今年1月推出的 MusicLM 是一種可以藉由文本自動生成音樂的AI工具，想去試玩的人可以點選以下連結註冊加入審核名單，審核通過即可開始試用。

https://aitestkitchen.withgoogle.com/experiments/music-lm

Google的MusicLM 號稱擁有大量AI 模型以及長達28萬小時的訓練資料庫，可以製作非常多樣性的音樂。

當然，原本就有在使用音樂類型的AI工具Jukebox點唱機以及Soundraw的創作者，可能會覺得已經很夠用了，Soundraw雖然畫面人性且直觀，但畢竟還是需要人為去篩選類別，例如先選長度，接著選擇氛圍類別例如恐怖與驚悚類，再選速度慢快還是中等，然後等生成音樂後再進去調整長度與編排曲調強弱，與每段的樂器搭配。

筆者使用上覺得，Soundraw確實已經很好用了，但就操作上來說，MusicLM卻又更加的直觀，更佳的人性，挑明了說就是更符合「懶人」的需求。（只需要出張嘴下指令還不夠懶嗎？）

操作上只要想成，原本使用在文字生成圖像AI工具像是Midjourney或是Playground的Prompt，以同樣邏輯將提詞放在MusicLM上即可，不須篩選或挑選類別，幫你省下選擇障礙的時間，只需下一段文字敘述音樂就自動生成，完全是現代版吟遊詩人。

簡單的文字最快的速度

更簡單地說，對於音樂編曲一竅不通也沒關係，只要是為了各類型影音創作需求像是教學影片、線上線下的活動開場、結尾背景音樂、產品開箱、圖文創作故事等等，只要是需在茫茫資料海中快速找尋沒有版權疑慮又合適的背景音樂，就可以使用MusicLM，用最簡單的文字敘述給予AI指令來描繪，並用最快的速度取得你需要的背景音樂，例如：「一首空靈的新古典音樂，給人放鬆與平靜的感覺」或是，「一首適合晚宴的爵士樂，曲調輕快並且優雅」等等。

不需要學會看五線譜，不需要懂音律，不會作曲也無所謂，AI都幫你搞定（很適合像筆者這樣的絕對音癡。）

Google有提供詳細的各類型提詞試聽網站，不須註冊即可試聽：

敘述型咒語

至於註冊成功後的咒語詠唱方式也很簡單，MusicLM 註冊過程會清楚告訴你Prompt「咒語」的三個條件：

Be very descriptive. Electronic or classical instrument sounds best.
必須是非常具體地描述。電子樂器或古典樂器的聲音最適合。
Mention the vibe, mood or emotion you want to create.
需要提及想要創造的氛圍、情緒或情感（舉例像是寧靜、歡快、憂傷、緊湊不安等形容詞）。
Certain queries that mention specific artists or include vocals will not be generated.
不會生成涉及特定藝術家或包含人聲的特定查詢。

第三條規則是跟文字生成圖像AI工具最大的不同點之一，像是Midjourney類的圖像生成工具，你可以在Prompt裡加入吉卜力風格，或是迪士尼畫風畢卡索畫風等提詞，直接給予特定人名或工作室名稱讓AI模擬產出風格相似的作品，但MusicLM不行，你不能下像是恩雅（New Age代表歌手之一）風格的嗓音，瑪莉蓮曼森（死亡金屬歌手之一）的歌聲等任何帶有人聲音樂的指令，也不能模擬特定工作室的風格例如一首Two Steps From Hell（知名電影配樂製作公司）風格的音樂等等。

按照上面規則下指令，MusicLM就會生成兩首符合的音樂讓你挑選，只要試聽並選擇你偏愛的版本（點選皇冠圖案），再下載保存即可，音樂不會存在網路上，必須即時下載。

除了敘述型的咒語，筆者覺得與其他音樂聲成工具更不同的地方是，MusicLM還提供了「故事型」咒語以及「圖像型」咒語的音樂生成方式。

故事型咒語 Story Mode：

The audio is generated by providing a sequence of text prompts. These influence how the model continues the semantic tokens derived from the previous caption.

透過提供一系列的文字提示來生成音訊。這些文字提示會影響模型如何延續從前一標題中衍生出的語義單元。

也就是說，假設你今天要製作一支一分鐘長度的冥想引導影片，你可以按照以下範例給予故事線指令進而生成與情境相符的一段背景音樂：

冥想一分鐘範例音樂

time to meditate 冥想時間 (0:00-0:15)
time to wake up 開始慢慢醒來 (0:15-0:30)
time to run 開始起跑 (0:30-0:45)
time to give 100% 開始全力以赴投入跑步 (0:45-0:60)

有興趣的人可以至試聽網站上的Story Mode區塊進行試聽

https://google-research.github.io/seanet/musiclm/examples/

同樣的你也可以按照此邏輯去生成產品說明、教學影片、或是任何類型的示範影片，比起一段一段的給予敘述生成音樂，故事模式更好的提供了創作者背景音樂的一致性、完整性與音樂編排的便利性。

圖像型咒語生成 Painting Caption Conditioning

前面提到MusicLM除了故事型的音樂生成方式，還有一個讓使用者驚喜的是，透過一張圖像就能生成符合這張圖片的背景音樂。

例如僅提供一張「拿破崙越過阿爾卑斯山（Alps）」的畫作，搭配Wiki百科上的描述：「這幅作品為理想中的拿破崙及其軍隊於1800年5月通過聖貝納爾山口穿越阿爾卑斯山的真實場景。」給MusicLM讓其生成音樂。

我們先不去試聽網站上生成的音樂，可以先在腦中想像MusicLM會生成什麼樣的音樂再去試聽，同樣的你可以在前面提到的Google試聽網站上的Painting Caption Conditioning 區域試聽到這個範例：

https://google-research.github.io/seanet/musiclm/examples/

說真的產出的音樂跟筆者想像的大不相同，但每個人對音樂的感受性本來就是很主觀的，這也是為什麼通常會生成兩首音樂讓使用者從中挑選的原因。

試聽網站上有很多範例，其中也有用荷蘭後印象派畫家梵谷的The Starry Night「星空」作為圖像指令生成音樂。這幅畫描繪了梵谷在聖雷米德普羅旺斯的療養院房間，朝東窗外所看見的「日出前景色」，畫中還添加了一個虛構的村莊。

你可以看見，指令中並沒有任何氛圍敘述，沒有寧靜的、祥和的、孤寂、閃閃發光等詞彙，就是簡簡單單的一幅畫與其畫作背景敘述，光是這樣MusicLM就能生成氛圍相符的背景音樂。

假設筆者今天想為下面這張圖找尋搭配的背景音樂，用Soundraw的話可能就直接去恐怖與驚悚的分類裡找尋挑選，但對節奏快慢還沒有太多概念，這時就可以直接把這張圖丟給MusicLM，搭配文字描述如：「陰暗狹長，看不漸盡頭，空無一人的走廊」等文字來生成相符的音樂供參考。

各類咒語提詞試聽

對音樂類型的提詞沒概念的話，Google提供的試聽網站上還羅列了五花八門各種各樣文本提詞可用的節拍、樂器、主題、情境及其對應的試聽檔給使用者參考，而且列舉的非常詳細。

例如光是鋼琴家，網站上就提供了初學者、中級演奏者、專業級、crazy fast professional 演奏者等四種級別的試聽供參考，而這四種級別的敘述也可以同樣地套用在其他樂器上，不一定是鋼琴。

網站上還提供了各個不同年代的俱樂部音樂風格，從50年代到80年代都有，十分有趣。雖然不能去指定特定歌手與樂團風格的音樂，但你還是可以根據不同年代的音樂與情境提詞取得風格相符的音樂。

試聽網站上提供的咒語類別實在太多了，無法一一列舉，大家可以去聽看看並註冊加入等候名單。

不管你是不是影音創作者，未來都有可能用到需要背景音樂的地方，即便是純文字創作者，時不時也會需要為小說或是文章尋找合適的插圖或配樂作為搭配或靈感，而過去人們常常開玩笑講的「自帶BGM」，「這張圖片有聲音」等話語將不再只是說說而已，而是真正的將話語中的文本轉化成一段音樂。

文章參考資料：

https://www.youtube.com/watch?v=dMsscu6Pa-E

https://techtarian.com/ai/musiclm/

留言

黑色鬱金香的沙龍

49會員

53內容數

主要為西洋歌曲翻譯評析與推薦，年代不是界限，曲風可以多變。暫時忘記世俗，徜徉在旋律的空間，沉浸在詞曲的感動，帶給你成長的人生好歌。

黑色鬱金香的沙龍的其他內容

2023/05/26

窺你所想想你所窺！AI讀腦術能怎麼運用？

根據5/25日焦點新聞：美國德州奧斯汀大學團隊，結合腦部磁振造影、AI與ChatGPT訓練模型，已經能夠初步「讀腦」，把人腦中所想的事情翻譯成文字。

2023/05/26

窺你所想想你所窺！AI讀腦術能怎麼運用？

根據5/25日焦點新聞：美國德州奧斯汀大學團隊，結合腦部磁振造影、AI與ChatGPT訓練模型，已經能夠初步「讀腦」，把人腦中所想的事情翻譯成文字。

2023/05/01

ChatGPT懂得炕肉飯的美味嗎？

昨晚突然很想吃「控罵崩」，懷念起鹹香滷肉汁與白米飯還有入口即化的肥肉，但考慮到若世界末日把自己養太肥會較快被吃掉，還是克制了下，轉而聊勝於無的跑去跟ChatGPT聊了一下炕肉飯。

2023/05/01

ChatGPT懂得炕肉飯的美味嗎？

2023/04/16

【ChatGPT應用】從白話到文言－三種難度歌詞中翻英

論及歌詞意境的巧妙，就不得不提有許多華語歌詞也都相當優美富含深意，當然基於中英文語法結構的差異，中文歌詞翻成英文後，同樣會面臨到美感與語意兩相精準度微失衡的問題。

2023/04/16

【ChatGPT應用】從白話到文言－三種難度歌詞中翻英

#創作的其他內容

【4月靈感產生器】TOP 100 關鍵字：「○○」格友最愛用

你可能也想看

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

看完上篇 4 位新成員的靈魂拷問，是不是意猶未盡？別急，野格團新血的驚喜正接著登場！今天下篇接力的另外 4 位「個人主題專家」，戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長；這些人如何維持長跑般的創作動力？在爆紅的文章背後，又藏著哪些不為人知的洞察？5 大靈魂拷問繼續出擊

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

#創作#創作者推薦#靈感

2026/03/25

Daniel Lin的沙龍

音樂即興演奏與語言學習的聯想

音樂某種程度上蠻像一種語言。樂譜就好像一篇文章，音符、和弦就好像詞彙、單字，和聲、對位的規則就好像文法，曲式與結構就好像文章的體裁與架構。作曲或編曲就像寫作，而即興就像是口說。

2024/07/21

2024/07/21

Suno AI（簡稱Suno）是一款生成式人工智能音樂創作程序，旨在產生結合人聲和樂器的逼真歌曲，或純粹的樂器音樂。無需深厚的音樂理論知識，只需幾個簡單的步驟，就能實現旋律創作、和弦編排和節奏設計。Suno致力於降低音樂創作的門檻，讓每個人都能享受到音樂創作的樂趣。

2024/05/16

2024/05/16

大家想要自己做音樂卻不知道怎麼開始嗎?那就快來試試 BandLab 吧!這個超讚的免費線上音樂創作軟體,讓你可以輕鬆完成從創作到發行的全流程。 https://www.bandlab.com/ 首先,你只要上 BandLab 網站註冊一個免費帳號就可以開始玩了。登入之後,你就會看到一

2024/04/09

2024/04/09

AI音樂工具我對創作者的音樂工具了解不多，只使用過一種格友介紹的AI軟體：suno。是一款可以自動生成音樂的軟體，其生成的音樂非常豐富多變。不過，對一般使用者而言，suno可能只是用來玩玩而已，並沒有什麼實用的價值。激發創意 suvo的真正價值在於激發創意。使用者可以通過輸入文字描述或歌詞

#普普文創#文創漫談#創作者的AI音樂工具

2024/01/22

普普文創

【文創漫談】創作者的AI音樂工具

#普普文創#文創漫談#創作者的AI音樂工具

2024/01/22

黑色鬱金香的沙龍

【Google MusicLM】只要文字與圖片就能生成音樂的AI工具

不會畫畫，不會作曲，只要出張嘴，就能當魔法師，還是自帶畫畫與音樂屬性的魔法師。

#Google#ai#音樂

2023/05/24

黑色鬱金香的沙龍

【Google MusicLM】只要文字與圖片就能生成音樂的AI工具

不會畫畫，不會作曲，只要出張嘴，就能當魔法師，還是自帶畫畫與音樂屬性的魔法師。

#Google#ai#音樂

2023/05/24

Lyricist.ai 歌詞靈感創作的沙龍

將腦中旋律化為歌詞

擊中旋律拍點的歌詞創作譜成觸動人心的篇章創作者在聆聽歌曲旋律時，可在 Lyricist.ai 隨手記下每段旋律的節拍，每個拍點都能依據創作者的經驗，填入適合的字數，而運用 Lyricist.ai 的歌詞生成工具，可讓創作者設定字數後，立即生成歌詞靈感。

#Lyricist#歌詞創作#人工智慧

2022/07/15

Lyricist.ai 歌詞靈感創作的沙龍

將腦中旋律化為歌詞

#Lyricist#歌詞創作#人工智慧

2022/07/15

邊寫邊唱的沙龍

2021 最強免費 DAW ，用懶人編曲平台 BandLab，寫出你的第一首歌！

喜歡創作音樂的你，是不是常常有這些困擾，吉他錄進電腦聲音好難聽、效果器介面複雜又難懂、特殊樂器竟然要自己找軟體外掛？EQ 是什麼？我知道我的 EQ 蠻高的啊(笑)，Bandlab可以解決所有問題，而且完全免費，下面一起來看教學吧！

#寫歌#DAW#音樂創作

2021/07/03

邊寫邊唱的沙龍

2021 最強免費 DAW ，用懶人編曲平台 BandLab，寫出你的第一首歌！

#寫歌#DAW#音樂創作

2021/07/03

嵐音社的音樂沙龍

嵐音社：《Past》-使用兩種編曲軟體製作的作品，以及為何你不該使用速成軟體編曲

真的要創作的音樂家，還是得好好地、堂堂正正地，動手編出自己要的音符呀！不然坊間太多現成音樂罐頭，使得這時代的音樂聽起來越來越像，可不是創作者該樂意見到的。

#嵐音社作品#嵐音社#音樂

2021/01/11

嵐音社的音樂沙龍

嵐音社：《Past》-使用兩種編曲軟體製作的作品，以及為何你不該使用速成軟體編曲

#嵐音社作品#嵐音社#音樂

2021/01/11

林軒瑋的沙龍

音樂製作x準備

不知道你是否有跟我相同的感受! 日常生活中聽歌已成為不可或缺的一部分一方面是放鬆身心另一方面是對歌曲達到一定的共鳴度不論是歌詞、節奏、旋律方面可是即使契合度在高.... 但那並不是100趴屬於你的故事! 因此想要創作一首屬於自己的歌曲記錄著目前生活的主旋律當多年後聽到自己所創造的歌曲

2020/12/07

林軒瑋的沙龍

音樂製作x準備

2020/12/07

不停 Bu Tin的沙龍

EP7 - 用音樂讓產品變得更有說服力（配樂師 - 樂恩）

在台灣，甚至全世界都很少有人可以一開始就用音樂創作來達到衣食無憂的地步，那些創作者可能就會開始尋找其它音樂謀生之路，可能是樂器教學、音樂製作、現場音控等等，還有一種職業叫“配樂師”，通常為視覺或互動產品創造更有生命力的聲音，幫助觀者或使用者更進入產品的訴求。

#獨立音樂#配樂師#廣告配樂

2019/09/08

不停 Bu Tin的沙龍

EP7 - 用音樂讓產品變得更有說服力（配樂師 - 樂恩）

#獨立音樂#配樂師#廣告配樂

2019/09/08

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News