Be very descriptive. Electronic or classical instrument sounds best.
必須是非常具體地描述。電子樂器或古典樂器的聲音最適合。
Mention the vibe, mood or emotion you want to create.
需要提及想要創造的氛圍、情緒或情感(舉例像是寧靜、歡快、憂傷、緊湊不安等形容詞)。
Certain queries that mention specific artists or include vocals will not be generated.
不會生成涉及特定藝術家或包含人聲的特定查詢。
第三條規則是跟文字生成圖像AI工具最大的不同點之一,像是Midjourney類的圖像生成工具,你可以在Prompt裡加入吉卜力風格,或是迪士尼畫風畢卡索畫風等提詞,直接給予特定人名或工作室名稱讓AI模擬產出風格相似的作品,但MusicLM不行,你不能下像是恩雅(New Age代表歌手之一)風格的嗓音,瑪莉蓮曼森(死亡金屬歌手之一)的歌聲等任何帶有人聲音樂的指令,也不能模擬特定工作室的風格例如一首Two Steps From Hell(知名電影配樂製作公司)風格的音樂等等。
The audio is generated by providing a sequence of text prompts. These influence how the model continues the semantic tokens derived from the previous caption.