如何將樂譜影像辨識成可播放音樂（OMR → MIDI）

Hank吳

2025/07/30 更新2025/07/30 發佈閱讀 3 分鐘

Multimodal Music Notation Understanding（多模態音樂符號理解）是指透過結合多種感知模態（如影像、聲音、語言），對音樂譜或相關文獻進行全面理解與處理的技術。

專案範例：從樂譜影像到播放音樂（OMR → MIDI）

目標

輸入：一張印刷樂譜圖片輸出：自動轉換為 MIDI 並播放

系統架構


複製編輯[樂譜圖片] 
   │
   ▼
[圖像辨識模型 (OMR)] → [音符與節奏資訊 (符號資料)] 
   │
   ▼
[MIDI 產生器] → [音樂播放]

任務技術工具/模型樂譜辨識

sss

🔧 實作步驟（Python 為主）

Step 1: 安裝 Audiveris（開源 OMR 工具）
可至此下載對應作業系統的可執行檔 https://github.com/Audiveris/audiveris

Step 2: 使用 Audiveris 將圖片轉為 MusicXML
audiveris -batch -export my_score.png # 輸出檔為 my_score.mxl（MusicXML 格式），他也有GUI介面的版本

Step 3: 用 music21 讀取 MusicXML 並轉為 MIDI

#python
from music21 import converter

score = converter.parse("my_score.mxl")
score.show('text')        # 顯示音符資料
score.write('midi', fp='output.mid')  # 儲存為 MIDI

Step 4: 播放音樂: 可用 media player撥放 *.mid 的MIDI檔或寫段python小程式

#python
import pygame

pygame.init()
pygame.mixer.music.load("output.mid")
pygame.mixer.music.play()

MusicXML格式也可另外至官網：https://musescore.org/下載
MuseScore

✅ 支援 MusicXML 輸入與輸出
✅ 可以編輯、播放、轉出 PDF / MIDI
✅ 支援繁體中文
💡適合一般音樂製作、教育用途

當然也可反向思考，當你手上有音樂檔，用AI模型辨識音樂曲調成文字音符，在轉成musicXML格式，由musicXML轉成實際樂譜。

留言

Hank吳的沙龍

13會員

158內容數

這不僅僅是一個 Blog，更是一個交流與分享的空間。期待在這裡與你相遇，一起探索科技、體驗生活、夢想旅行！💖

Hank吳的沙龍的其他內容

2025/07/29

八字命理的「五虎遁月」口訣

「五虎遁月」是八字命理中一個非常基礎且重要的口訣，專門用來推算「月柱」的天干。它的核心作用是：只要知道「年」的天干，就能推出該年「正月 (寅月)」的天干是什麼。

2025/07/29

八字命理的「五虎遁月」口訣

2025/07/29

八字命理觀念：核心原則：以「節」換月，不看農曆初一

這幾天在寫八字算命的程式，但發現月柱：月干月支的數值，常在農民曆同月份的狀況下，確不同值，深入研究下，才發現，年柱和月柱需考量節氣，且節氣才是月柱的分隔點。這是一個非常核心且重要的八字命理觀念。以下詳細解說節氣是如何劃分月柱的。核心原則：以「節」換月，不看農曆初一

2025/07/29

八字命理觀念：核心原則：以「節」換月，不看農曆初一

2025/07/28

塔羅牌78張牌的基本概念

整理出每張牌的核心關鍵字和基本概念。塔羅牌的兩大核心：大阿爾克那與小阿爾克那首先，我們再次複習一下塔羅牌的結構： * 大阿爾克那 (Major Arcana)：22張牌，象徵人生重大課題與精神成長。 * 小阿爾克那 (Minor Arcana)：56張牌，細分為四個花色，代表日常生活

2025/07/28

塔羅牌78張牌的基本概念

看更多

你可能也想看

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品，以十段寓言式殘篇，重新拼貼記憶、暴力與美學，並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇：帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略，嘗試解析極權底下不可言說之事，將如何成為可被觀看的公共發聲。

#釀電影#釀評論#藝術評論

2026/01/14

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：以流亡書寫帕拉贊諾夫的政治寓言

#釀電影#釀評論#藝術評論

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

柏林劇團在 2026 北藝嚴選，再次帶來由布萊希特改編的經典劇目《三便士歌劇》（The Threepenny Opera），導演巴里・柯斯基以舞台結構與舞台調度，重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核，藉由沉浸與疏離的辯證，解析此作如何再次照見觀眾自身的位置。

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

趙鐸的沙龍

柏林劇團《三便士歌劇》：善讓人嚮往，惡卻更加迷人──布萊希特的疏離與慾望

#2026北藝嚴選#臺北表演藝術中心#北藝嚴選

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲．蓋柏樂》的詮釋，從劇本歷史、聲響與舞臺設計，到演員的主體創作方法，探討此版本如何讓經典劇作在當代劇場語境下煥發新生，滿足現代觀眾的觀看慾望。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

花神沒有咖啡館的沙龍

《海妲．蓋柏樂》：晃晃跨幅町直球對決經典，解構現代女性的困頓與慾望

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14

涵柳的沙龍

《轉轉生 Re:INCARNATION》：從身體與服裝看見奈及利亞的重生

《轉轉生》為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，融合舞蹈、音樂、時尚和視覺藝術，透過身體、服裝與群舞結構，回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發，分析《轉轉生》如何以當代目光，形塑去殖民視角的奈及利亞歷史。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/01/14