方格精選

終結響度戰爭~你所應知道的響度知識

更新於 2021/09/15發佈於 2021/09/14閱讀時間約 18 分鐘

音樂圈的人相信都有聽過 “Loudness War” 響度戰爭這個名詞，響度戰爭追溯它的源起，也許早在1950年代，點唱機 (Jukebox) 流行的年代，就已開始，但受限在類比唱盤無法承受過大音量，極易因過大音量而無法播放，所以當時問題還不太大。約在80年代晚期，CD 這種數位載體出現，沒有類比載體的某些限制後，問題便慢慢浮現，漸趨白熱化。為什麼會有這種現象？我覺得是種人性，數位化後，因為傳輸或處理都較類比乾淨不失真，整體音量就可往上再提升，加上客戶端都想要自己的音樂上電台電視台比別人受矚目，於是聲音頂到音量表頂端，壓到表頭都不太會動的事就漸漸成常態 (可上網搜尋Loudness War、Metallica “Death Magnetic” ) 。聽眾被迫聽這樣的聲音，直到某一天，大家受夠了這種沒動態，甚至失真的音樂，或是聽廣播看電視不時被爆出的廣告驚嚇到，要不停地調整音量後，問題才終於被重視。怎樣去控制節目或音樂之間的音量，讓聆聽過程較為舒適愉悅？2006年7月ITU (International Telecommunication Union國際電信聯合會) 提出了一份對於節目響度與真實峰值 (True Peak) 的建議書 ITU-R BS. 1770 ，這份建議書是因應聽眾希望不同來源、類型節目在音量上有一致性，並為單聲道、立體聲及多聲道節目音訊，提供一個製作時的參考，響戰爭開始有個方向可解決。

什麼是響度？

響度是一種人耳對於音壓大小改變的感知程度，它跟音量是兩個不同的概念。音量是種物理上可量化的電壓或氣壓數值，而響度是人耳對這些物理性聲音變化的主觀感知，涉及的不只是物理聲學，還有心理聲學方面的研究。因為傳統物理性的音量表無法表現出人耳對聲音大小的感知，響度戰爭的熱化讓人開始思考有什麼方式可以讓聲音媒體播放時，能夠維持一致性，終結響度戰爭。

讓聲音大小均一化有兩種方式：Peak Normalization (峰值均一化) 和Loudness Normalization (響度均一化) 。

圖左為以各節目最大峰值去做均一化，綠色上限為平均音量，紅色為整體響度，黃色上限為最大峰值，對齊了最大峰值後，因為各種類型節目的動態範圍不同，須保留的餘裕空間 (headroom) 也不同，因此平均音量或響度是沒法達到一致，聽起來音量大小還是差異甚大。早期廣播電視播出是採用峰值均一化處理，不管節目內容是什麼，全部自動調到峰值是相同的，常常造成了安靜或無聲的段落會慢慢加大，於是觀眾就聽到底噪的空調聲，等到其他聲音出現才又慢慢聽不到空調聲。而因為當時的媒體用最大峰值均一化來統整不同節目播出，同一峰值下壓縮程度越大的，聽來起會比別人大聲，因而造成響度戰爭

圖右則是以各節目用整體響度去做均一化，音量上達到一致，各種類型節目的最大峰值也不受影響，也就是現在我們在講的響度控制。

談到最大峰值，過去數位音訊系統所採用的音量表，多數是 “Peak- Sample” 峰值取樣表，而非 “True- Peak“ 真實峰值表。峰值取樣表的問題就在於真正音量峰值出現處，不見得剛好在取樣點上，有可能在取樣點中間，所以表頭看起來沒亮over紅燈，實際上失真卻已出現。為了更正確地表示音量，ITU建議使用真實峰值表會比峰值取樣表來得準確，至於真實峰值表是如何測量音量的，有興趣的人可去查閱ITU-R BS.1770建議書。

在沒有響度表前錄混音等，都是要靠錄音師敏銳的聽力加上目視音量表來維持音量一致，但響度是主觀的，要怎樣才能有個客觀的方式來量測主觀的認知？為了解決這個問題ITU-R BS.1770文件提供了一個較客觀又簡單的音量測量方式。下圖為ITU-R BS.1770響度四階段處理法 :

一、首先聲音會先經過所謂的K-weighting filter (K weighting filter跟Bob Katz發明的K System沒有關係) ，這個濾波器分兩段式濾波。

第一段先模擬人的頭部，先在訊號上加個坡架型等化器 (Shelving EQ) ，強化2kHz以上高頻，然後第二段再用二階高通濾波器 (2nd Order High Pass Filter)，減去約100Hz以下低頻，兩段式的濾波就叫K-weighting filter。

合起來的完整K-weighting Filter如上圖。

二、將經過濾波器處理後的各軌音訊功率作均方計算。

三、各音軌加權後加總 (如果是5.1聲道的話，環繞聲道加權值較大，LFE重低音聲道不列入計算) 。

四、各音軌的輸入訊號以每400ms為周期做均方計算 (重疊75%) ，每100ms更新數據一次，低於-70LUFS的數值會被排除，數值比前面的低10LU也被排除。

(請參考ITU-R 1770-3附錄1)

*注意原始文件是以48kHz的音訊去做計算，取樣頻率不同，演算得出來的數值也會不同。

重要響度名詞

LUFS (Loudness Units Relative to Full Scale) ：對應於數位滿刻度 (dBFS) 的響度單位，歐洲EBU採用這名詞。
LKFS (Loudness K-weighted relative to Full Scale) ：對應於數位滿刻度的K加權響度單位。美國的ATSC A/85採用這名詞，事實上LUFS跟LKFS完全相同，只是不同區域的稱呼不同。
LU (Loudness Unit) 響度單位：測量響度的單位，1LU= 1dB。
I (Integrated Loudness) 整體響度：整段節目長度 (從開始至結束測量) 總合計算出的響度。
S (Short-term Loudness) 短期響度：測量過去3秒鐘內的音訊響度。
M (Momentary Loudness) 瞬間響度：測量過去400毫秒內的音訊響度。
LRA (Loudness Range) 響度範圍：測量整段節目 (同Integrated Loudness長度) 內，最小與最大響度間的差距，以LU為單位。
Crest factor 峰值因數：也叫做peak to average ratio，指的是一個音訊訊號最高峰值到RMS均方根平均值之間的差異，以dB表示。

dBTP (Decibel True Peak) ：參考dBFS表，以over-sampling方式來重建聲音訊號波型，避免最大峰值出現在取樣樣本間的問題 (inter-sample peak) ，正確表示真實峰值的數位音量分貝表。
Sample Peak：一般常見的數位取樣峰值表，缺點是忽略了最大峰值出現在取樣樣本之間的可能性，造成音量看似未破表，實際上卻已失真。
Peak Normalization 峰值均一化：不同曲目、節目用最大峰值音量來對齊預設的音量參考值。過去採用這種方式來統一音量，易造成追逐比別人大聲醒目，而在混音時過度壓縮聲音動態，讓聲音聽起來更大聲，形成響度戰爭。
Loudness Normalization響度均一化：以響度來衡量聲音大小，制定一個參考數值，讓所有節目或曲目對齊這個響度值。優點是保留了一定的headroom (餘裕空間) ，鼓勵聲音要有動態。
Target Loudness Level目標響度值：設定整體聲音響度所要達到的均一值。

重要響度相關文件

ITU-R BS.1770：Algorithms to measure audio programme loudness and true-peak audio level
ATSC A/85 (USA) ：Techniques For Establishing and Maintaining Audio Loudness for Digital Television
EBU R128 (Europe) ：Loudness Normalisation and Permitted Maximum Level of Audio Signals
OP-59 (Australia) ：Free TV Australia Operational Practice, Measurement and Management of Loudness in Soundtracks for Television Broadcasting
ARIB TR-B32 (Japan) ：Operational Guidelines for Loudness of Digital Television Programs

目前各大串流平台上傳音樂規範

接下來我們來看看常見的串流音樂平台所採用的響度參考值，以及如何處理上傳音樂的動態。

首先必需說明一下，除YouTube外，上列串流音樂平台多數都有自動音量調整 (audio normalization) 功能，在設定裡都可找得到，你可以選擇要不要用，若是選擇使用，程式便會在播放音樂時，將音量調整到預設的響度參考值上。

上傳音樂至串流平台後，系統會去測量單一曲目或是整張專輯的整體響度值，也就是看響度表上的I值大小。採用整張專輯去測響度的方式，比較能完整呈現母帶後期處理後的原貌；單一曲目測量就是視每首歌曲為獨立個體，方便維持隨機播放或自訂清單時的音量，少了整體專輯的一致感與藝術性。

有幾點要注意的：

1. 除YouTube外，多數音樂串流平台在播放設定裡面都可選擇要不要啟動自動音量調整功能，如果選擇啟動，音樂就會根據各平台制定的響度參考值去做曲目或專輯的音量調整，均一化到參考值左右。必須注意的是：響度超過參考值一定會被降下，但響度未達到參考值時，有的會加大，有的不會。

2. 注意上傳音樂的最大峰值。

假設平台是會自動調整音樂響度大小，現在有一首歌，測出它的整體平均響度為 -16LUFS ( I值)，最大峰值為 -3dBTP，要傳上響度參考值為 -14LUFS的串流平台，因為響度低於參考值2LU ，所以系統會整首自動加大 2dB ( 1LU＝ 1dB) ，讓它的平均響度達到 -14LUFS，而它的最大峰值也會跟著加大到 -1dBTP。

如果曲子的整體響度是 -12LUFS，最大峰值為 -3dBTP，平均響度高於參考值2LU，上傳到這個平台，自動音量調整就會將曲子降低 2dB播放，它的最大峰值也就會從 -3dBTP降至 -5dBTP。

降低音量比較沒有問題，問題就出在調高音量時。假設要上傳平台播放的音樂整體響度是 -16LUFS，而混音時做到的最大峰值為 -1dBTP，上傳到響度參考值為 -16LUFS的Apple Music不會有什麼問題，但上傳到響度參考值為 -14LUFS的Spotify就有問題了。Spotify的自動音量調整會調大2dB，原來是 -1dBTP的最大峰值再上調2dB就超過數位音量表最大的0dBFS值，造成clipping失真。

現在多數平台為了防止響度較小的音樂在往上調升響度時，造成峰值破表失真，多有因應策略。有的平台對於小於參考值的音樂不做任何調整，有的是設定最大峰值限制，確保音樂不因加大響度而失真。舉例來說，有首曲目的整體響度是 -20LUFS，峰值為 -5dBTP，放上響度參考值為 -14LUFS、最大峰值 -1dBTP的平台時，理論上平台自動音量調整應要將整首歌上調 6LU，但因最大峰值的限制，平台只會調成 -16LUFS的大小。

3. 是否有預設限幅器 (Limiter) ？

其實多數串流平台目前都沒有放limiter，理論上萬一經過自動音量調整後，最大真實峰值沒抓好，你的音樂就會出現爆音。 (請注意：做完mastering後一定要用有True Peak功能的音量表確認峰值位置。) 不過事實不是這樣，上一點提到的最大峰值限制裡有做說明。

要特別說明一下Spotify已在2020年底更改過它的處理方式，現在的Spotify已採用ITU-R BS.1770測量響度，並拿掉了放在一般播放模式的Limiter。Spotify現在Premium用戶可以選用三種聆聽模式：Loud (-11LUFS) 、Normal (-14LUFS) 、Quiet (-23LUFS) ，只有使用Loud模式時，才會加上Limiter。會有Loud模式是為了方便在吵雜環境聽音樂的人，壓縮動態讓響度提升，避免背景噪音太大而聽不清楚。

4. 因為各平台採用的編碼方式 (Codec) 不同，如果是使用有損壓縮編碼 (lossy codec) ，像是 MP3 、WMA、AAC、Ogg vorbis，編碼的過程中也可能造成峰值增加，產生失真，所以最好在送母帶上各平台時，使用一些工具 (如Apple Digital Master Droplets、NUGEN的 Master Check等等) 測試是否會有失真產生。

響度控制真的解決問題了嗎？

先說明一下為什麼我不用響度“標準”這個詞，其實口語上大家都懂，不過原文就是reference，它只是個建議，並未強制規定音源上傳一定要在數值上。如一開頭所說，響度是主觀的，人耳聽覺本就不是一個能標準化的東西，低頻永遠是個最不準的地帶，如果音訊低頻聲音比例占多數，低頻能量大，不只是一般音量表上會佔大部分空間，響度表也是，明明響度已超過參考值，但耳朵聽起來就是不夠；人耳最敏感的 2~5kHz情形剛好相反，如果音訊這個頻段的聲音居多，耳朵告訴你音量大小一樣了，但響度表卻顯示未達到參考值。

根據Equal Loudness Contour (等響曲線) ，人耳對高低頻較不敏感，對2~5kHz較敏感。響度表畢竟只是模擬人耳的聽覺，但還是有些不同，所以廣播電視節目在錄製節目時，還是以人耳為主，響度表為輔；串流音樂平台方面只能靠自動音量調整去把差異減小，由於每首歌曲的頻率分布不一，所以即便開啟自動音量調整，聽起來仍有些音量差異。

另外像是器樂的獨奏或較輕柔的樂曲要跟磅礡的馬勒交響曲放在前後首播放，響度調到接近時，你會有什麼樣的感受？想像一下。不同的音樂類型會有不同的動態範圍，把獨奏樂器變成跟交響樂團同等大聲擺在一起，聽起來也很奇怪。盡管響度自動控制可以幫助我們快速地達到大小聲平均這件事，但實際上也不是完美的，因此有的平台採用以專輯來測整體響度，這樣至少保有了原來專輯母帶設定的大小聲及藝術性。

綜合來說，使用響度控制抑制了響度戰爭，也保留音樂／節目應有的動態範圍，尤其對廣播電視播出系統來說，解決了長期以來廣告商為了想讓自家廣告突出，使盡方式要混音師把音量變大，甚至不惜讓聲音破掉的不合理要求。有了響度控制後，即使混再大聲，最後都會被拉下音量跟別人一樣，而且因為動態被壓縮到極小，拉到同等響度時，反而顯出聲音失真、扁平無趣的缺點。

母帶後期處理要如何看待響度參考值

母帶後期處理不只是把音量拉大，加亮高頻這麼簡單，影響響度最大的還是混音階段，混音必須取得良好的頻率分布及音量、動態平衡，將來做母帶後期處理時，才有辦法處理的更漂亮，呈現出最佳的成品。

對於母帶製作時，到底要不要考慮各平台的響度參考值呢？多數的母帶工程師都覺得要回歸音樂本質，盡力做出最好聽的音樂，這才是重點，至於各家平台採用哪種方式調整音量，就讓平台去處理，母帶工程師不太可能為了眾多平台一個一個去做出符合他們規格的母檔，而且規格隨時可能會改變。盡管如此我們還是要去了解這些串流音樂平台的規格，注意一下響度均一化後的安全動態範圍。若是要轉成有損格式，可先行轉檔，避免平台轉檔編碼不佳，或因轉檔而峰值失真的問題產生。

想要多了解一些因應串流時代，母帶要如何處理響度問題，可參考下面影片

Jonathan Wyner老師在iZotope有出一系列mastering影片，非常值得一看。

謝謝您來到我的聲音研究室，希望您喜歡我的文章，請多多支持幫我按讚、分享、訂閱及追蹤。如果有聲音後製、唱片製作上的需求，也歡迎連絡我的工作室。

留言

留言分享你的想法！

Jazzer聲音研究室的沙龍

29會員

25內容數

Jazzer聲音研究室的沙龍的其他內容

2024/05/22

響度戰爭真的結束了嗎？

響度這個問題大家也討論了很久，國外各大串流平台、廣播電視頻道都建立了各自的響度規範，雖然數值有一點點差異，但可說大多認同差不多的響度規範了。最近徐譽庭導演新上映的「不夠善良的我們」戲劇播出後，發現在家收看電視首播與OTT播出聲音上有很大的不同，發了一篇文提出台灣影視聲音一直以來存在的忽大忽小、聲音規