「漫談數位音樂」3~數位音訊處理技術名詞解釋

◆ 「漫談數位音樂」3~數位音訊處理技術名詞解釋 專欄作者 發表日期 閱讀次數 回應篇數
LukeLo 02-02-04 18555 0


Pre-emphasis Pre-emphasis就是在錄音的時候將高頻訊號放大,放音時再把訊號用同樣的倍率縮小以還原波形(De-emphasis),在類比錄音的時代,這個技巧的主要用途是作為提高訊噪比。例如廣播發送時將頻率1500Hz to 2000Hz以上以每八度音6dB的倍率提高訊號,或是LP唱片(LP)在錄製時的RIAA(美國唱片工業協會)等化曲線(不過這曲線的制定目的主要與LP的結構有關,且放大訊號不只高頻而已),以及錄音帶用的杜比抑噪系統,都是使用同樣的原理。在數位的領域,Pre-emphasis的主要用意在於降低量化失真,因為一般的音樂訊號高頻段往往振幅比較小,而且越高的頻率振幅越小,所以從PCM取樣的原理中我們可以發現這些小振幅會被分配到較少數的bits來記錄,這樣有效描述振幅的數字就變小了,與原波型的誤差就變大了,因此我們使用Pre-emphasis的技巧先增加高頻振幅再取樣來降低高頻量化失真。使用這功能的音樂CD非常少見,推測是因為Pre-emphasis和De-emphasis這一來一回的計算,反而造成了更大的失真。就筆者所知風之谷原聲帶就有經過Pre-Emphasis處理,由之前提到的subcode紀錄著這項資訊。

Supersampling(Oversampling)

Supersampling字面上的翻譯叫做超取樣,原理是從已有的數位訊號經過內插補點計算得到取樣點間的訊號振幅資訊,例如把44.1kHz轉成176.4kHz的四倍超取樣。超取樣並不能幫我們把更多的細節從量化失真中找回來,它的主要用意是幫助我們獲得更正確的類比訊號。怎麼說是更正確的呢?從之前關於PCM取樣的介紹我們知道越高頻的訊號被取樣的次數就會越少,想像一個20kHz的正弦波經過44.1kHz的取樣,一個週期分不到三個取樣點,要從這三個取樣點算出原來的正弦波理論上是可以辦到的,但實作的這樣的數位電路來計算是非常繁雜的,因此發展出來了各種取巧的方式希望能藉由較簡單的計算得到接近原波型的結果,超取樣算是其中的一種方法,用意是為了重建高頻訊號與原始波型。

Dynamic range

中文叫做動態範圍,也就是容許紀錄資料最大值與最小值的比值,例如16Bits紀錄精度的音樂CD其動態範圍最大就是20*log[(2^16)/1]=96.3dB。用越多bit紀錄,我們就可以得到越大的動態範圍。如果能紀錄越大的動態範圍,我們就能紀錄越多的細節,並且更能保存爆炸聲等大音量聲音的波形。當動態範圍不足時,為了不造成破音,我們只好降低錄音音量,可是小範圍的聲音變化可以分配的bit就減少了,造成量化失真更為嚴重。

Peak Level 

我們把一段波型的最大振幅叫做Peak,peak level則是這最大振幅與最大可容許紀錄振幅的比值。在16bits的例子中,最大振幅就是32767,20bits的例子中就是524287。在之前PCM取樣原理的介紹中我們可以發現越大的振幅可以分配到越多的bit去紀錄,因此同樣的一段波型只要Peak Level不超過1(超過可能會爆音),則原始類比訊號音量越大紀錄的波型越精準。

Normalize 

Normalize就是將一段波型音量放大,放大的目標是讓原波型的最大振幅(peak)等於最大可容許振幅。我們常常會抱怨自做精選集CD這一首音量好大,下一首音量又太小,這時將每首都經過Normalize處理可以改善這個問題。不過由於經放大過後的振幅大小可能不是整數,最後不可避免要用到四捨五入之類的技巧,因此處理過的波型和原波型造成非線性放大產生誤差,再度導致量化失真。所以為了保留音色與相位的正確性,處理數位音樂盡量避免Normalize,除非放到後剛好不須捨棄位數。

Dither

Dither是數位音樂處理上非常神奇的技巧,目的是用少數的bits達到與較多bits同樣的聽覺效果,方法是在最後一個bit(LSB:Least Significant Bit)動手腳。例如用16bits紀錄聽起來好似20bits的資料,聽到原先16Bits無法紀錄的微小資訊。舉例來說,今天我有個20Bits的取樣資料,我現在想把存成16Bits的資料格式,最簡單的轉換方式就是直接把後面四個bits直接去掉,但是這樣就失去用20Bits錄音/混音的意義。比較技巧性的方法是在第17~20Bits中加入一些噪音,這段噪音就叫做dither。這些噪音加入後,可能會進位而改變第16個Bit的資料,然後我們再把最後四個bits刪掉,這個過程我們稱為redithering,用意是讓後面四個bits的資料線性地反映在第16個bit上。由於人耳具有輕易將噪音與樂音分離的能力,所以雖然我們加入了噪音,實際上我們卻聽到了更多音樂的細節。

關於dither有種比喻是說我們透過手指間的細縫只能看到眼前部分的圖形,但是如果前後揮動手掌,就可以透過不同時刻看到的各個圖形的一小部份,在腦中建構出完整的圖形資訊,這是大腦神奇的地方,不是簡單的理論就可以說得通的。在此我提供一個網址,該網頁內提供經過dither處理和原始的wav檔下載,內容是一個固定頻率的聲音以等比例逐漸降低音量,我們可以發現經過dither處理過的聲音聽起來失真比較少且持續比較久,也就是可以讓我們聽到更小的音量與細節,還附有dither前後的波型圖示,網址如下:http://www.mtsu.edu/~dsmitche/rim420/reading/rim420_Dither.html。在眾多的dither技術中,Sony公司的SBM(Super Bit Mapping),LIVE STUDIO RECORDINGS的ULTRA MATRIX PROCESSING,都是專攻20bits轉16bits的技術。Dither在數位音訊處理用途非常廣泛,舉凡兩個波型的相加、振幅的縮放、Normalize都會用到。現在的錄音室已經進展到24bits錄音,在CD還是主流儲存媒體的時代,dither還是非常重要的技術。順道一提,在影像處理領域,將24bits的全彩圖形以16bits的高彩畫面顯示也會用到dither的技術。

Jitter

Jitter一般翻譯作時基誤差,是數位音訊播放音質劣化的原因之一。Jitter會造成聲音的改變,成因並非振幅資料本身的錯誤,而是時間部分出錯了。在之前數位化的過程中我們知道一個取樣點包括振幅和時間這兩項資料,而jitter造成振幅沒有在準確的時間呈現出來使得波型扭曲。在普通的CD Player中,由於讀取機構是由資料流量來判斷轉速是否合宜,而電路的工作時脈又是以讀出的一連串數位訊號的多少來決定,因此當轉速不穩定時,每秒讀出的資料數量就有誤差,而電路工作時脈就受到影響,由電路工作時間所決定的各個取樣點的出現時間與實際的時間就產生誤差,這就是jitter的成因之一。還有很多影響工作時脈的因素可能造成jitter,例如CD的重量與厚度是否均勻影響轉動穩定性、反射面的材質、石英震盪的品質、CD轉盤到DAC之間的連接線,都會造成jitter。要避免jitter發生最直接的方法就是re-clock,將接收的數位訊號先存到緩衝記憶體中,在精準的時鐘運作下重新送出這些數位訊號,並且讓後續的數位電路以這個時鐘為運作基準。有些Hi-End器材使用不同於一般S/PDIF的單線數位傳輸介面,加入包含時鐘訊號的接線用意即在此。S/PDIF將運作時脈資訊藏在資料的變化中,因此資料流量會影響運作時脈。

或許讀者仍對所謂資料正確但是音質受到影響感到疑惑,為了讓讀者對jitter有更深刻的認識在此提出一個相關實驗。準備一張音樂CD,然後複製成另外一張,並用抓音軌軟體檢查確保這兩張CD的資料內容是相同的,可是放到CD Player中聆聽卻發現兩張CD的音質有很大差異。原先猜測是因為CD Player的讀取機制不如電腦光碟機精準,但經過專業用音效卡CardDeluxe數位錄音從CD Player的數位輸出(SPDIF Out)的結果,經過多次的比對我們發現數位錄音的結果與直接抓音軌的資料內容相同,也就是說CD Player讀取資料內容並沒有問題,而影響音質的主要原因是jitter。單位時間資料流量不穩定的變動造成jitter,但這些資料內容本身並沒有出錯,因此不能單從數位錄音的資料發現錯誤。一般來講,除非設計上有瑕疵,jitter不該會大到使資料內容出錯,否則該稱為Error而非jitter。

posted @ 2012-01-14 22:15  高老庄986  阅读(473)  评论(0)    收藏  举报