「漫談數位音樂」2~細說音樂CD規格

◆ 「漫談數位音樂」2~細說音樂CD規格 專欄作者 發表日期 閱讀次數 回應篇數
LukeLo 02-02-04 14973 0


細說音樂CD(Compact Disc Digital Audio)

關於音樂CD實在是有太多可以聊了,這個於1982年由Sony和Philips共同制定於紅皮書的儲存媒體,便於攜帶音質又比錄音帶好,流行至今毫無頹勢。關於它的規格有許多有趣的故事,例如為什麼一片標準長度的CD是74分鐘呢?話說這是因為設計者想要把貝多芬第九號交響曲存進一片CD中,於是開始估計CD的直徑,另一套說法是著名指揮家卡拉揚(Herbert von Karajan)這樣要求,也有人說是Sony公司當時主席的太太這樣要求,另一套說法是Sony當時的Mr. Oga所決定的。另外要補充的是Herbert von Karajan指揮的貝多芬第九號交響曲總長度大概在68分鐘左右,一般的版本大概在65~74分中間分布。

根據網友nightmare告知,大賀典雄的傳記記載當卡拉揚還活著時,跟大賀的交情匪淺(算亦師亦友的感情吧),因此當年Philips找上Sony制定CD規格時,大賀就一口咬定一片CD一定要能裝得下貝多芬第九號交響曲(大賀本身是聲樂家),因為古典音樂單首曲目的長度比這個長的也寥寥無幾,為了在聆賞時不影響興致,所以大賀對此非常堅持,而日後大賀用此錄卡拉揚預演的曲目,並讓卡拉揚聽,而卡拉揚非常讚賞這個劃時代的數位媒體,甚至後來在說明會之類的活動時,卡拉揚也幫 CD 說了不少好話。

CD是以螺旋狀由內到外儲存資料,在一片標準74分鐘的CD中,從裡繞到外總共有22188圈,把它全部伸展開來長達5.7km。音樂的CD讀取方式是等線速度(CLV),每秒有1.2m長的資料經過雷射頭,雷射在真空中波長為780nm,以偵測CD表面的凹凸變化判讀訊號。表面的凹凸刻痕寬0.5um,深度為0.11um(約為780nm雷射在CD塑膠材質內波長的1/4),長度為0.8到3.1um。CD是以由凹變凸和由凸變凹定義為1,平坦的部分為0,所以改變刻痕的長度可以改變資料內容。而讀取頭就是靠著凹變凸和由凸變凹時的光干涉作用來判讀訊號。

音樂CD的規格為什麼是44.1kHz、16Bits呢?關於44.1kHz這個數字的選取分為兩個層面。首先我們知道人耳的聆聽範圍是20Hz到20kHz,根據Nyquist Functions,理論上我們只要用40kHz以上的取樣率就可以完整紀錄20kHz以下的訊號。那麼為什麼要用44.1kHz這個數字呢?那是因為在CD發明前硬碟還很貴,所以主要數位音訊儲存媒體是錄影帶,用黑白來記錄0與1。而當時的錄影帶格式為每秒30張,而一張圖又可以分為490條線,每一條線又可以儲存三個取樣訊號,因此每秒有30*490*3=44100個取樣點,而為了研發的方便,CD也繼承了這個規格,這就是44.1kHz的由來。

一張刮痕累累的CD放到CD Player中聽起來聲音常沒有什麼問題,這又是什麼原因呢?這是一個非常複雜的問題,我們必須從CD的訊號儲存格式說起。首先要引入的名詞是block,CD每秒鐘的資料被分成7350個block。每個block內有588bits的資料。可是這588bits無法全部用來儲存有意義的資料,因為過度密集的凹凸變化會造成硬體設計難度的增加,且CD是以由凹變凸和由凸變凹定義為1,無法重複出現1,因此每14個bits中只有8個bits是有意義的,這就是所謂EFM(Eight-to-Fourteen-Modulation)的目的。扣除6bits無意義的資料,每個block剩下588*8/14=336bits,再扣除同步(sync)與合併(merge)資訊,剩下264bits,等於264/8=33bytes。在這33個data bytes中,有1個sub-code byte、12個odd-audio bytes、4個Q-redundancy bytes、12個even-audio bytes和4個P-redundancy bytes。其中最有意義的就是那12+12=24個音訊bytes,每個block共有24*8=192bits,由於CD以16bits紀錄資料大小,因此每個block有6個立體聲取樣點資料(6*16*2=192)。還記得前面說過每秒鐘有7350個block嗎?由此可以得知每秒鐘有6*7350=44100個立體聲取樣點!沒錯,就是這個數字。順帶一提的是每98個block組成一個frame,每秒有75個frame(98*75=7350)。好了,我們還沒講到重點,為什麼有輕微刮痕的CD聽起來還是很正常呢?

答案就在於這24bits的音訊資料,並非單純按照出現順序儲存在單一的block中,而是打散順序離散分布在接下來109個block中,因此若有刮痕造成一部份的資料無法正確讀出,可以藉由前面提到的P-redundancy bytes和Q-redundancy bytes作同位檢查確保資料正確性,進而重建資料,還可利用聲音連續變化的特性,由問題資料的前後取樣點來內插補點。實際編碼時,是先將12bytes的even samples重新排列然後經由C2編碼計算出4 bytes的Q-redundancy得到28bytes的資料,然後由這28bytes的資料來決定這24bytes的音訊要如何分布在0到108個block中。再來將這28Bytes的資料經過C1編碼,如此就得到4bytes的P-redundancy。P-redundancy另外的用途是確保當取樣點都為0時這block中的32bits仍不都為零。另外每個block還有一個sub-code byte,其用途非常廣泛,在lead-in的區域sub-code紀錄了這張CD有幾軌、總長度多少﹔在音軌的部分則記錄了從這軌開頭已經經歷了多少時間、從第一軌開頭又經歷了多少時間、這音軌是二聲道還是四聲道(不過從來沒聽說過四聲道的CD)、是否允許複製、以及該音軌是否有經過Pre-emphasis處理與一些偵錯資訊。另外sub-code也可以用來記錄該CD的UPC(Universal Product Code)碼與該音軌的ISRC(International Standard Recording Code)碼。ISRC由IFPI統一發放,前兩碼英文代表國名,再來三碼英文為發行者,最後五碼是數字。

我們常在古典音樂CD上看到DDD,ADD,AAD字樣,又代表了什麼意思呢?這三個英文其實是Digital或Analog的縮寫,第一個英文表示錄音時的母帶為數位或是類比格式,第二的英文代表混音及剪輯時母帶使用數位或是類比格式,最後一個英文字代表最終的Master母帶是用數位還是類比格式儲存,由於音樂CD的母帶一定是數位化的,因此最後一個英文字都是D。

接下來想要介紹一些CD的衍生物如HDCD,xrcd2等,但是不可避免要提到一些數位錄音著專業術語,因此我們先解釋一下這些術語。

posted @ 2012-01-14 22:14  高老庄986  阅读(438)  评论(0)    收藏  举报