第2節、電腦聲音、音樂處理的基本概念
一、電腦如何聲音
第二章第4節中曾提及,電腦中形成影像的方法主要有兩種,點矩陣法和向量法。電腦形成聲音的方法也是類似,分別有「聲波取樣」、「樂譜填寫與樂器模擬」兩種方法:
聲波取樣:聲音或音樂,其實是隨著時間不停的有音量大小震動的聲波。聲波取樣即數位錄音的方法,是指每秒鐘對此聲波的音量「測量」一定的次數(取樣次數),並且將測量的「音量」換算成一定的數值儲存下來,這就是將聲波數位化的方法。播放的時候,按照時間的順序,一一的把儲存的音量播放出來,就可某種程度還原成原來的聲波。譬如音樂CD將歌曲數位化時,是將歌曲的聲波每秒鐘取樣44,100次,並且將每次取樣測量的「音量」換算成65,536種大小不同的數值儲存起來。
樂譜填寫與樂器模擬:利用電腦的音效卡配合音效程式來模擬各種不同的樂器的聲音,如鋼琴、小提琴、喇叭、鼓、吉他等等,再利用「作曲程式」填寫各種樂器所屬的樂譜,命令電腦所模擬的樂器按照樂譜演奏,就好像命令、指揮一整個交響樂團、搖滾樂團看譜演奏一樣。這種音樂檔案記載的不是聲波的細微資料,而是標準的五線譜豆芽菜,升降記號、音符高低、快慢強弱等。播放時,音效卡與音效程式看譜演奏,這時音效卡模擬樂器的「功力」就很重要了。好的音效卡可以逼真的模擬出真實樂器的聲音,奏出美妙的音樂,好似真實的樂團演奏;不好的音效卡就雖然是看同樣的譜來演奏,可是聽起來卻像是大哥大來電鈴聲那樣簡單傻瓜的音樂。
二、聲波取樣與CD音質
「CD音質」是一種聲波取樣的工業規格,即我們日常所聽見的音樂CD的聲音品質。「CD音質」是指聲波每秒鐘取樣44,100次,分成立體兩聲道,每個聲道的音量每次取樣時換算成65,536種大小不同的音量數值儲存起來,標準的說法是:
取樣次數(Sampling Rate):44.1KHz
左右兩聲道立體聲(Stereo)
每個聲道每次取樣為16bits音量資料
Hz是「次/每秒」或「每秒幾次」這樣的單位,K是1,000,所以44.1KHz其實就是44,100Hz,也就是每秒鐘取樣44,100次的意思。16bit是一種二進位的算法,其實就是等於65,536,每次取樣為16bits音量資料就是指每次取樣時換算成65,536種大小不同的音量數值儲存起來。
每秒「CD音質」的聲音資料有多大?計算如下:
44,100(每秒取樣次數) * 16bits(音量數值) * 2(立體聲)
= 44,100 * 16 * 2 bits
= 1,411,200 bits
一分鐘有60秒,而8bits為一個Byte,所以每分鐘的「CD音質」的聲音資料的大小為:
1,411,200 * 60 / 8 = 10,584,000(Bytes)
即每分鐘的「CD音質」的資料約為10MB!就是這麼來的,資料量非常的龐大,平常的流行歌曲約莫3分半鐘,資料量就有35MB,需要25張軟碟片才裝得完。
至於為什麼「CD音質」的聲音、音樂需要每秒鐘取樣44,100次,每次取樣的音量有65,536種這麼多呢?一方面是人的耳朵所可以聽見的聲頻大約是60Hz(每秒鐘震動60次的聲音)到16KHz(每秒鐘震動16,000次的聲音)左右,又,人的耳朵非常的靈敏,所以真的需要每秒鐘取樣44,100次(約是16KHz高聲頻的兩倍有於,已經可以記錄高聲頻的基本波形)、音量刻度有65,536種,其所記錄的數位聲波才完全不會被人的耳朵聽出破綻。
三、聲音檔案的大小與音質
當然聲波的數位取樣不須如同「CD音質」的工業規格這麼誇張,不同的取樣程度會形成不同的聲音品質,從音質好到差的程度有:CD音質、近CD音質、FM收音機的音質、AM收音機的音質、短波收音機的音質、電話音質。
CD音質我們已經知道了:
取樣次數:44,100Hz
立體聲(Stereo)
16bits音量資料
換算成每秒的資料量是:1,411,200 bits
譬如收音機的音質大約是:
取樣次數:22,050Hz
單聲道(Mono)
8bits音量資料
換算成每秒的資料量是:176,400bits
又如電話音質大約是:
取樣次數:11,025Hz
單聲道(Mono)
8bits音量資料
換算成每秒的資料量是:88,200bits
取樣越少,音質越差,資料量越小。換句話說,從聲音檔案的資料量就可以大略看出聲音品質的好壞,所以數位錄音工作者訂出了一個聲音品質的術語,叫做「資料率」(Bitrate),單位是kbps(kilo-bits per second),即每秒鐘聲音的資料量有多少kbits,k是1,000的意思。如「CD音質」每秒的資料量是1,411,200 bits,即每秒的資料量大約是1,411kbits,「資料率」為1,411kbps。上述幾種聲音品質與其資料率條列如下:
表5-1、聲波取樣音質表
資料率
(Bitrate)
kbps
音質
每分鐘
資料量
1411
CD音質 10MB
176
收音機音質 1.32MB
88
電話音質 0.66MB
由此可見,減少聲音的取樣次數與音量數量雖然可以大量的減少聲音檔案的大小,但是聲音品質也變差許多,爛得可以,居然電話音質還需要每秒鐘近1MB的資料量。
有沒有什麼聲音資料壓縮技術可以在不犧牲聲音品質的情況底下,大大的減少聲音檔案的大小呢?有的,就是下一節所要介紹的MP3聲音壓縮技術。