3k

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

计算机声音原理

Posted on 2012-05-16 13:50  3k  阅读(3708)  评论(0)    收藏  举报

无论你是在玩游戏,还是在看VCD,你都会听到美妙的音乐从计算机中传出来.那么,计算机又是如何处理声音的呢?

采集和播放声音

         我们都知道,声音是一种波,人的隔膜感受到声波的振动,并通过听觉神经付给大脑,于是我们就听到了声音.声波的振动幅度越大,所听到的声音就越响;而声波振动的频率越高,我们听到的声音就越尖细.一般来说,正常人的耳朵只能分辨频率从20Hz到22KHz之间的声音.

          毫无疑问,声音是一种模拟信号,而计算机只能处理数字信息0和1。因此,首先要把模拟的声音信号变成计算机能够识别和处理的数字信号,这个过程称为数字化,也叫“模数转换”。在计算机对数字化后的声音信号处理完后,得到的依然是数字信号。如果将它们直接送给扬声器,那你根本就听不懂。因此,必须把数字声音信号转变成模拟声音信号,然后再输出到扬声器,这个过程称为“数模转换”。

           将声音数字化一般分为两个步骤来完成:采样和量化。

           首先,对模拟声音信号进行采样。这个过程的实际操作是,每隔一个很短的时间,比如1/8000秒甚至更短的时间,对模拟声音信号邓一个样本,也就是获取模拟声音信号在此时的电压值(音量),我们把每一秒钟之内采样的次数称为“采样频率“,用赫兹(HZ)做单位。一般来说,采样频率要达到原始声音信号最高频率的两倍以上,才能较好的保证原始模拟信号在数字化后不失真。而人耳能听到的声音的最高频率为22KHZ,所以要达到比较好的数字化效果,采样频率要在44KHZ以上,这也就相当于每秒种要采样44000次。由于使用44KHZ的频率进行采样所的数据过于庞大,在一些对声音效果要求不高的场合,人们还经常采用22KHZ,11KHZ或者8KHZ等采样频率。CD唱片的采样频率一般是44KHZ,FM广播一般是22KHZ,AM广播为11KHZ,而电话的采样频率则只有8KHZ。

            然后,财对每个采样样本进行数字化处理。一般比较常用 的是使用8位或者16们量化精度。所谓8位量化,或者说是8们编码,就是将声音的音量从最小值到最大值之间分为2的8次方,也就是256个等级。每个等级对应的数字编码从0到256,用一个字节来表示。而每个采样样本的音量就近似的对应这256个等级中的一个,也就相应的获得一个数字编码。而16位量化与8位量化在原理上没有本质的区别,只是16位量化将音量分成了2的16次方共65536个等级,这样数字化后的声音将更加逼真。(根据研究结果显示,超过16位的量化精度,正常人的耳机也分辨不出来,所以现在最常用的是采用16位量化来处理声音。)

            还有一个单声道和立体声的问题。所谓立体声,准确的说应该叫双声道,它是将声音分成左右两个独立的声道分别进行处理。而单声道则只有一个声道。

            以上的数字化过程都是由安装在计算机中的声卡来完成的。经过数字化后的声音数据在计算机的硬盘中存储为文件。最常见的声音文件格式就是WAVE文件,在WINDOWS中,它的扩展名为.WAV。

           WAVE文件的大小与数字化过程中使用的采样频率和量化精度有直接关系,受用11KHZ采样频率,16位量化精度的单声道WAVE文件大小为每分钟1。32M字节;而采用44KHZ采样频率,16位量化精度的双声道WAVE文件大小为每分钟10M字节!