计算机声音原理

Posted on 2012-05-16 13:50 3k 阅读(3708) 评论(0) 收藏举报

无论你是在玩游戏,还是在看VCD,你都会听到美妙的音乐从计算机中传出来.那么,计算机又是如何处理声音的呢?

采集和播放声音

我们都知道,声音是一种波,人的隔膜感受到声波的振动,并通过听觉神经付给大脑,于是我们就听到了声音.声波的振动幅度越大,所听到的声音就越响;而声波振动的频率越高,我们听到的声音就越尖细.一般来说,正常人的耳朵只能分辨频率从20Hz到22KHz之间的声音.

毫无疑问，声音是一种模拟信号，而计算机只能处理数字信息0和1。因此，首先要把模拟的声音信号变成计算机能够识别和处理的数字信号，这个过程称为数字化，也叫“模数转换”。在计算机对数字化后的声音信号处理完后，得到的依然是数字信号。如果将它们直接送给扬声器，那你根本就听不懂。因此，必须把数字声音信号转变成模拟声音信号，然后再输出到扬声器，这个过程称为“数模转换”。

将声音数字化一般分为两个步骤来完成：采样和量化。

首先，对模拟声音信号进行采样。这个过程的实际操作是，每隔一个很短的时间，比如1/8000秒甚至更短的时间，对模拟声音信号邓一个样本，也就是获取模拟声音信号在此时的电压值（音量），我们把每一秒钟之内采样的次数称为“采样频率“，用赫兹（HZ）做单位。一般来说，采样频率要达到原始声音信号最高频率的两倍以上，才能较好的保证原始模拟信号在数字化后不失真。而人耳能听到的声音的最高频率为22KHZ，所以要达到比较好的数字化效果，采样频率要在44KHZ以上，这也就相当于每秒种要采样44000次。由于使用44KHZ的频率进行采样所的数据过于庞大，在一些对声音效果要求不高的场合，人们还经常采用22KHZ，11KHZ或者8KHZ等采样频率。CD唱片的采样频率一般是44KHZ，FM广播一般是22KHZ，AM广播为11KHZ，而电话的采样频率则只有8KHZ。

然后，财对每个采样样本进行数字化处理。一般比较常用的是使用8位或者16们量化精度。所谓8位量化，或者说是8们编码，就是将声音的音量从最小值到最大值之间分为2的8次方，也就是256个等级。每个等级对应的数字编码从0到256，用一个字节来表示。而每个采样样本的音量就近似的对应这256个等级中的一个，也就相应的获得一个数字编码。而16位量化与8位量化在原理上没有本质的区别，只是16位量化将音量分成了2的16次方共65536个等级，这样数字化后的声音将更加逼真。（根据研究结果显示，超过16位的量化精度，正常人的耳机也分辨不出来，所以现在最常用的是采用16位量化来处理声音。）

还有一个单声道和立体声的问题。所谓立体声，准确的说应该叫双声道，它是将声音分成左右两个独立的声道分别进行处理。而单声道则只有一个声道。

以上的数字化过程都是由安装在计算机中的声卡来完成的。经过数字化后的声音数据在计算机的硬盘中存储为文件。最常见的声音文件格式就是WAVE文件，在WINDOWS中，它的扩展名为.WAV。

WAVE文件的大小与数字化过程中使用的采样频率和量化精度有直接关系，受用11KHZ采样频率，16位量化精度的单声道WAVE文件大小为每分钟1。32M字节；而采用44KHZ采样频率，16位量化精度的双声道WAVE文件大小为每分钟10M字节！

刷新页面返回顶部

3k

公告

计算机声音原理