刘品
学以致用---博主简介:专注语音、视频数字信号处理方面的研究以及算法在手机平台上面的移植和优化。涉及语音/音频编解码,语音增强,语音识别,语音音质客观评估,VOIP语音引擎 Qos算法模块和声音变速不变调和变调不变速等功能实现。熟悉ARM 各个系列的CPU,用ARMv4,ARMv5,ARMv6 and Cortex Neon 汇编优化相关算法代码,争取perforamance 最优。目前主要Windows mobile and Android platform上做相关speech/audio算法以及应用开发, HEVC 编解码器PC 和手机上的开发与应用。(交流Email:liupin.2008@gmail.com)

如果我们平时听到的都只是扬声器的直达声,那将会是一种完全不同的感受!不幸的是,那样的效果意味着不会出现反射,空间模式或环境噪音,而这是不可能出现在日常生活中的,所以我们只能聆听在现实房间中扬声器的声音。

扬声器系统和房间的相互作用是极其复杂难懂而不好测量的!衡量这种相互影响的方法之一就是去测量扬声器/房间的脉冲响应。房间中典型音响系统的脉冲响应中包含有很多有趣的信息,包括:


1 )扬声器和话筒间的延迟
2 )直达声和混响声的电平比
3 )声音抵达时间,频率内容和声音反射的程度
4 )声音早期和晚期的衰变率
5 )直达声的频率响应

其中,最后一点是最有趣的。现在的问题是“我们想要衡量什么,为什么?”而另一个触及“系统”测试和优化核心的问题是“如果脉冲响应包含直达声的频率响应,我们能将扬声器频率响应从室内频率响应中分离出吗?”另外“如果我们能做到,我们要去做些什么呢?”要探究这一问题,就要考虑在图#1中给出的脉冲响应图示。

图#1展示了在这个时间域的脉冲响应。“尖峰”代表着直达声,它实际上包含了与扬声器相关的频率和相位信息。要查看此信息,我们就必须把这部分的脉冲响应转化为频域。为从室内频率响应中隔离直达声束,我们必须要拣选出一个包括有直达声、但不包括有房间频率的反射和衰减的时间窗。




图1 :有1250个座位的多功能大厅的脉冲响应。

X—轴显示时间( 〜 0.75秒),而Y—轴显示dB等级。

要注意直达声,反射,混响衰减和背景噪声。

图#2展示了这样一个时间窗。这是对一全频扬声器和在离扬声器约60’远的话筒所做的测量。以粉红噪音作为一种参考信号,而脉冲响应是使用512K FFT来进行计算的(尽管只显示了首个〜 0.75秒时的数据)。



图2 :有1250个座位的多功能大厅的脉冲响应。时间窗中的垂直线显示的是忽视掉绝大多数室内影响后的情况,其频率段长于时间窗内所显示的(即低频)。


我们可以采用“时间窗”所提供的数据,用FFT计算方法将它转换为频域。这种转换可以显示出在每个频率上有多少能量,就如图#3所示。

在图#3中你可以看到低频明显的滚降。也可以在图表中看到低频的解析度不足。但低频的解析度不足可以通过高频上的盈余来抵消。低频和高频间不均衡的解析度是由于使用了FFT算法将时间域转化为频域。标准的FFT算法所转化的频率数据会成线性分布状(每个X Hertz对应一个数据点)。不幸的是,人们总是喜欢去成对的解释频率。




图3 :有1250个座位的多功能大厅的脉冲响应中直达声部分的频率响应。响应是通过512点FFT来计算的(其等于512/48000或~11毫秒)。正如你会看到频率响应显示着一个明显的低频滚降。


图#3中的低频解析度不足是由于使用了从时间域转化为频域的短时间的时间窗所造成的。值得注意的是这一点不会影响到我们的收听。单一的聆听全套扬声器时,经测量要让它变清晰,就要将低频降到至少100 Hz!

我认为有效的测量系统的首要目标是为我们的聆听提供服务。而现在我们的聆听和我们进行测量的目地间缺乏联系,所以要改变我们的做法。

作为代替的方法,可以试着去进行关于我们聆听的测量,我们可以试着使用更长时间的时间窗去“查看”有更好解析度的低频响应。图#4显示的是约250毫秒的长时间窗。




图4 :有1250个座位的多功能大厅的脉冲响应。时间窗中显示的垂直线之间包括了房间中的绝大多数效果。该时间窗显示的是约0.25秒内的情况。

要将这一较大部分的脉冲响应转化为频域,我们需要使用8K FFT,其代表着8K/48000秒或0.171秒。还要注意这个时间窗也是同时包含了直达声和房间频率响应的。

在图#5中的低频信息,看起来就有着足够的解析度,然而高频看起来却显得很混乱。绘图显示了5Hz解析度的数据(即每5Hz对应一个数据点)。该图提供了非常好的低频解析度(在31 Hz和62.5赫兹之间有15个数据点)。然而在高频上的解析度却有些过度——在4kHz到8kHz之间就有约800个数据点。简单地说,长时间窗可以提供很好的低频解析度,但却有着过度的高频解析度。





图5 :有1280个座位的多功能大厅的脉冲响应中直达声的频率响应。该响应是使用8192 点FFT来计算的(其等于8192/48000或〜 107毫秒)。正如你所见的一般该频率响应显示的低频比短时间窗内的低频更明显。

通过研究这些绘图可以让你得出以下这样一个结论,那就是要让测量本身紧密联系我们的聆听体验,我们要使用非常短的时间窗在高频上隔离直达声,并在要观察低频时增加长时间窗。乍一看这个想法似乎有悖于我们常提到的一句话“只能通过处理来改变直达声。”然而事实并非如此。在中低和低频上,音响本身和房间的相互作用可以通过信号处理被改变和优化。换句话说,在低频上(长波长),直达声和来自附近平面的反射相结合形成了一个复合式响应。而正是这种响应使我们能够进行聆听。

通过同时测量几个时间窗可以提供了一个有关于人们聆听及深入理解信号是如何被输送到扬声器过程的测量结果,以更适合的(通过均衡器,或其他处理)来优化扬声器/房间的相互作用。

我们以前的数据显示,对扬声器系统的测量结果包括多种时间窗以及有强度和 “系统”相位响应的显示。

结论

使用多个时间窗时,可以让其中一个时间窗在高频工作环境下隔离出扬声器的直达声。然而,在低频的情况下则要使用长时间窗,它包括有关联着我们聆听感受的扬声器/房间的相互作用。在单个测量中使用多个时间窗是一种用来测量、优化房间中音响系统响应的有趣方式。

 

Link: http://www.audiosos.net/portal.php?mod=view&aid=292

 

posted on 2013-10-01 16:22  liupin  阅读(2990)  评论(1编辑  收藏  举报

-->