随笔分类 -  语音信号处理

摘要:声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。 通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建立音频内容和文本的对应关系,以此作为模型训练的基础。 案例:画出语音信号的波形和频率分布,(fre 阅读全文
posted @ 2019-09-20 12:28 凌逆战 阅读(9556) 评论(12) 推荐(11)
摘要:语音信号处理一般都要进行主观评价实验和客观评价实验。 主观评价:邀请测听者对语音进行测听,测听者根据语音的质量和可理解性 给出主观意见得分 客观评价:根据算法来衡量语音质量 主观听力测试可能是评估语音质量或语音清晰度最可靠的方法。但是主观评价实验受到以下限制: 需要训练有素的听众 需要消耗更多的时间 阅读全文
posted @ 2019-09-11 17:02 凌逆战 阅读(27177) 评论(11) 推荐(21)
摘要:模拟 / 数字滤波器 模拟滤波器(Analog Filter)是一种基于连续时间信号进行滤波的滤波器。它接受连续时间信号作为输入,并输出经过滤波处理后的连续时间信号。模拟滤波器通常使用电子元件(如电容、电感、电阻)来实现滤波功能。模拟滤波器广泛应用于模拟电路、音频放大器等领域。 计算模拟滤波器的频率 阅读全文
posted @ 2019-05-29 22:14 凌逆战 阅读(7653) 评论(0) 推荐(7)
摘要:数字信号 连续时间信号:在连续时间范围内定义的信号,信号的幅度可以是连续的(模拟信号),也可以是离散的 离散时间信号:时间为离散变量的信号,即独立变量时间被量化了,而幅度仍是连续变化的 数字信号:时间离散并且幅度量化的信号,如果是二进制量化,只有1,0两种模式的信号。四进制数字信号只有四种取值,以此 阅读全文
posted @ 2019-03-29 10:46 凌逆战 阅读(10250) 评论(0) 推荐(15)
摘要:语音信号的预处理 语音信号的频带范围通常是300~3400Hz,一般情况下取采样率为8kHz,本博客的部分代码采用的是已经数字化了的语音。 预加重 预加重的目的是为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。 一般通过使用一阶FIR高通数字滤波器来实现预加重,滤波器函数为: 阅读全文
posted @ 2019-02-28 20:33 凌逆战 阅读(3346) 评论(0) 推荐(2)
摘要:作者:凌逆战(转载请注明出处) 博客园地址:https://www.cnblogs.com/LXP-Never/p/10078200.html 音频信号的读写、播放及录音 python已经支持WAV格式的书写,而实时的声音输入输出需要安装pyAudio(http://people.csail.mit 阅读全文
posted @ 2018-12-17 10:19 凌逆战 阅读(35486) 评论(10) 推荐(44)