随笔分类 - 语音相关
语音内容
摘要:大家好,非常感谢关注到该博客园,由于个人原因,后期主要将知乎作为写作和记录平台,感兴趣的请移步到 个人知乎 有问题可以在那边提问,谢谢!
阅读全文
摘要:一句话说明:AE简单来说就是encode先压缩真实样本成一个隐变量(一般用z表示),在逆向decode还原生真实样本通大小的新样本。调整中间参数,使得前后样本尽量相似或相同,这样中间隐变量就能展现原来样本的特征了。VAE在此基础上,生成Z前,添加方差(即噪音),构成一个分布式结构,其它基本与AE相同
阅读全文
摘要:目录 简介 Fbank处理过程 MFCC fbank与mfcc的标准化 fbank与mfcc的比较 一、简介 Fbank:FilterBank:人耳对声音频谱的响应是非线性的,Fbank就是一种前端处理算法,以类似于人耳的方式对音频进行处理,可以提高语音识别的性能。获得语音信号的fbank特征的一般
阅读全文

浙公网安备 33010602011771号