随笔分类 -  语音相关

语音内容
摘要:大家好,非常感谢关注到该博客园,由于个人原因,后期主要将知乎作为写作和记录平台,感兴趣的请移步到 个人知乎 有问题可以在那边提问,谢谢! 阅读全文
posted @ 2022-08-02 16:39 忆凡人生 阅读(314) 评论(0) 推荐(0)
摘要:一句话说明:AE简单来说就是encode先压缩真实样本成一个隐变量(一般用z表示),在逆向decode还原生真实样本通大小的新样本。调整中间参数,使得前后样本尽量相似或相同,这样中间隐变量就能展现原来样本的特征了。VAE在此基础上,生成Z前,添加方差(即噪音),构成一个分布式结构,其它基本与AE相同 阅读全文
posted @ 2020-08-30 20:10 忆凡人生 阅读(15759) 评论(0) 推荐(3)
摘要:目录 简介 Fbank处理过程 MFCC fbank与mfcc的标准化 fbank与mfcc的比较 一、简介 Fbank:FilterBank:人耳对声音频谱的响应是非线性的,Fbank就是一种前端处理算法,以类似于人耳的方式对音频进行处理,可以提高语音识别的性能。获得语音信号的fbank特征的一般 阅读全文
posted @ 2020-08-15 22:37 忆凡人生 阅读(15848) 评论(1) 推荐(1)