摘要: 梅尔倒频谱系数(MFCC,Mel Frequency Cepstral Coefficents)在人声领域(语音识别,说话人辨认)等领域应用广泛。 这个文章留下学习倒谱与梅尔频率的痕迹。 频谱 声音是一维时域信号。为了分析声音的频域规律,就要用到傅里叶变换,将信号从时域转换到频域。但频域信号失去了时 阅读全文
posted @ 2024-01-08 20:09 倒地 阅读(411) 评论(0) 推荐(0)
摘要: 深度可分离卷积,使用了一些 trick 极大减少卷积所需参数量和计算量。 理解深度可分离卷积 若需要对 12×12×3 的输入使用卷积,获得 8×8×256 的输出,直接的卷积方法是使用 256 个 5×5×3 的卷积核(无 padding、步长为 1,下同)。此时卷积层的参数量为 19200,卷积 阅读全文
posted @ 2024-01-08 20:06 倒地 阅读(258) 评论(0) 推荐(0)