摘要:
梅尔倒频谱系数(MFCC,Mel Frequency Cepstral Coefficents)在人声领域(语音识别,说话人辨认)等领域应用广泛。 这个文章留下学习倒谱与梅尔频率的痕迹。 频谱 声音是一维时域信号。为了分析声音的频域规律,就要用到傅里叶变换,将信号从时域转换到频域。但频域信号失去了时 阅读全文
posted @ 2024-01-08 20:09
倒地
阅读(411)
评论(0)
推荐(0)
摘要:
深度可分离卷积,使用了一些 trick 极大减少卷积所需参数量和计算量。 理解深度可分离卷积 若需要对 12×12×3 的输入使用卷积,获得 8×8×256 的输出,直接的卷积方法是使用 256 个 5×5×3 的卷积核(无 padding、步长为 1,下同)。此时卷积层的参数量为 19200,卷积 阅读全文
posted @ 2024-01-08 20:06
倒地
阅读(258)
评论(0)
推荐(0)

浙公网安备 33010602011771号