audioFluxLab - 博客园

2023年4月25日

摘要：

介绍音频信号处理在各种应用中都发挥着重要的作用，如语音识别、音乐信息检索、语音合成等。其中，Mel频谱是一种常用的频域特征表示方法，用于描述人类听觉系统对频率的敏感程度。在深度学习音频领域，mel频谱是最常用的音频特征。在本文中，我们将对四个常用的音频处理库——audioflux、torchau 阅读全文

posted @ 2023-04-25 14:53 audioFluxLab 阅读(243) 评论(0) 推荐(0) 编辑

2023年4月11日

这个小项目，上周被国外 AI 新闻网站报道，前些天又上了 github 热榜

摘要：疫情期间在校花了几个月时间，写了这个小项目，是关于音频特征提取和分析的，自己是 AI 专业研究音频的，但受限于对音频特征的理解，做研究时总感觉缺乏“底料”，所以当做是学习练手做了这个小东西。因为是学习练手的小项目，放 github 上面后就没有太多跟进了，后来看到国内几个有名的 github 项目阅读全文

posted @ 2023-04-11 07:08 audioFluxLab 阅读(95) 评论(0) 推荐(0) 编辑

2023年4月10日

开源项目audioFlux: 针对音频领域的深度学习工具库

摘要： (目录) audioFlux是一个Python和C实现的库，提供音频领域系统、全面、多维度的特征提取与组合，结合各种深度学习网络模型，进行音频领域的业务研发，下面从时频变换、频谱重排、倒谱系数、解卷积、谱特征、音乐信息检索六个方面简单阐述其相关功能。项目地址: https://github.com 阅读全文

posted @ 2023-04-10 11:13 audioFluxLab 阅读(392) 评论(0) 推荐(2) 编辑

CMLab

公告