特定声音识别检测模块详解

需求解析

对于养宠物的人来说，识别宠物的叫声并根据它的叫声来判断是否出现了异常。宠物叫声一般都比较单一，难度相对较低，准确性有保障。

病人健康检测：通过声音识别，可以检测出人夜晚打呼噜的声音，可以检测出夜晚说梦话的声音，并把这些声音录下来，用作健康预警和疾病诊疗使用。

机器的异常检测：很多机器转动运转过程中都会发出声音。出问题之后一般会发出不一样的特定频段的声音。很多设备故障检测设备，都是根据检测特定声音来判断设备的故障信息的。

算法解析

特定声音检测，首先离不开vad检测，vad检测能检测出是否有声音存在，并可以判断出声音持续的时间。

其次，这里离不开fft福利也变换，变换后的频域信息可以看出不少有价值的信息了。很多机器出故障了都会发出特定频谱的声音，从这里就比较容易区分了。

MFCC系数：梅尔频率倒谱系数(MFCC)通过与声音内容密切相关的13个特殊频率所对应的能量分布，可以使用梅尔频率倒谱系数矩阵作为语音识别的特征。基于隐马尔科夫模型进行模式识别，找到测试样本最匹配的声音模型，从而识别语音内容。

CNN：随着神经网络的飞速发展，做技术不加一些神经网络的东西在，人们都认为你这技术不高级了。算力比较小的芯片，只能加一些算是锦上添花了。

技术特色

音频采集距离远：通过搭载定制的咪头，采集距离可达10米的以上。

工作功耗低：工作功耗控制在2ma左右，待机功耗可达ua级别。

接口丰富：数据可通过串口或者GPIO接口输出效果，接口简单，协议明晰，方便对接和测试。

算法灵活：根据不同的场景需求来适配不同的算法。

posted on 2022-06-14 18:22 虚生阅读(522) 评论(0) 编辑收藏举报

刷新页面返回顶部

公告