随笔档案「2018年4月」 - cpuimage

音频自动增益与静音检测算法附完整C代码

摘要：前面分享过一个算法《音频增益响度分析 ReplayGain 附完整C代码示例》主要用于评估一定长度音频的音量强度，而分析之后，很多类似的需求，肯定是做音频增益，提高音量诸如此类做法。不过在项目实测的时候，其实真的很难定标准，到底在什么样的环境下，要增大音量，还是降低。在通讯行业一般的做法就阅读全文

posted @ 2018-04-22 18:04 cpuimage 阅读(8816) 评论(3) 推荐(2)

音频降噪算法附完整C代码

摘要：降噪是音频图像算法中的必不可少的。目的肯定是让图片或语音更加自然平滑，简而言之，美化。图像算法和音频算法都有其共通点。图像是偏向空间处理，例如图片中的某个区域。图像很多时候是以二维数据为主，矩形数据分布。音频更偏向时间处理，例如语音中的某段时长。音频一般是一维数据为主，单声道阅读全文

posted @ 2018-04-22 10:25 cpuimage 阅读(27919) 评论(6) 推荐(9)

WebRTC 音频采样算法附完整C++示例代码

摘要：之前有大概介绍了音频采样相关的思路，详情见《简洁明了的插值音频重采样算法例子 (附完整C代码)》。音频方面的开源项目很多很多。最知名的莫过于谷歌开源的WebRTC, 其中的音频模块就包含有 AGC自动增益补偿(Automatic Gain Control)自动调麦克风的收音量，使与会者收到一定的阅读全文

posted @ 2018-04-19 22:44 cpuimage 阅读(9152) 评论(8) 推荐(2)

音频压缩编码 opus 附完整C++代码示例

摘要：绝大数人都知道mp3格式编码，以及aac,amr等压缩格式编码。而在语音通信界有一个强悍的音频格式编码opus. 经过实测，压缩比最高可以达到1:10。 100KB 压缩后 10KB 虽然是有损压缩，但是根据实际对比试听，几乎听不出差别。而且还原度还比mp3高，压缩比也比mp3高。用来压缩阅读全文

posted @ 2018-04-18 23:17 cpuimage 阅读(11784) 评论(5) 推荐(1)

音频增益响度分析 ReplayGain 附完整C代码示例

摘要：人们所熟知的图像方面的3A算法有： AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了使感光器件获得合适的曝光量 AW自动白平衡(Automatic White Balance)白平衡的阅读全文

posted @ 2018-04-15 13:00 cpuimage 阅读(5210) 评论(0) 推荐(2)

基于RNN的音频降噪算法 (附完整C代码)

摘要：前几天无意间看到一个项目rnnoise。项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法。采用的是 GRU/LSTM 模型。阅读下训练代码，可惜的是作者没有提供数据训练集。不过基本可以断定他采用的数据集里，肯定有urbansound8k。阅读全文

posted @ 2018-04-07 16:47 cpuimage 阅读(14693) 评论(2) 推荐(3)

cpuimage

本人专注于音频图像算法以及软件安全的实现与优化。

04 2018 档案

公告