音视频基础（三）音频编码原理

音频编码
原始音频数据在传输过程中，占用带宽过大，所以为了方便传输，需要对音频进行编码压缩

有损压缩
消除冗余信息，即消除人的听觉范围之外的信息，以及被遮蔽的信息，这种方式压缩后，音频数据无法再还原成原始状态

信号遮蔽分为频域遮蔽与时域遮蔽

无损压缩
经过消除冗余信息之后，再使用压缩算法，对于音频数据进行无损压缩编码，无损压缩后的数据经过解码后，可以完全恢复

频域遮蔽效应
相近频率的声音，声音强度高的声音会把强度低的声音遮蔽

时域遮蔽效应
相近时间的声音，声音强度高的声音会把强度低的声音遮蔽

熵编码（无损编码）
哈夫曼编码：用0、1、2等小数字代表字符，数据频率越高，编码越小，数据频率越低，编码越大
算数编码：通过二进制小数进行编码
香农编码：。。。

哈夫曼编码

音频编码过程

常见音频编解码器
包含OUPS、AAC、Ogg、Speex、iLBC、AMR、G.711等
AAC在直播系统中使用的比较广泛，OUPS是比较新的编码器，WebRTC默认使用OUPS，固话一般使用G.711
从效果来看，OUPS > AAC > Ogg

AAC编解码器
AAC编码器集成了MPEG-4标准新特性，加入了SBR和PS技术，目前常用AAC规格有AAC LC、AAC HE V1、AAC HE V2

AAC LC
AAC Low Complexity 低复杂度规格，码流是128k，音质好

AAC HE V1
AAC LC + SBR(Spectral Band Replication) ，其核心思想是按频谱分开保存，低频编码保存主要成分，高频单独放大编码保存音质，码流在64k左右

AAC HE V2
AAC LC + SBR + PS(Parametric Stereo)，其核心思想是双声道中的声音存在某种相似性，只存储一个声道的全部信息，然后用很少的字节描述另一个声道和它不同的地方

AAC格式
ADIF(Audio Data Interchange Format)，格式的特征是可以确定的找到音频数据的开始，只能从头开始解码，不能从音频数据流中间开始，这种格式通常用于磁盘文件中
ADTS(Audio Data Transport System)，特征是每一帧都有一个同步字，所以可以在音频流的任何位置开始解码，它类似于数据流格式

ADTS格式

Ffmpeg生成AAC

posted @ 2022-05-11 15:27 金元宝骑骑阅读(816) 评论(0) 收藏举报

刷新页面返回顶部

QiQi.

音视频基础（三）音频编码原理

公告