音视频基础(三)音频编码原理
音频编码
原始音频数据在传输过程中,占用带宽过大,所以为了方便传输,需要对音频进行编码压缩
有损压缩
消除冗余信息,即消除人的听觉范围之外的信息,以及被遮蔽的信息,这种方式压缩后,音频数据无法再还原成原始状态
信号遮蔽分为频域遮蔽与时域遮蔽
无损压缩
经过消除冗余信息之后,再使用压缩算法,对于音频数据进行无损压缩编码,无损压缩后的数据经过解码后,可以完全恢复
频域遮蔽效应
相近频率的声音,声音强度高的声音会把强度低的声音遮蔽

时域遮蔽效应
相近时间的声音,声音强度高的声音会把强度低的声音遮蔽

熵编码(无损编码)
哈夫曼编码:用0、1、2等小数字代表字符,数据频率越高,编码越小,数据频率越低,编码越大
算数编码:通过二进制小数进行编码
香农编码:。。。
哈夫曼编码

音频编码过程

常见音频编解码器
包含OUPS、AAC、Ogg、Speex、iLBC、AMR、G.711等
AAC在直播系统中使用的比较广泛,OUPS是比较新的编码器,WebRTC默认使用OUPS,固话一般使用G.711
从效果来看,OUPS > AAC > Ogg


AAC编解码器
AAC编码器集成了MPEG-4标准新特性,加入了SBR和PS技术,目前常用AAC规格有AAC LC、AAC HE V1、AAC HE V2

AAC LC
AAC Low Complexity 低复杂度规格,码流是128k,音质好
AAC HE V1
AAC LC + SBR(Spectral Band Replication) ,其核心思想是按频谱分开保存,低频编码保存主要成分,高频单独放大编码保存音质,码流在64k左右
AAC HE V2
AAC LC + SBR + PS(Parametric Stereo),其核心思想是双声道中的声音存在某种相似性,只存储一个声道的全部信息,然后用很少的字节描述另一个声道和它不同的地方
AAC格式
ADIF(Audio Data Interchange Format),格式的特征是可以确定的找到音频数据的开始,只能从头开始解码,不能从音频数据流中间开始,这种格式通常用于磁盘文件中
ADTS(Audio Data Transport System),特征是每一帧都有一个同步字,所以可以在音频流的任何位置开始解码,它类似于数据流格式
ADTS格式



Ffmpeg生成AAC




浙公网安备 33010602011771号