音视频基础(三)音频编码原理

音频编码
原始音频数据在传输过程中,占用带宽过大,所以为了方便传输,需要对音频进行编码压缩

有损压缩
消除冗余信息,即消除人的听觉范围之外的信息,以及被遮蔽的信息,这种方式压缩后,音频数据无法再还原成原始状态

信号遮蔽分为频域遮蔽与时域遮蔽

无损压缩
经过消除冗余信息之后,再使用压缩算法,对于音频数据进行无损压缩编码,无损压缩后的数据经过解码后,可以完全恢复

频域遮蔽效应
相近频率的声音,声音强度高的声音会把强度低的声音遮蔽
image

时域遮蔽效应
相近时间的声音,声音强度高的声音会把强度低的声音遮蔽
image

熵编码(无损编码)
哈夫曼编码:用0、1、2等小数字代表字符,数据频率越高,编码越小,数据频率越低,编码越大
算数编码:通过二进制小数进行编码
香农编码:。。。

哈夫曼编码
image

音频编码过程
image

常见音频编解码器
包含OUPS、AAC、Ogg、Speex、iLBC、AMR、G.711等
AAC在直播系统中使用的比较广泛,OUPS是比较新的编码器,WebRTC默认使用OUPS,固话一般使用G.711
从效果来看,OUPS > AAC > Ogg
image

image

AAC编解码器
AAC编码器集成了MPEG-4标准新特性,加入了SBR和PS技术,目前常用AAC规格有AAC LC、AAC HE V1、AAC HE V2
image

AAC LC
AAC Low Complexity 低复杂度规格,码流是128k,音质好

AAC HE V1
AAC LC + SBR(Spectral Band Replication) ,其核心思想是按频谱分开保存,低频编码保存主要成分,高频单独放大编码保存音质,码流在64k左右

AAC HE V2
AAC LC + SBR + PS(Parametric Stereo),其核心思想是双声道中的声音存在某种相似性,只存储一个声道的全部信息,然后用很少的字节描述另一个声道和它不同的地方

AAC格式
ADIF(Audio Data Interchange Format),格式的特征是可以确定的找到音频数据的开始,只能从头开始解码,不能从音频数据流中间开始,这种格式通常用于磁盘文件中
ADTS(Audio Data Transport System),特征是每一帧都有一个同步字,所以可以在音频流的任何位置开始解码,它类似于数据流格式

ADTS格式
image

image

image

Ffmpeg生成AAC

image

image

image

posted @ 2022-05-11 15:27  金元宝骑骑  阅读(816)  评论(0)    收藏  举报