语音信号的读取与显示

语音信号的格式：

WAV,PCM,MP3,m4a,ATFF等

最常用的是WAV

语音信号读取工具：

Python：scipy.io,wave,pyaudio,audioread,soundfile,librosa

基本上读取方法都只支持wav，想读取其他格式需要结合ffmpeg(www.gyan.dev/ffmpeg/builds，需要添加环境变量)

命令librosa.load(path,*,sr=22050,mono=True,offset=0.0,duration=None,dtype=<class'numpy.float32'>,res_type='soxr_hp')

path:文件名

sr:采样率

mono:单通道

offset:开始时间（s）

duration:持续时间（s）

波形显示：

利用plt或者librosa.display.waveshow

posted @ 2025-04-22 07:20 爱露查阅读(25) 评论(0) 收藏举报

刷新页面返回顶部

LXZLoo