语音信号的读取与显示
语音信号的格式:
WAV,PCM,MP3,m4a,ATFF等
最常用的是WAV
语音信号读取工具:
Python:scipy.io,wave,pyaudio,audioread,soundfile,librosa
基本上读取方法都只支持wav,想读取其他格式需要结合ffmpeg(www.gyan.dev/ffmpeg/builds,需要添加环境变量)
命令librosa.load(path,*,sr=22050,mono=True,offset=0.0,duration=None,dtype=<class'numpy.float32'>,res_type='soxr_hp')
path:文件名
sr:采样率
mono:单通道
offset:开始时间(s)
duration:持续时间(s)
波形显示:
利用plt或者librosa.display.waveshow

浙公网安备 33010602011771号