语音信号的读取与显示

语音信号的格式:

  WAV,PCM,MP3,m4a,ATFF等

  最常用的是WAV

语音信号读取工具:

  Python:scipy.io,wave,pyaudio,audioread,soundfile,librosa

  基本上读取方法都只支持wav,想读取其他格式需要结合ffmpeg(www.gyan.dev/ffmpeg/builds,需要添加环境变量)

  命令librosa.load(path,*,sr=22050,mono=True,offset=0.0,duration=None,dtype=<class'numpy.float32'>,res_type='soxr_hp')

    path:文件名

    sr:采样率

    mono:单通道

    offset:开始时间(s)

    duration:持续时间(s)

波形显示:

  利用plt或者librosa.display.waveshow

  

 

posted @ 2025-04-22 07:20  爱露查  阅读(17)  评论(0)    收藏  举报