音频采样率批量转换

因为之前训练的模型采样率是22050,现在手上有采样率48000的数据,虽说调整下参数也可以,但效果不是太好,就试着转一下,用的是BZNSYP的语料库。

现有的
在这里插入图片描述
想要的
在这里插入图片描述

方案一

import librosa
import os
from tqdm import tqdm
l = os.listdir('F:\我的程序练习\BZNSYP\Wave')[:-1]
for i in tqdm(l):
    y, sr = librosa.load('F:\我的程序练习\BZNSYP\Wave\\'+i, sr=48000)
    y_16 = librosa.resample(y, sr, 22050)
    librosa.output.write_wav('F:\\我的程序练习\\BZNSYP\\Wave\\'+i, y_16, 22050)

可以送进去模型,但是模型识别不出来它的梅尔谱图,否决了
方案一结果
在这里插入图片描述
方案二
sox下载地址,下好安装,然后就在cmd里调用就好,这个应该可以,等下看看结果

for %i in (*.wav) do 
	"H:\sox\sox-14-4-2\sox.exe" %i 
	-r 22050 
	F:\我的程序练习\BZNSYP\sox\%i

方案二结果
在这里插入图片描述

posted @ 2020-05-09 20:44  赫凯  阅读(93)  评论(0)    收藏  举报