音频采样率批量转换

因为之前训练的模型采样率是22050，现在手上有采样率48000的数据，虽说调整下参数也可以，但效果不是太好，就试着转一下，用的是BZNSYP的语料库。

现有的
在这里插入图片描述
想要的

方案一

import librosa
import os
from tqdm import tqdm
l = os.listdir('F:\我的程序练习\BZNSYP\Wave')[:-1]
for i in tqdm(l):
    y, sr = librosa.load('F:\我的程序练习\BZNSYP\Wave\\'+i, sr=48000)
    y_16 = librosa.resample(y, sr, 22050)
    librosa.output.write_wav('F:\\我的程序练习\\BZNSYP\\Wave\\'+i, y_16, 22050)

可以送进去模型，但是模型识别不出来它的梅尔谱图，否决了
方案一结果
在这里插入图片描述
方案二
用sox，下载地址，下好安装，然后就在cmd里调用就好，这个应该可以，等下看看结果

for %i in (*.wav) do 
	"H:\sox\sox-14-4-2\sox.exe" %i 
	-r 22050 
	F:\我的程序练习\BZNSYP\sox\%i

方案二结果
在这里插入图片描述

posted @ 2020-05-09 20:44 赫凯阅读(97) 评论(0) 收藏举报

刷新页面返回顶部

赫凯

音频采样率批量转换

公告