摘要: 语音合成任务分类: 语音转换,文本-语音转换,语音生成 声音转换: 训练:语音分析,特征提取->特征匹配DTW->特征映射 推理:语音分析,特征提取->特征转换->声码器 声码器:将语音和特征相互转换,常用World,STRAIGHT,Griffin-Lim 特征:F0基频特征(一维),Mel-ce 阅读全文
posted @ 2025-04-22 20:31 爱露查 阅读(195) 评论(0) 推荐(0)
摘要: 信号预处理: (1)静音消除(去除前后两端的静音): librosa.effects.trim(y,*,top_db=60,ref=<function amax>,frame_length=2048,hop_length=512,aggregate=,function amax>) top_db:阈 阅读全文
posted @ 2025-04-22 08:06 爱露查 阅读(68) 评论(0) 推荐(0)
摘要: 语音信号的格式: WAV,PCM,MP3,m4a,ATFF等 最常用的是WAV 语音信号读取工具: Python:scipy.io,wave,pyaudio,audioread,soundfile,librosa 基本上读取方法都只支持wav,想读取其他格式需要结合ffmpeg(www.gyan.d 阅读全文
posted @ 2025-04-22 07:20 爱露查 阅读(17) 评论(0) 推荐(0)