2025 年 4月 22 日随笔档案 - 爱露查

2025年4月22日

摘要：语音合成任务分类：语音转换，文本-语音转换，语音生成声音转换：训练：语音分析，特征提取->特征匹配DTW->特征映射推理：语音分析，特征提取->特征转换->声码器声码器：将语音和特征相互转换，常用World，STRAIGHT，Griffin-Lim 特征：F0基频特征（一维），Mel-ce 阅读全文

posted @ 2025-04-22 20:31 爱露查阅读(222) 评论(0) 推荐(0)

语音信号的预处理与特征提取

摘要：信号预处理：（1）静音消除（去除前后两端的静音）： librosa.effects.trim(y,*,top_db=60,ref=<function amax>,frame_length=2048,hop_length=512,aggregate=,function amax>) top_db:阈阅读全文

posted @ 2025-04-22 08:06 爱露查阅读(88) 评论(0) 推荐(0)

语音信号的读取与显示

摘要：语音信号的格式： WAV,PCM,MP3,m4a,ATFF等最常用的是WAV 语音信号读取工具： Python：scipy.io,wave,pyaudio,audioread,soundfile,librosa 基本上读取方法都只支持wav，想读取其他格式需要结合ffmpeg(www.gyan.d 阅读全文

posted @ 2025-04-22 07:20 爱露查阅读(25) 评论(0) 推荐(0)

LXZLoo

公告