语音合成任务分类:
语音转换,文本-语音转换,语音生成
声音转换:
训练:语音分析,特征提取->特征匹配DTW->特征映射
推理:语音分析,特征提取->特征转换->声码器
声码器:将语音和特征相互转换,常用World,STRAIGHT,Griffin-Lim
特征:F0基频特征(一维),Mel-cepstrum梅尔倒谱(主要特征),Aperiodicity(非周期)->codeap(一维编码)
语音转换:利用DTW构建特征对