- Audio Seed:68993228(推荐数字人-girl.pt模型) - Text Seed:42(调节语气自然度) - 语速设置:1.0x(标准语速)
python train.py \ --audio_path ./your_voice.wav \ --model_path ./cosyvoice_model \ --epoch 50
- 视频质量:Enhanced(增强模式) - 分辨率:full resolution - 模型选择:Wav2Lip_GAN(解决牙齿缺失问题) - 唇部mask羽化值:2(边缘平滑处理)
python inference.py \ --video_path ./digital_human.mp4 \ --audio_path ./question_audio.wav \ --output_path ./final_result.mp4