摘要: 最近使用Cursor开发了一个音视频翻译工具。 这是一个基于人工智能技术的多语言音视频翻译系统,能够将视频或音频内容从一种语言翻译成另一种语言,并通过音色克隆技术保持原说话者的声音特征。 Demo 核心技术栈 Faster-Whisper:语音识别引擎 Demucs:音频分离模型 PyAnnote: 阅读全文
posted @ 2025-11-17 13:32 icuic 阅读(25) 评论(0) 推荐(0)