详细介绍:Ubuntu服务器安装fish-speech本地语音部署教程
Fish Speech 目前最新版本是 V1.5(信息更新至2025年2月)。它是一款功能强大、支撑多语言的文本转语音(TTS)模型,尤其在语音克隆方面表现出色,并提供了便捷的本地部署方案。
下面表格汇总了它的主要特性:
| 特性维度 | 说明 |
|---|---|
| 核心定位 | 高质量、多语言的生成式语音合成,擅长零样本/少样本语音克隆 |
| 技术架构 | 采用基于LLM(大语言模型)的生成式办法,整合了VQ-GAN、Llama架构以及DualAR双自回归Transformer设计 |
| 多语言支持 | 支持13种语言(如中、英、日、韩、法、德、西等),训练素材超100万小时 |
| 语音克隆 | 零样本 |
浙公网安备 33010602011771号