详细介绍:Ubuntu服务器安装fish-speech本地语音部署教程

Fish Speech 目前最新版本是 V1.5(信息更新至2025年2月)。它是一款功能强大、支撑多语言文本转语音(TTS)模型,尤其在语音克隆方面表现出色,并提供了便捷的本地部署方案。

下面表格汇总了它的主要特性:

特性维度说明
核心定位高质量、多语言的生成式语音合成,擅长零样本/少样本语音克隆
技术架构采用基于LLM(大语言模型)的生成式办法,整合了VQ-GAN、Llama架构以及DualAR双自回归Transformer设计
多语言支持支持13种语言(如中、英、日、韩、法、德、西等),训练素材超100万小时
语音克隆零样本
posted @ 2025-09-20 21:29  ycfenxi  阅读(34)  评论(0)    收藏  举报