还在花钱转语音?10,000+ star 开源「ebook2audiobook」白嫖1107种语言!免费文字秒变多语言音频!
嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万+技术人共享升级秘籍!


ebook2audiobook是一款由 Drew Thomasson 主导、13 k+ Stars(约 9683 ⭐)的开源利器,可实现电子书 (EPUB、PDF、MOBI、TXT…) → 有声书 (.m4b/.mp3) 的无缝转换,支持章节保留、元数据写入、1107+ 语言、TTS 引擎切换、语音克隆等高阶功能
痛点场景
-
阅读疲劳:长时间盯屏眼睛痛,换成听书更轻松。 -
通勤学习:早晚地铁公交,想把书“听”下去。 -
语言学习:多语言版本支持,让听力训练更便捷。 -
个人品牌:内容创作者可用自定义语音输出品牌专属“播报腔”。
核心功能
| 功能 | 描述 | 优势 |
|---|---|---|
| 章节拆分 | 自动识别 ebook 章节并生成对应音频片段 | 导航清晰,支持 m4b 弹跳 |
| 多 TTS 引擎支持 | XTTSv2、Bark、Fairseq、Piper、Tacotron2、YourTTS 等 | 可根据语言及场景选最优模型 |
| 1107+ 语言 | 包括中文、阿拉伯语、日语、韩语… | 语言覆盖全面 |
| 可选语音克隆 | 输入个人音频即可克隆声音 | 个性化定制,品牌调性更统一 |
| 轻量资源占用 | 最低 4 GB 内存即可运行 | 低门槛部署 |
| Web GUI 支持 | Gradio 基础的可视化操作界面 | 简单易用,零命令迷茫 |
| Docker 容器部署 | 支持容器化、本地/云端快速部署 | 一键运行,无需环境配置 |
| 元数据 & 格式输出 | 支持 .m4b、.mp3,写入封面、章节、作者等信息 | 专业听书体验 |
| Colab / HF Spaces 等 | 支持免费资源运行与演示 | 云端体验快人一步 |
技术架构
-
预处理:Calibre 抽取文本并自动分章; -
合成层:用户选择 TTS 引擎,可选个人语音; -
生成阶段:Coqui‑TTS 等生成音频,FFmpeg 合并并写入 metadata; -
工程优势:4 GB 起即可部署,支持 CPU/GPU,以及本地或容器化部署 。
界面展示
-
主界面上传区:一键上传 ebook/声音文件,选择模型、语言与音量等参数; -
参数调节区域:Temperature、Length Penalty、Speed、Top‑k 等滑条可视化调整; -
进度条 & 播放区:实时显示合成进度,可试听或下载音频; -
语言下拉菜单:1107+ 语言任你选,满足多语场景需求。
使用示例
一、Web GUI 使用方法
git clone https://github.com/DrewThomasson/ebook2audiobook
cd ebook2audiobook
pip install -r requirements.txt
python app.py
# 浏览器打开提示的地址,上传 ebook,选择语言 + 模型,点击 “Convert”
二、命令行(无界面运行)
python app.py \
--headless \
--ebook path/to/book.epub \
--language zh-cn \
--tts_engine XTTSv2 \
--output_format m4b
三、Docker 部署
docker run -it --rm -p 7861:7861 drewthomasson/ebook2audiobook:latest
# 打开浏览器访问 http://localhost:7861
四、语音克隆实战
-
Step1:录一段你自己的语音: myvoice.wav -
Step2:命令运行:
python app.py \
--ebook mybook.pdf \
--voice myvoice.wav \
--language en \
--tts_engine YOURTTS
生成个性化听书,品牌调性突出。
应用场景
-
上班族/学生:通勤时听电子书,缓解眼疲劳; -
语言学习者:反复听目标语言版本,提高语感; -
内容创作者:制作有声版文章,用自定义声音输出; -
视障人士:将生活必读材料转为听书,增进信息获取; -
知识付费补充:文字教学课稿自动朗读,省时省力。
同类项目
| 项目 | 语言数 | GUI 支持 | 语音克隆 | 依赖资源 | 优势 |
|---|---|---|---|---|---|
| ebook2audiobook | 1107+ | ✅ Gradio/Docker | ✅ | Calibre + TTS + FFmpeg | 功能最齐全、支持语音克隆、轻量资源 |
| ebook2audiobookSTYLETTS2 | ~30+ | ✅ | ✅ | StyleTTS2 | 架构更聚焦,语音更自然 |
| ebook2audiobook‑piper‑tts | 多语支持 | ✅ Docker | ❌ | Piper + Calibre | 安装简单,偏基础 |
| 其他如 storybook TTS 工具 | 少量语言 | ❌ | ❌ | 各不相同 | 门槛低,但功能逊色 |
总结
ebook2audiobook 是目前开源界最强、语言支持最全、功能最丰富的电子书 to 有声书转换工具。低门槛部署、高度可定制、适合多场景使用。无论是自用听书,还是内容创作转音频,它都能解放你的双眼、释放你的时间。




浙公网安备 33010602011771号