OTTSHelper V1.0.3 在线TTS助手
前言:
以前分享过一个软件PPTAutoPlay,其主要功能之一是生成具有自动语音朗读并全自动播放的PPT。后来有朋友不满足于用本机语音库生成朗读的音频,提出能否调用第三方API实现TTS生成朗读的音频。我搜索了一下,网上有一些在线TTS网站,其特点:语音库丰富,生成的朗读音频自然流畅,部分支持克隆人声,但大部分收费或有限制。也有一些可本地部署,其特点是安全、保密、快捷,但体积庞大、对电脑性能要求较高。最终在微软商店中找到一个免费的软件(网站),其特点是联网获取TTS音频较方便,但受制于网站速度、不提供批量的功能。于是在PPTAutoPlay中添加了自动调用在线TTS网站获取TTS的音频的功能,一直担心此网站能否持久免费支持在线TTS,后来又找到了使用Python的edge-tts模块获取TTS音频的方法,于是就将此功能加入到了软件中。目前,原先调用的在线TTS网站有时会出现无法访问,好在edge-tts一直能正常使用。现将此功能提取出来成为独立的OTTSHelper.exe:支持通过在线网站或edge-tts获取TTS音频。
既然使用在线TTS网站和Python的edge-tts就能正常利用微软 Edge 浏览器的在线语音合成服务,为何还要这个在线TTS助手(OTTSHelper)?这是因为微软在线语音合成服务限制每次3000字符以内,故无法直接实现长文本的TTS,通过OTTSHelper就能自动分割长文本获取TTS的音频,然后自动合并而实现超过3000字符长文本的TTS;另外,OTTSHelper可用于全自动生成含有朗读音频并全自动播放的PPT。
软件简介:
OTTSHelper是在线TTS工具,调用在线TTS网站(有时会失效)或Python的edge-tts获取TTS的音频,支持超过3000字符的长文本,可用于生成含有朗读音频并全自动播放的PPT。本软件仅供个人免费使用,禁止商用。

运行前的准备:
1,需要安装VB6运行库:本程序由VB6编写,需要VB6运行库支持。如果无法正常运行软件,通常是缺少运行库或控件,请运行主程序所在路径的SETUP文件夹中的Setup.exe进行安装。安装方法详见SETUP文件夹下readme.txt中的说明。
注意:①win7以上,需以管理员身份运行安装文件!②绝不能将setup文件夹放在有空格的路径中,存放该文件夹名字不能有特殊符号如●号。
2,需要安装Python及edge-tts: 当调用Python的edge-tts获取TTS的音频时,必须安装Python及edge-tts模块(调用在线TTS网站获取TTS的音频时无需安装)。
要求 ①Python环境:确保你的系统上已经安装了 Python 3.9 或更高版本。②pip工具:pip是Python的包管理工具,通常随 Python 一起安装。需通过 pip 安装edge-tts。
提示:①最新版Python下载地址:Download Python | Python.org。②如果安装python失败,请参考:win服务器安装python提示0x80070659系统策略禁止这个安装,请与管理员联系-CSDN博客及下载视频操作_disableuserinstalls的值在哪里修改-CSDN博客。③如果安装了多个版本的Python,系统默认仍是老版本,请参考:解决Python升级后CMD仍显示旧版本:环境变量优先级问题详解_安装高版本python后查看版本依然是老版本-CSDN博客及windows下环境变量配置后没生效,不重启电脑的解决办法 - 代码先锋网。
2.1 通过 pip 安装edge-tts模块:以管理员身份运行Windows PowerShell,输入:pip install edge-tts 回车,耐心等待(需要下载文件)安装结束。
2.2 通过本软件安装edge-tts模块:以管理员身份运行软件,然后在程序中右击工具栏"edge-tts"按钮进行安装(原理同上)。
注:Edge-TTS 是一个 Python 库,利用微软 Edge 浏览器的在线语音合成服务,将文本转换为语音。它支持多种语言和声音,并且可以生成高质量的音频文件。其核心特点:①多语言支持:支持多种语言和声音(如英语、中文、日语等)。②高质量语音:基于微软的语音合成引擎,语音自然流畅。③简单易用:API 设计简洁,易于集成到项目中。④在线服务:依赖微软的在线服务,无需本地模型。但在线服务易受网速波动影响,语音合成的实时性没有保障。edge-tts项目地址:https://github.com/rany2/edge-tts
3,需要安装WindowsMediaPlayer:通常Windows系统自带,用于播放音频。
4,关于ffmpeg.exe:为了实现更好的音频合并效果(用于超过3000字符长文本的TTS),请将ffmpeg.exe存放于主程序所在目录中。
注:FFmpeg.exe是一款视频格式转换工具软件,通过命令行参数实现音视频处理。下载地址:https://ffmpeg.org/download.html。编译后文件下载列表:https://www.gyan.dev/ffmpeg/builds/,直接下载链接:ffmpeg-git-essentials.7z或 ffmpeg-git-full.7z。
5,需要安装PowerPoint:若要生成含有朗读音频并全自动播放的PPT,需要安装PowerPoint(建议安装较新版本)。
6,需要联网。
使用方法:
1, 内附简要使用说明:OTTSHelper.rtf
1.1 ,必要的设置:运行软件后,首先进行必要的设置,首先要确定获取TTS音频的方法,若未安装Python及edge-tts,就不要选中工具栏"edge-tts"按钮,此时通过在线TTS网站获取TTS音频;若此网站失效,就必须选中工具栏"edge-tts"按钮,也就是说,必须安装Python及edge-tts。其它重要设置如:①选择TTS的语言。②然后选择使用的语音。③根据个人习惯设置语速。④根据个人爱好设置音调。⑤还可以设置朗读的音量。⑥设置每次处理文本的长度(edge-tts最大长度限制为3000字符, 程序通过自动分割长文本获取TTS的音频然后自动合并而实现超过3000字符长文本的TTS)。
注:①语速、音调、音量、长度限制等通常使用默认值即可。②这些设置退出程序时会自动保存在主程序所在路径的"OTTSHelper.ini"文件中,下次重启程序时会自动读取上次使用的设置。③点击工具栏"恢复默认设置"按钮,可恢复至程序默认的设置。④右击工具栏"恢复默认设置"按钮可重新导入上次退出程序时保存的设置。
1.2,试听:点击工具栏"生成试听音频" 按钮,可获取并播放试听音频,朗读文本为文本框中的内容。
注:①当文本框中有选中的内容时,朗读的内容即为选中的内容。②试听的文本不超过50个字符(超过50字符时程序自动截取)。③右击工具栏"生成试听音频" 按钮可播放本地音频。
1.3,下载音频:点击工具栏"直接下载朗读音频"按钮,可直接下载并播放TTS的音频,朗读文本为文本框中的内容。
注:①当文本框中有选中的内容时,朗读的内容即为选中的内容。②当文本长度超过"长度限制"时,程序自动分割文本获取朗读音频,如果选中工具栏"自动合并音频"按钮,最终自动合并生成单个音频文件(如果主程序所在目录中有ffmpeg.exe文件,将自动删除首尾静音、有助于提升音频合并的效果)。③右击工具栏"直接下载朗读音频" 按钮可打开本地文本文件。
1.4,文本文件转音频:点击工具栏"文本转音频"按钮,可选择文本文件进行TTS,支持多选。右击工具栏"文本转音频"按钮,可选择文件夹中的所有文本文件进行TTS。右击+Shift/Ctrl工具栏"文本转音频"按钮:多选文本文件/文件夹中的所有文本文件,以空行分割文本并进行TTS。
注:①当文本长度超过"长度限制"时,程序自动分割文本获取朗读音频,最终自动合并生成单个音频文件(如果主程序所在目录中有ffmpeg.exe文件,将自动删除首尾静音、有助于提升音频合并的效果)。②批量操作时,若要停止,请点击工具栏"停止操作"按钮。
1.5,生成含朗读音频的PPT:点击工具栏"生成含有朗读音频的PPT"按钮,可选择PPT文件(支持多选),对朗读内容(备注/显示内容)进行TTS,将音频文件插入PPT中并全自动播放。右击工具栏"生成含有朗读音频的PPT"按钮,可选择文件夹中的所有PPT文件生成含有朗读音频的PPT。
注:①当朗读文本长度超过"长度限制"时,程序自动分割文本获取朗读音频,最终自动合并生成单个音频文件插入PPT中(如果主程序所在目录中有ffmpeg.exe文件,将自动删除首尾静音、有助于提升音频合并的效果)。②批量操作时,若要停止,请点击工具栏"停止操作"按钮。
1.6,合并音频:右击工具栏"自动合并音频"按钮,将多个mp3文件合并为单个mp3文件。当选中工具栏"合并音频"按钮时,如果主程序所在目录中有ffmpeg.exe文件,将自动删除待合并mp3文件中首尾静音、有助于提升音频合并的效果。Ctrl+右击工具栏"自动合并音频"按钮,多选音频文件(mp3/wav)进行删除首尾静音的操作(需要ffmpeg.exe文件并做好音频源的备份工作)。
1.7,更新语言、语音信息:点击工具栏"更新语言、语音信息"按钮,自动更新语言、语音信息(需联网)。
注:①旧版程序启动时,会自动更新语言、语音信息(需联网),新版程序为了加快启动速度,不再每次启动时自动更新语言、语音信息。
2,在线教程:参考:在线TTS助手-OTTSHelper安装及使用方法
下载地址:
OTTSHelper_v1.0.3.rar下载地址: https://wwas.lanzouu.com/iqFj3372b7wd 密码:XLYY

浙公网安备 33010602011771号