CloneTTS是一款原生文字转语音引擎工具,功能完备、运行稳定且完全免费,支持离线语音合成。其优化了底层架构,有效减少崩溃问题,既能满足普通用户日常听书需求,也适配多人有声内容创作等进阶场景。软件还提供多音色切换、跨设备配置迁移、自定义推理精度等扩展功能,操作无门槛,各类用户均可轻松使用。
1.下载安装CloneTTS,之后打开,进入主页;
2.点击右上角【⋮】,打开功能列表选择【添加音色】;
3.之后出现隐私合规声明,点击【同意并继续】;
4.进入新建克隆音色页面,首先选择参照素材;
5.既有【外部选取】,也有【录音师采音】,按需决定;
6.获取素材之后,下滑页面,设置特征参数与反注;
7.最后点击【保存并启用】,返回【音色大厅】即可查看。
情况一:某个字一直念反了或有特殊读音需求
1.在主页点击下方的【替换规则】,进入发音规则界面;
2.点击右上角【⋮】,打开功能列表,选择【新添规则】进入;
3.在对应位置纯文本或正则表达式,点击【保存配置】即可。
情况二:出现大量的多音字,导致大批量错音
1.点击下方的【服务与引擎】,进入后点击【系统级纠错大词库】;
2.跳转页面,在其中导入第三方纠错词库,完成后返回即可。
情况三:修改引擎切分长句时的停顿感
1.进入【服务与引擎】页面,点击【高阶断句正则配置】;
2.出现弹窗,用户可以输入高阶断句正则表达式进行修改;
3.还能音色编辑页调整推理步数,异常时点击【恢复系统默认】重置。
普通场景
在手机中打开【设置】,搜索【TTS 设置】,得到结果之后,将默认引擎改为CloneTTS,即可在所有支持TTS的APP中使用。
专业/多角色场景
打开软件,进入【服务与引擎】,将【本地HTTP API服务】右侧的开关打开,将带参数的接口地址,填入对应阅读软件的网络发音设置中,即可实现动态调参、多角色分配。
核心接口定义
GET http://127.0.0.1:8080/api/tts
参数说明:
text (必填): 需要被朗读的文本内容。
voice (可选): 指定要使用的发音人的 id(UUID 格式)。如果不传此参数,引擎将使用 App 内部当前选中的默认音色。
speed (可选): 播放语速,默认为 1.0。目前支持接入外部软件传来的倍速参数。
调用示例(浏览器或代码请求)
GET http://127.0.0.1:8080/api/tts?voice=d73ca9c9-c132-4a5b-9f85-825fbaa07162&speed=1.2&text=你好,这是一段测试语音。
在“开源阅读”(Legado) 中的配置变量写法
如果您想单独手动配置某个发音人,URL 的占位符可以按如下标准写:
http://127.0.0.1:8080/api/tts?voice=您的音色ID&speed={{speakSpeed / 10.0}}&text=`speakText`
更简便的做法(一键拉取全部)
在绝大多数情况下,您完全不需要手动配置上述参数!
只需要在“开源阅读”的“朗读引擎”中点击右上角菜单选择“网络导入”,填入以下集束接口地址:
http://127.0.0.1:8080/api/legado/all
开源阅读便会一键拉取并且自动配置好您 CloneTTS App 内的所有音色,开箱即用!
--新增API级多音色调用支持,实现不同角色自动匹配对应音色。
--长按多选音色,按顺序交替发音,就能获得沉浸式听书体验。
--外部应用可以直接通过URL参数动态指定发音人、调整语速。
修复了后台保存配置时可能因进程被杀导致参数丢失的问题。
修复了“追加合并”导入后,因读取旧缓存导致界面没有及时显示新音色的问题。
分发网络源配置给外部软件时,增加了哈希后缀机制,修复了向第三方软件批量导入时由于 ID 冲突导致只导入成功一个的问题。
软件评论
网友评论