喵语·TTS:顺畅转换文本到语音

喵爸联萌

发布于283天前
创意设计版霸·老掉牙的设计师·只能依仗AI的艺术家·落伍的伪全栈·除了舌毒嘴贱手残并没有什么别的优点

我老是把Kokoro记错成Kororo...
![image.png](https://dl.playground.lazycat.cloud/guidelines/319/ded32d81-7eb9-467e-8891-554d20e4aecd.png "image.png")

懒猫AI算力舱内置了Kokoro TTS,Kokoro TTS 是一个轻量级、开源的文本转语音(Text-to-Speech)模型,2024 年由微软亚洲研究院(Microsoft Research Asia)提出。它的主要特点是:

* 轻量高效,模型参数量大约 80M,比主流大模型 TTS 要小得多。推理速度快,适合在普通 GPU 或者 CPU 上实时运行。

* 高音质,采用非自回归架构(non-autoregressive),减少了生成延迟。在 MOS(Mean Opinion Score,主观音质评分)测试中,表现接近甚至超过更大规模的 TTS 系统。

多语言支持,尤其近来添加了大量中文语言包,懒猫算力舱内置的版本就有100多个中文音色可选。

首先你需要算力舱,然后安装以下应用:

https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.cattts

# 基本使用

界面分为左右布局,在移动版会改为上下式布局,便于滑动浏览。
左栏是生成面板,右栏是转换记录和任务队列。
 
![屏幕截图 2025-08-23 201817.png](https://dl.playground.lazycat.cloud/guidelines/319/23f78a98-10af-47cf-82af-a17d92a29b29.png "屏幕截图 2025-08-23 201817.png")

![屏幕截图 2025-08-23 202036.png](https://dl.playground.lazycat.cloud/guidelines/319/2d882a5e-051b-40db-bcb4-95fb40e21c6d.png "屏幕截图 2025-08-23 202036.png")

应用启动后大约需要十几秒加载模型并读取音色列表,等系统提示且音色列表刷新后就可以使用了。
你只要在文本框中输入内容(点击应用标题可以快速把标题输入进去便于尝试),然后选择一个音乐观,设置语速。再点击“开始转换”就可以了。
![屏幕截图 2025-08-23 201826.png](https://dl.playground.lazycat.cloud/guidelines/319/ddd7d359-b639-48bb-a236-c96c42c3a277.png "屏幕截图 2025-08-23 201826.png")

Kokoro的转换速度非常快,几百字的文本也只需要几秒种,所以几乎没有什么等待时间,转换完成后会自动播放一遍语音。
转换完的记录都会记录在右栏的“转换记录”列表中,你可以再次试听、下载或删除它们。
![屏幕截图 2025-08-23 201758.png](https://dl.playground.lazycat.cloud/guidelines/319/46fa4ca7-916a-48ef-9259-1bde070ba113.png "屏幕截图 2025-08-23 201758.png")

记录区右上角有一个刷新按钮,用于同步在不同终端上生成的结果,还有一个全选/反选按钮,当选择多条时,就会出现批量删除按钮,用于批量删除转换记录。

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/fbe18544-dbc9-4ba3-b1b1-bf88241f52db.png "image.png")

# 高级用法

喵语1.1.0版本新加入了打开文本文件和任务队列功能。

当你升级到1.1.0版本后,你就可以从懒猫网盘选择一个文本文件,从右键菜单中找到“在线应用打开”,并选择“喵语·TTS”,就可以直接唤起喵语并开始转换。

![image.png](https://dl.playground.lazycat.cloud/guidelines/319/831b4f2f-83c6-4722-b3d2-bbd3e7a20a35.png "image.png")

应用将自动拆分较大的文本,分割为大约为500字左右基于自然段的N个片段,然后生成转换任务。
![image.png](https://dl.playground.lazycat.cloud/guidelines/319/7f0d559f-42b5-439b-9d1d-1c5ff8bf4c7c.png "image.png")

转换任务是后台同步的,如果你在一个应用实例(比如手机)中创建了任务,在其他的实例(比如桌面或网页端)也可以看到任务,可以在任何一个实例中启动转换任务。

转换任务执行的很快,我转换了一章我正在写的小说文本,几千字大约不到一分钟就转完了,所以理论上,你也可以试试转换长篇的文案。

转换完成任务就会消失,相应的转换结果会出现在“转换记录”Tab中。


![屏幕截图 2025-08-23 202023.png](https://dl.playground.lazycat.cloud/guidelines/319/dbbc87b0-ad39-4287-a868-7a66ba159f4d.png "屏幕截图 2025-08-23 202023.png")

![屏幕截图 2025-08-23 201746.png](https://dl.playground.lazycat.cloud/guidelines/319/03bc0e53-b3f4-4feb-901f-96c70a8226a1.png "屏幕截图 2025-08-23 201746.png")

## 小技巧

由于每次任务都是从表单中读取一次设置,所以当你转换到某条记录时,你可以暂停或快速操作,在表单中切换音色,这样新的任务就会用新的音色来转换,便于切换对话角色等。

在后续的版本中可能会加入单条设置音色和单独转换的功能,也会加入批量下载或拼接功能,这样转换有声书或剧本时就会更方便啦。



评论

0

暂无评论

说点什么呢~
收藏
1
0
0