打开 “懒猫微服客户端” 下载应用

Kokoro TTS

Kokoro-FastAPI 是一个基于 Docker 的 FastAPI 封装器,专为 Kokoro-82M 文本转语音(TTS)模型设计,支持多语言(英语、日语、中文,后续支持越南语),可在 CPU(ONNX)和 NVIDIA GPU(PyTorch)环境下高效推理,具备自动语音拼接、语音混合及丰富的调试和监控功能,适合开发者与研究者快速集成和部署高质量 TTS 服务。

31 次下载
0 次点赞
0 条评论
0 次催更
31

安装次数

0

点赞

0

应用评论

0

催更次数

桌面端

应用描述

• 基于 FastAPI 和 Docker,支持快速部署和多架构运行(CPU/GPU) • 集成 Kokoro-82M TTS 模型,支持英语、日语、中文(后续支持越南语) • 兼容 OpenAI Speech API,支持流式语音合成和多种输出格式(mp3, wav, opus, flac, m4a, pcm) • 支持语音混合(可按权重组合多种声音),并可导出自定义语音包 • 提供每词时间戳字幕生成、分词/音素级音频生成等高级功能 • 内置调试接口,可监控系统状态、资源用量及推理会话池 • 支持通过 REST API 或 OpenAI 官方库调用,便于集成到各类应用 • 自动分句拼接,优化长文本处理体验

相关攻略

Kokoro TTS:好用的文本转语言模型

## Kokoro TTS是什么 简单说,Kokoro-FastAPI 是一个基于 Kokoro-82M 文本转语音模型的 Docker 化 FastAPI 封装,支持多语言(英语、日语、中文),提供 OpenAI 兼容的语音接口,支持 NVIDIA GPU 加速或 CPU 推理。 用人话说就是:**你扔给它一段文字,它能用各种声音念出来,而且还挺自然的**。 https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.kokoro ## 如何使用 应用安装后,打开主页面 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/9c24375c-2971-4f1d-8784-7a84f846b40b.png "image.png") 最基础的用法,把文字变成语音文件: 在文本框中输入内容,超过500字符会自动分页 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/23523eeb-b0ab-4706-a82d-05340d20f3b3.png "image.png") 选择语言模型 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/2a095758-2841-4735-9f2c-1ff273bda142.png "image.png") 这个功能很有意思,可以把多个声音混合: ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/945ac3de-8562-4710-bbc3-b7c25ebb39a4.png "image.png") 选择语言速度、语言,点击生成按钮 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/782e3e55-f42a-4d15-9314-ea7e1d99d315.png "image.png") 如果是一页的数据,大概2分钟左右,生成之后,点击play听一下效果 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/5f1897d5-3740-43e8-a8fa-3a7d037be208.png "image.png") 右下角的下载按钮可以下载mp3文件。 查看 `/v1/audio/voices` 接口获取所有可用声音列表。 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/20876f01-b733-4739-86b4-6e93c9812174.png "image.png") 英文的效果也不错,感觉音色更自然一些 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/f189b057-4679-4c6e-8506-d0476be705b9.png "image.png") ## 总结 Kokoro 是个相当不错的本地 TTS 解决方案,特别适合: **内容创作者**:需要批量生成语音内容 **隐私敏感用户**:不想把文本发到云端 最重要的是,这玩意儿**完全免费开源**,不用担心 API 额度用完或者服务停止。

从今天起,你又多拥有一个完全免费的文本转语音服务

在这个人人都能制作视频内容的时代,文字转语音(TTS)成为了很多创作者的好帮手。 开门见山,就是刚刚上线应用商店的 Edge TTS https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.edge-tts 没错,你没有想错。这个 Edge 的意思确实就是微软 Edge 的那个 Edge。在没有那么苛刻的场景下,微软的 Edge 文字转语音可以说质量已经足够好,听书也没有那么有机械感。 现在,只要你有懒猫微服,那么 Edge 的文字转语音就可以作为一个服务运行,而不再依赖浏览器 ## 安装 一件安装之后,第一次打开有一个设置向导 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/695/f3c97b27-76b9-424f-890a-8b37b8d9dd1c.png "image.png") 第一个配置的意思是:当其他应用要访问这个服务时,需不需要填写密钥。就像你用 DeepSeek 和 Fish Audio 一样,在可以支持这两个服务的应用里,有些软件会支持你自定义 API 地址,但是 API 密钥肯定要填写。 这里可以针对你的需求选择,我建议是直接选需要(True)。然后下一行直接填写你要求的密钥,你可以生成一个,或者直接写一串你能记住的英文。 其他的直接默认过就行。开始部署。 这个部署过程特别快,然后就看到这个界面: ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/695/e075768a-deca-4592-9e41-3a4524d76d63.png "image.png") 然后你翻上翻下发现,卧槽!怎么没有任何一个地方可以输入文字? 没错,这就是跟懒猫其他应用不同的地方。**它并不是为了独立工作而存在的** 如果你需要能独立完成需求的,贴一份文字就可以拿到音频的应用,我们懒猫商店也有。这里我列举两个 https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.cattts https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.kokoro ## 使用 ### Open Notebook 配置很简单,在 Open Notebook 的部署配置里,找到这个配置,将 Edge TTS 地址栏的地址 + /v1 输入到这里即可。如果你还配置了密钥,那么密钥也要填写 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/695/9bc2e446-0867-4927-bac6-e7c2bf52d77f.png "image.png") ### AnythingLLM AnythingLLM 是一个开源的“全栈 AI 应用”平台,目标是让用户以极少开发工作量,便可使用大语言模型、RAG、AI Agents 及文档互动能力。 这个应用也有懒猫微服版本 https://appstore.lazycat.cloud/#/shop/detail/me.ironfeet.app.anythingllm 我用的是客户端版本,同样在设置这样设置,就可以让回答内容直接用语音说出来了 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/695/8c269245-660f-4362-8d33-8a018f408cb4.png "image.png")

懒猫评分/评论

0.0

0 条评论

此 App 尚未收到足够的评分或评论,无法显示评论列表。

应用信息

最新版本

0.2.3

更新日期

7/28/2025

预估安装占用

1.75 GB

不支持平台

--

来源

remsky

提供者

Edward

兼容性

可在此设备上使用

""