Kokoro TTS
Kokoro-FastAPI 是一个基于 Docker 的 FastAPI 封装器,专为 Kokoro-82M 文本转语音(TTS)模型设计,支持多语言(英语、日语、中文,后续支持越南语),可在 CPU(ONNX)和 NVIDIA GPU(PyTorch)环境下高效推理,具备自动语音拼接、语音混合及丰富的调试和监控功能,适合开发者与研究者快速集成和部署高质量 TTS 服务。
安装次数
点赞
应用评论
催更次数
桌面端


应用描述
• 基于 FastAPI 和 Docker,支持快速部署和多架构运行(CPU/GPU) • 集成 Kokoro-82M TTS 模型,支持英语、日语、中文(后续支持越南语) • 兼容 OpenAI Speech API,支持流式语音合成和多种输出格式(mp3, wav, opus, flac, m4a, pcm) • 支持语音混合(可按权重组合多种声音),并可导出自定义语音包 • 提供每词时间戳字幕生成、分词/音素级音频生成等高级功能 • 内置调试接口,可监控系统状态、资源用量及推理会话池 • 支持通过 REST API 或 OpenAI 官方库调用,便于集成到各类应用 • 自动分句拼接,优化长文本处理体验
相关攻略

Kokoro TTS:好用的文本转语言模型
## Kokoro TTS是什么 简单说,Kokoro-FastAPI 是一个基于 Kokoro-82M 文本转语音模型的 Docker 化 FastAPI 封装,支持多语言(英语、日语、中文),提供 OpenAI 兼容的语音接口,支持 NVIDIA GPU 加速或 CPU 推理。 用人话说就是:**你扔给它一段文字,它能用各种声音念出来,而且还挺自然的**。 https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.kokoro ## 如何使用 应用安装后,打开主页面  最基础的用法,把文字变成语音文件: 在文本框中输入内容,超过500字符会自动分页  选择语言模型  这个功能很有意思,可以把多个声音混合:  选择语言速度、语言,点击生成按钮  如果是一页的数据,大概2分钟左右,生成之后,点击play听一下效果  右下角的下载按钮可以下载mp3文件。 查看 `/v1/audio/voices` 接口获取所有可用声音列表。  英文的效果也不错,感觉音色更自然一些  ## 总结 Kokoro 是个相当不错的本地 TTS 解决方案,特别适合: **内容创作者**:需要批量生成语音内容 **隐私敏感用户**:不想把文本发到云端 最重要的是,这玩意儿**完全免费开源**,不用担心 API 额度用完或者服务停止。

从今天起,你又多拥有一个完全免费的文本转语音服务
在这个人人都能制作视频内容的时代,文字转语音(TTS)成为了很多创作者的好帮手。 开门见山,就是刚刚上线应用商店的 Edge TTS https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.edge-tts 没错,你没有想错。这个 Edge 的意思确实就是微软 Edge 的那个 Edge。在没有那么苛刻的场景下,微软的 Edge 文字转语音可以说质量已经足够好,听书也没有那么有机械感。 现在,只要你有懒猫微服,那么 Edge 的文字转语音就可以作为一个服务运行,而不再依赖浏览器 ## 安装 一件安装之后,第一次打开有一个设置向导  第一个配置的意思是:当其他应用要访问这个服务时,需不需要填写密钥。就像你用 DeepSeek 和 Fish Audio 一样,在可以支持这两个服务的应用里,有些软件会支持你自定义 API 地址,但是 API 密钥肯定要填写。 这里可以针对你的需求选择,我建议是直接选需要(True)。然后下一行直接填写你要求的密钥,你可以生成一个,或者直接写一串你能记住的英文。 其他的直接默认过就行。开始部署。 这个部署过程特别快,然后就看到这个界面:  然后你翻上翻下发现,卧槽!怎么没有任何一个地方可以输入文字? 没错,这就是跟懒猫其他应用不同的地方。**它并不是为了独立工作而存在的** 如果你需要能独立完成需求的,贴一份文字就可以拿到音频的应用,我们懒猫商店也有。这里我列举两个 https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.cattts https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.kokoro ## 使用 ### Open Notebook 配置很简单,在 Open Notebook 的部署配置里,找到这个配置,将 Edge TTS 地址栏的地址 + /v1 输入到这里即可。如果你还配置了密钥,那么密钥也要填写  ### AnythingLLM AnythingLLM 是一个开源的“全栈 AI 应用”平台,目标是让用户以极少开发工作量,便可使用大语言模型、RAG、AI Agents 及文档互动能力。 这个应用也有懒猫微服版本 https://appstore.lazycat.cloud/#/shop/detail/me.ironfeet.app.anythingllm 我用的是客户端版本,同样在设置这样设置,就可以让回答内容直接用语音说出来了 
懒猫评分/评论
0.0
0 条评论
新功能
版本历史记录""
此 App 尚未收到足够的评分或评论,无法显示评论列表。