
喵爸联萌
我老是把Kokoro记错成Kororo...  懒猫AI算力舱内置了Kokoro TTS,Kokoro TTS 是一个轻量级、开源的文本转语音(Text-to-Speech)模型,2024 年由微软亚洲研究院(Microsoft Research Asia)提出。它的主要特点是: * 轻量高效,模型参数量大约 80M,比主流大模型 TTS 要小得多。推理速度快,适合在普通 GPU 或者 CPU 上实时运行。 * 高音质,采用非自回归架构(non-autoregressive),减少了生成延迟。在 MOS(Mean Opinion Score,主观音质评分)测试中,表现接近甚至超过更大规模的 TTS 系统。 多语言支持,尤其近来添加了大量中文语言包,懒猫算力舱内置的版本就有100多个中文音色可选。 首先你需要算力舱,然后安装以下应用: https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.cattts # 基本使用 界面分为左右布局,在移动版会改为上下式布局,便于滑动浏览。 左栏是生成面板,右栏是转换记录和任务队列。   应用启动后大约需要十几秒加载模型并读取音色列表,等系统提示且音色列表刷新后就可以使用了。 你只要在文本框中输入内容(点击应用标题可以快速把标题输入进去便于尝试),然后选择一个音乐观,设置语速。再点击“开始转换”就可以了。  Kokoro的转换速度非常快,几百字的文本也只需要几秒种,所以几乎没有什么等待时间,转换完成后会自动播放一遍语音。 转换完的记录都会记录在右栏的“转换记录”列表中,你可以再次试听、下载或删除它们。  记录区右上角有一个刷新按钮,用于同步在不同终端上生成的结果,还有一个全选/反选按钮,当选择多条时,就会出现批量删除按钮,用于批量删除转换记录。  # 高级用法 喵语1.1.0版本新加入了打开文本文件和任务队列功能。 当你升级到1.1.0版本后,你就可以从懒猫网盘选择一个文本文件,从右键菜单中找到“在线应用打开”,并选择“喵语·TTS”,就可以直接唤起喵语并开始转换。  应用将自动拆分较大的文本,分割为大约为500字左右基于自然段的N个片段,然后生成转换任务。  转换任务是后台同步的,如果你在一个应用实例(比如手机)中创建了任务,在其他的实例(比如桌面或网页端)也可以看到任务,可以在任何一个实例中启动转换任务。 转换任务执行的很快,我转换了一章我正在写的小说文本,几千字大约不到一分钟就转完了,所以理论上,你也可以试试转换长篇的文案。 转换完成任务就会消失,相应的转换结果会出现在“转换记录”Tab中。   ## 小技巧 由于每次任务都是从表单中读取一次设置,所以当你转换到某条记录时,你可以暂停或快速操作,在表单中切换音色,这样新的任务就会用新的音色来转换,便于切换对话角色等。 在后续的版本中可能会加入单条设置音色和单独转换的功能,也会加入批量下载或拼接功能,这样转换有声书或剧本时就会更方便啦。
评论
0暂无评论