打开 “懒猫微服客户端” 下载应用

Free LLM Gateway

一个聚合多家免费大模型 Provider 的 OpenAI 兼容网关,适合在懒猫里统一管理密钥、查看可用模型并把多个 AI 客户端接到同一个 `/v1` 入口。

17 次下载
0 次点赞
0 条评论
0 次催更
17

安装次数

0

点赞

0

应用评论

0

催更次数

桌面端

应用描述

## 功能特性 - 统一 OpenAI 兼容入口:把多个免费模型 Provider 聚合到同一个 `/v1` Base URL,方便 Cursor、Open WebUI、LibreChat、OpenAI SDK 等客户端统一接入。 - 多 Provider 模型聚合:支持 OpenRouter、GitHub Models、Groq、Cerebras、Google Gemini、Mistral、SiliconFlow 等多家免费模型来源,并按 `models.yaml` 定义的链路做回退。 - 智能回退与轮询:当某个 Provider 失败、超时或触发限流时,网关会自动切到后备模型,同时在多 Key 场景下轮询分配请求。 - 流式与批量调用:兼容流式 SSE 输出,也支持 `/v1/batch` 并发转发多个请求,适合脚本或工具批量测试。 - 控制台管理:内置 Dashboard,可查看 Provider 健康状态、缓存命中率、请求日志、基准测试、连接信息和推荐模型。 - 运行时密钥管理:支持在控制台里新增、验证、删除 Provider API Key,并把运行时新增的密钥加密保存到持久化目录。 - 用量与节省统计:自动记录请求量、Token 消耗、Provider 成功率和近似节省金额,便于日常观察使用情况。 ### 首次使用流程 1. 在安装向导里设置一个你自己记得住的 `master_key`,此 `master_key`也是所有客户端调用 /v1 接口时需要携带的统一 API Key,可在'setup'里查看 2. 如果你准备使用 Cloudflare Workers AI,再额外填写 `cloudflare_account_id` 3. 打开控制台的 `Keys` 标签页 4. 至少添加一个可用的 Provider Key,例如 `openrouter`、`github`、`groq` 或 `google_gemini`(必要,否则无模型可以获取使用) 5. 点击验证按钮,确认对应 Provider 显示可用或至少不再是空配置状态 6. 回到 `Models` 或 `Setup` 页面,确认已经能看到可用模型列表 ### 第三方 Provider Key 获取方式 - `OpenRouter`:打开 [openrouter.ai/keys](https://openrouter.ai/keys),登录后创建 Key。优点是免费模型目录最全,通常最适合先配第一把 Key。 - `GitHub Models`:打开 [github.com/settings/tokens](https://github.com/settings/tokens) 生成 Personal Access Token。适合已经有 GitHub 账号的用户,拿 Key 相对直接。 - `Groq`:打开 [console.groq.com/keys](https://console.groq.com/keys) 创建 API Key。特点是速度快,常适合做日常聊天和代码助手。 - `Google Gemini`:打开 [aistudio.google.com/apikey](https://aistudio.google.com/apikey) 创建 API Key。需要 Google 账号,部分地区免费额度不可用。 - `Cerebras`:打开 [cloud.cerebras.ai](https://cloud.cerebras.ai/) 注册后进入控制台获取 Key。适合想测试超高输出速度的用户。 - `Mistral AI`:打开 [console.mistral.ai/api-keys](https://console.mistral.ai/api-keys) 创建 Key。适合补充 Mistral / Codestral 系列模型。 - `SiliconFlow`:打开 [cloud.siliconflow.cn/account/ak](https://cloud.siliconflow.cn/account/ak) 创建 API Key。 - `Hugging Face`:打开 [huggingface.co/settings/tokens](https://huggingface.co/settings/tokens) 创建 `Read` 权限 Token。适合需要补充社区模型时使用。 - `Cloudflare Workers AI`:打开 [dash.cloudflare.com/profile/api-tokens](https://dash.cloudflare.com/profile/api-tokens) 创建 Token,同时还要准备 `Account ID`。如果安装时没填 `cloudflare_account_id`,这里先不要配。 - `Cohere`:打开 [dashboard.cohere.com/api-keys](https://dashboard.cohere.com/api-keys) 获取试用 Key。注意试用额度和商用限制。 - `NVIDIA NIM`:打开 [build.nvidia.com/explore/discover](https://build.nvidia.com/explore/discover) 注册并加入 NVIDIA Developer Program 后生成 Key。模型多、额度也比较友好。 - `LLM7`:打开 [token.llm7.io](https://token.llm7.io)。它支持无注册基础访问,但如果你想提高限速,仍建议生成 Token 再填入控制台。 - `Ollama Cloud`:打开 [ollama.com/settings/keys](https://ollama.com/settings/keys) 生成 Key。适合想补充 Ollama Cloud 模型来源时使用。 注意:部分三方Provider需要结合小猪佩奇使用,如Gemini等。

懒猫评分/评论

0.0

0 条评论

此 App 尚未收到足够的评分或评论,无法显示评论列表。

应用信息

最新版本

1.0.0

更新日期

4/29/2026

预估安装占用

63.15 MB

不支持平台

ios、android、tvos

来源

MrFadiAi

提供者

Edward

兼容性

可在此设备上使用

""