打开 “懒猫微服客户端” 下载应用

TokSuan

TokSuan 是一个面向 AI agents 的模型网关与控制台,负责记录每次请求开销、设置预算与环路保护,并在有证据时把请求路由到更合适的模型。

3 次下载
0 次点赞
0 条评论
0 次催更
3

安装次数

0

点赞

0

应用评论

0

催更次数

桌面端

应用描述

已集成懒猫OIDC登录。 ## 功能特性 - OpenAI 兼容网关:对外提供 `/v1/chat/completions`,AI 客户端只需替换 `base_url` 即可接入。 - 请求账本与节省回执:记录模型、token、延迟、成本、节省金额与路由原因,便于事后审计。 - 预算与环路保护:支持按项目限制日/月预算,并阻断短时间重复请求导致的 runaway spend。 - 路由与质量验证:支持 baseline routing、shadow A/B、failover、semantic cache 与按项目学习优化。 - 多提供商支持:支持 OpenAI、Anthropic、Google、DeepSeek、Qwen、Doubao 等上游模型。 - Dashboard 控制台:提供项目、API key、预算、路由规则、告警、Provider Key、审计与请求详情页面。 ### 首次使用流程 1. 登录后可以点击 `切换到 中文`,中文界面顶部导航会显示 `概览`、`项目`、`Agents`、`路由`、`设置`。 2. 进入 `设置 -> 自定义上游服务商`,按你的上游类型登记 OpenAI 兼容 endpoint。 3. 进入 `项目` 创建项目,生成以 `ts_` 开头的项目 API key。完整 key 只显示一次,离开页面后只能看到前缀和末 4 位。 4. 把你的 AI 客户端 `base_url` 改成 `https://toksuan.你的设备名.heiyu.space/v1`,并在请求头里使用刚生成的 `Authorization: Bearer ts_...`。 ### 日常使用方式 1. 日常接入时,AI 客户端只需要保留 OpenAI 兼容协议:`base_url=https://toksuan.你的设备名.heiyu.space/v1`,`Authorization: Bearer ts_你的项目_key`。 2. 调用模型时直接填写上游真实模型名。 3. 每次请求后进入 `概览` 查看 `最新一份省钱回执` 与 `最近请求`。 4. 如果要按 agent 会话聚合,请在请求头增加 `x-ts-agent`、`x-ts-session`、`x-ts-turn`;随后可在 `Agents` 页面查看会话分组。 5. 如果要控制成本,进入项目详情的 `预算` 设置日预算或月预算;当前实测项目已启用 `日预算 $1.0000`。 6. 如果要做模型下沉或 shadow A/B,进入项目详情的 `路由规则` 配置匹配规则。注意:自定义上游没有价格元数据时,TokSuan 可以记录调用和路由证据,但金额节省会按 `$0.0000` 或“不可用”处理。 7. 如果需要更换 AI Pod 或增加其他模型服务,在 `设置 -> 自定义上游服务商` 新增不同的 `model_prefix`。前缀越具体越安全,避免覆盖内置 OpenAI、Qwen、DeepSeek 等 provider 路由。 8. 如果需要轮换项目 API key,进入项目详情的 `API key` 分区创建新 key,再删除旧 key;删除会即时生效。

懒猫评分/评论

0.0

0 条评论

此 App 尚未收到足够的评分或评论,无法显示评论列表。

应用信息

最新版本

0.0.1

更新日期

5/13/2026

预估安装占用

179.35 MB

不支持平台

ios、android、tvos

提供者

Edward

兼容性

可在此设备上使用

""