Sifter
Sifter 是一个面向同类文档集合的 AI 结构化抽取引擎,可把发票、合同、收据、简历等文件转换成可查询的 MongoDB 记录。
安装次数
点赞
应用评论
催更次数
桌面端




应用描述
已集成懒猫OIDC登录。 ## 功能特性 - Schema-driven extraction:后端与前端都支持用自然语言描述字段,并从 PDF、图片、DOCX、HTML、TXT、Markdown、CSV、WebP 等常见文档中抽取结构化记录。 - Exact database query:将自然语言问题转换成 MongoDB aggregation pipeline,适合做精确筛选、计数、求和、分组和排序。 - 文档与文件夹管理:支持按文件夹上传文档,把同一批文档关联到一个或多个 Sift(抽取任务)。 - 记录、引用与预览:抽取结果可查看记录详情、字段引用、原始文档预览和文件下载。 - Chat over records:围绕已抽取数据进行问答,不依赖相似度检索返回文本片段。 - Dashboard generation:用自然语言生成 KPI、表格、分组和趋势图等仪表盘组件。 - REST API、Python SDK、TypeScript SDK 与 CLI:适合接入自动化流水线和开发者工具。 ### 日常使用方式 1. 在 `Sifts(抽取任务)` 中创建不同文档集合,例如发票、收据、合同、简历。 2. 在 Sift 详情页通过 `Upload(上传)` 上传 PDF、DOCX、HTML/HTM、TXT、MD、CSV、PNG、JPG/JPEG、TIFF/TIF、WebP 文档;选择来源时既可走本地文件系统,也可直接从懒猫微服选择文件。当前不支持 `JSON`、`YAML`、`YML` 上传。 3. 在 `Records(记录)` 表格中筛选、查看字段和低置信度结果。 4. 打开 `Documents(文档)` 查看原始文件预览、字段引用和下载入口。 5. 在 `Chat(聊天)` 中围绕已抽取记录提问,例如 `列出本季度金额超过 10000 的发票`。 6. 在 `Dashboards(仪表盘)` 中用自然语言描述报表需求,生成 KPI、趋势图和分组统计。 注意:导出下载到懒猫网盘里命名方式里需要带上文件名后缀,比如".csv"。
懒猫评分/评论
0.0
0 条评论
新功能
版本历史记录暂无更新日志
此 App 尚未收到足够的评分或评论,无法显示评论列表。