Paperwise - 懒猫应用商店

## 功能特性 - 📄 **文档上传与管理** — 支持 PDF、TXT、MD、DOCX、DOC 格式，拖拽上传 - 🔍 **OCR 文字识别** — 支持 LLM OCR（多模态模型）和本地 Tesseract 双模式，可自动切换 - 🏷️ **元数据自动提取** — AI 自动识别标题、日期、类型、标签、通讯方 - 🤖 **Ask Your Docs** — 基于文档内容的 Grounded Q&A，支持引用溯源 - 🔎 **关键字搜索** — 全文搜索所有文档（仅英文） - 📁 **Collections 文档集** — 将文档组织为集合进行分组问答 - 🔁 **文件去重** — 基于 SHA256 校验和自动防止重复上传 - 🎨 **多主题切换** — Atlas / Ledger / Moss / Ember 四套主题 - 👥 **多用户系统** — 用户注册、登录、密码修改，模型配置按用户独立存储 ⚠️ **重要**：请使用**英文文档**测试搜索和问答功能。中文文档可以上传和提取元数据，但搜索和问答不支持中文内容（原项目限制）。 ### 注册账号密码 Paperwise 没有游客模式，首次使用必须创建账号： 1. 在登录页面点击 **Sign Up** 标签 2. 填写 Full Name、Email、Password（建议6 位以上） 3. 点击 **Create Account** 完成注册 4. 自动登录进入主界面 ### 配置 AI 模型（首次使用必做）文档上传后的元数据提取、OCR、问答功能都需要配置 AI 模型连接。每个用户的模型配置独立存储。 1. 点击左侧导航栏 **Settings** 2. 点击顶部 **Model Config** 子标签 3. 在 **Model Connections** 区域点击 **Add Connection** 4. 选择 Provider（OpenAI / Gemini / Custom） 5. 填写 API Key、Base URL（Custom 类型必填）、Model 6. 保存后在 **Task Assignments** 中为以下三个任务分配模型： - **Metadata Extraction** — 元数据提取（必配，否则无法上传） - **Grounded Q&A** — 文档问答（必配，否则 Ask Your Docs 不可用） - **OCR** — 文字识别（选择 LLM 或 Local Tesseract） > 💡 **快速配置**：只需添加一个 Provider 连接，为三个任务都使用同一个连接即可开始使用。如果文档多为清晰文本 PDF，可先用较快的模型，效果不满意再换更强的模型。 **OCR 模式说明**： | 模式 | 说明 | 适用场景 | |------|------|----------| | LLM OCR | 发送页面图片给多模态模型处理 | 扫描件、表单、图片密集型 PDF | | Local Tesseract | 在容器内使用 tesseract + pdftoppm 本地处理 | 隐私敏感场景、清晰印刷扫描件 | | Auto Switch（自动切换） | 直接文本提取效果不佳时自动回退到 OCR | 混合文档场景 | **官方推荐模型配置：** Paperwise 支持 GPT 和 Gemini 两套模型体系，建议按任务独立配置以获得最佳效果： | 任务 | GPT 推荐 | Gemini 推荐 | 说明 | |------|----------|-------------|------| | OCR | `gpt-5-mini` | `gemini-2.5-flash` | 快速多模态模型，适合扫描件和表单 | | Metadata Extraction | `gpt-5-mini` | `gemini-2.5-flash` | 结构化字段提取的平衡选择 | | Grounded Q&A | `gpt-5.1` | `gemini-2.5-pro` | 跨文档问答场景建议用更强的推理模型 | | 轻量分类/批量处理 | `gpt-5-nano` | `gemini-2.5-flash-lite` | 适合轻量级分类和分流任务 | > 💡 如果文档多为清晰文本 PDF，可先用较快的模型（mini/flash），效果不满意再换更强的模型。 ### 上传文档 1. 点击左侧 **Upload** 进入上传页面 2. 拖拽或点击选择文件（支持 PDF/TXT/MD/DOCX/DOC） 3. 点击 **Upload Selected Files** 4. 转到 **Processing Queue** 查看处理进度 5. 等待状态变为 **Ready** > 💡 Paperwise 会先尝试直接从文档提取文本。如果是扫描件或图片 PDF，则根据你设置的 OCR 模式进行处理。 > ⚠️ 相同文件（SHA256 校验和相同）不会被重复上传。 ### 搜索文档 > ⚠️ **重要限制**：Keyword Search 功能**仅支持英文关键词**搜索，中文关键词会返回空结果（原项目限制）。搜索匹配的是文档**正文内容**（OCR 提取的文本），不搜索标题或标签。 | 步骤 | 操作 | 测试数据 | 预期结果 | |------|------|----------|----------| | 1 | 点击左侧 **Search** | — | 显示关键字搜索界面 | | 2 | 输入**英文**搜索关键词 | `agile` 或 `risk management` | 返回匹配结果 | | 3 | 清空搜索框 | — | 清空结果 | ### Ask Your Docs 问答 > ⚠️ 需先完成模型配置（Grounded Q&A 任务已分配），且至少有一个已处理完成的**英文**文档 | 步骤 | 操作 | 测试数据 | 预期结果 | |------|------|----------|----------| | 1 | 点击左侧 **Ask Your Docs** | — | 显示问答界面 | | 2 | 输入英文问题并提交 | `What are the four steps of risk management?` | AI 返回答案，显示引用来源 | | 3 | 查看 Citations 表格 | — | 显示来源文档和引用片段 |