Dots OCR
识别任意人类文字与符号
安装次数
点赞
应用评论
催更次数
桌面端
移动端



应用描述
这是一个拥有 30 亿参数的多模态模型,由一个 12 亿参数的视觉编码器和一个 17 亿参数的语言模型组成。该模型旨在实现通用可访问性,能够识别几乎所有人類书写系统。除了在同类规模模型中于标准多语言文档解析任务上达到当前最先进(SOTA)水平外,dots.ocr-1.5 还能将结构化图形(如图表和示意图)直接转换为 SVG 代码、解析网页界面并定位场景文本。此外,该模型在通用 OCR、目标定位与计数等任务中也展现出极具竞争力的性能。
懒猫评分/评论
5.0
1 条评论
应用信息
新功能
版本历史记录"v1.0.0\n- 发布到商店"
u34026561
3/18/2026
识别效果比别的都好,能否增加PDF的OCR识别功能,另外,可以再加上一个LLM翻译功能(可以定义提示词),可以选择识别完,再翻译成中文。