DeepSeek OCR APP 是一款基于 DeepSeek-OCR 模型实现了一个简单实用的 OCR识别工具,提供简洁直观的操作界面,只需要拖拽上传图片,即可开始处理,最大支持 100MB 文件,支持四种核心 OCR 模式,纯文字提取、图像描述、指定内容查找、自定义提示处理,满足日常大部分应用场景,同时支持可视化显示识别结果的边界框,直观展示识别到的区域和坐标。另外识别结果可以导出为 HTML 或 Markdown 格式,通过 Docker 一键部署即可使用,无需复杂的配置。
J.Cling 推荐拓展:




主要功能特点
4 个核心 OCR 模式
- 普通 OCR – 从任何图像中提取原始文本
- 描述 – 生成智能图像描述
- 查找 – 使用视觉边界框定位特定术语
- 自由形式 – 为专业任务提供自定义提示
UI 功能
- 🎨 玻璃态设计,带动态渐变效果
- 🎯 拖拽上传文件(默认支持 100MB)
- 🗑️ 轻松删除并重新上传图片
- 📦 带有适当坐标缩放的接地框可视化
- ✨ 平滑动画(Framer Motion)
- 📋 复制/下载结果
- 🎛️ 高级设置下拉菜单
- 📝 HTML 和 Markdown 渲染以实现格式化输出
- 🔍 支持多个边界框(处理找到的多个术语实例)
官方使用说明
见网盘
更新日志
v2.1.1
- 修复了图像删除按钮 – 现在可以正确清除并允许重新上传
- 修复了多个边界框解析 – 处理
[[x1,y1,x2,y2], [x1,y1,x2,y2]]格式 - 简化为4个核心工作模式以提升稳定性
- 修复了边界框坐标缩放(归一化0-999→实际像素)
- 修复了 HTML 渲染(模型输出 HTML,不是 Markdown)
- 增加了文件上传限制至 100MB(可配置)
- 添加了.env 配置支持
获取方式
官方网站
https://github.com/rdumasia303/deepseek_ocr_app
网盘下载
https://pan.quark.cn/s/151bed85b639
更多趣软酷站请访问:
https://www.gewuzhizhi.vip/software-store/all-software-store/internet-resources
★★★ 强烈推荐 ★★★ 点击下图,500+常用办公精品软件一键直达!
© 版权声明
文章版权归作者所有,未经允许请勿转载。
