DeepSeek OCR APP – 基于 DeepSeek-OCR 开发AI OCR识别工具

AI软件5小时前更新 J.Cling
2 0

DeepSeek OCR APP 是一款基于 DeepSeek-OCR 模型实现了一个简单实用的 OCR识别工具,提供简洁直观的操作界面,只需要拖拽上传图片,即可开始处理,最大支持 100MB 文件,支持四种核心 OCR 模式,纯文字提取、图像描述、指定内容查找、自定义提示处理,满足日常大部分应用场景,同时支持可视化显示识别结果的边界框,直观展示识别到的区域和坐标。另外识别结果可以导出为 HTML 或 Markdown 格式,通过 Docker 一键部署即可使用,无需复杂的配置。

J.Cling 推荐拓展:


主要功能特点

4 个核心 OCR 模式

  • 普通 OCR – 从任何图像中提取原始文本
  • 描述 – 生成智能图像描述
  • 查找 – 使用视觉边界框定位特定术语
  • 自由形式 – 为专业任务提供自定义提示

UI 功能

  • 🎨 玻璃态设计,带动态渐变效果
  • 🎯 拖拽上传文件(默认支持 100MB)
  • 🗑️ 轻松删除并重新上传图片
  • 📦 带有适当坐标缩放的接地框可视化
  • ✨ 平滑动画(Framer Motion)
  • 📋 复制/下载结果
  • 🎛️ 高级设置下拉菜单
  • 📝 HTML 和 Markdown 渲染以实现格式化输出
  • 🔍 支持多个边界框(处理找到的多个术语实例)

官方使用说明

见网盘

更新日志

v2.1.1

  • 修复了图像删除按钮 – 现在可以正确清除并允许重新上传
  • 修复了多个边界框解析 – 处理 [[x1,y1,x2,y2], [x1,y1,x2,y2]] 格式
  • 简化为4个核心工作模式以提升稳定性
  • 修复了边界框坐标缩放(归一化0-999→实际像素)
  • 修复了 HTML 渲染(模型输出 HTML,不是 Markdown)
  • 增加了文件上传限制至 100MB(可配置)
  • 添加了.env 配置支持

获取方式

官方网站

https://github.com/rdumasia303/deepseek_ocr_app

网盘下载

https://pan.quark.cn/s/151bed85b639

更多趣软酷站请访问:

https://www.gewuzhizhi.vip/software-store/all-software-store/internet-resources

© 版权声明

相关文章