PillOCR OCR公式识别工具 – 基于大模型api的OCR神器

趣软酷站1个月前更新 J.Cling
28 0

PillOCR 是一款开源 OCR 工具,基于 Python 开发,主打 “无感识别”——你几乎察觉不到它的存在,但它却能快速准确地从图片里提取文字。它不像传统 OCR 软件那样需要复杂的安装和设置,而是可以轻松集成到你的工作流中,无论是编程脚本、自动化工具,还是日常截图识别,都能胜任。

J.Cling 推荐阅读:

主要功能特点

  • 轻量级:体积小,运行快,不占用太多系统资源。
  • 高精度:支持多种语言(包括中文、英文等),能识别印刷体、手写体(部分场景)。
  • 易集成:提供 Python API,开发者可以轻松调用;普通用户也能通过命令行快速使用。
  • 无感体验:不需要复杂的界面,截图或拖入图片,文字瞬间提取。

模型推荐

  • 火山引擎的Doubao-1.5-vision-lite,若觉得精准度不够可以使用Doubao-1.5-vision-pro,价格比前者贵一倍。火山引擎赠送500,000tokens的免费额度。

因为火山引擎的免费额度我还没用完,所以暂无其他推荐。大家有推荐的模型可以告诉我,我会添加到此处。

PillOCR能做什么?

1. 截图秒转文字

你正在浏览网页,看到一段有用的信息,但无法选中文字?直接截图,PillOCR 能立刻识别并返回可编辑的文本,省去手动打字的麻烦。

2. 手写笔记电子化

纸质笔记、会议白板上的内容,拍张照片就能自动转成可编辑的文档,方便存档或分享。

3. 表格数据提取

别人发来的表格截图,不用再手动录入,PillOCR 能识别并转换成结构化数据(如 CSV 或 Markdown 表格)。

4. 自动化工作流

如果你是开发者,可以用 API 集成到自动化脚本里,比如自动识别发票信息、批量处理图片文字等。

演示视频

更新日志

v0.1.0

新功能:

  1. 增加提示词自定义设置,可以根据供应商调整合适的提示词,还可以通过自定义提示词实现截图+翻译和截图+解题等功能(#16);
  2. 增加绑定截图快捷键功能
    • 绑定截图快捷键后,只有通过该截图快捷键获取的截图才会被识别;(例:将截图快捷键绑定为”Alt+A(微信截图快捷键)”后,只有微信截图才会被识别,其他截图工具的截图或手动复制的图片不会被识别)
    • 若截图快捷键设置为空,则所有剪贴板中的截图都会被处理;
    • 软件不带截图功能,需要你将想要绑定的截图工具的快捷键输入到软件中;
  3. 添加“是否处理软件启动时剪贴板中的图片”设置;
  4. 增加”最大Token限制“设置,解决;
  5. UI更新,将不同设置分类到左侧导航栏。

Bug 修复:

  1. 更改快捷键注册逻辑,分为三个输入框依次输入(只想注册两键可以将最后一个输入框留空),修复#13
  2. 修复 当模型返回内容默认使用”$ $“和”$$ $$”为公式包装符时自定义包装符无法生效 的问题(#14)。

获取方式

官方网站

https://github.com/OB0NE/PillOCR

网盘下载

夸克网盘

https://pan.quark.cn/s/7799d35a1870

更多趣软酷站请访问:

https://www.gewuzhizhi.vip/software-store/all-software-store/internet-resources

© 版权声明

相关文章