PillOCR 是一款开源 OCR 工具,基于 Python 开发,主打 “无感识别”——你几乎察觉不到它的存在,但它却能快速准确地从图片里提取文字。它不像传统 OCR 软件那样需要复杂的安装和设置,而是可以轻松集成到你的工作流中,无论是编程脚本、自动化工具,还是日常截图识别,都能胜任。
J.Cling 推荐阅读:
- 趣软酷站|免费,开源,可批量的离线OCR文字识别软件 – Umi-OCR 本地离线文字识别工具
- 趣软酷站|这神器效率翻倍的不是说说而已,用与不用完全两回事 – Quicker指尖工具箱
- 【更新】趣软酷站|开源社区评价30.6K!从PDF到网页“大模型时代的文档提取、转换神器”- MinerU免费全能的文档解析神器
- 【更新】截图软件|PixPin – 随心截图,随意贴图(屏幕截图,录制屏幕,长截图,文字识别,贴图)
- 【更新】截图软件|首款接入DeepSeek的AI截图神器!轻巧、好用 – 小旺AI截图
主要功能特点
- 轻量级:体积小,运行快,不占用太多系统资源。
- 高精度:支持多种语言(包括中文、英文等),能识别印刷体、手写体(部分场景)。
- 易集成:提供 Python API,开发者可以轻松调用;普通用户也能通过命令行快速使用。
- 无感体验:不需要复杂的界面,截图或拖入图片,文字瞬间提取。
模型推荐
- 火山引擎的Doubao-1.5-vision-lite,若觉得精准度不够可以使用Doubao-1.5-vision-pro,价格比前者贵一倍。火山引擎赠送500,000tokens的免费额度。
因为火山引擎的免费额度我还没用完,所以暂无其他推荐。大家有推荐的模型可以告诉我,我会添加到此处。
PillOCR能做什么?
1. 截图秒转文字
你正在浏览网页,看到一段有用的信息,但无法选中文字?直接截图,PillOCR 能立刻识别并返回可编辑的文本,省去手动打字的麻烦。
2. 手写笔记电子化
纸质笔记、会议白板上的内容,拍张照片就能自动转成可编辑的文档,方便存档或分享。
3. 表格数据提取
别人发来的表格截图,不用再手动录入,PillOCR 能识别并转换成结构化数据(如 CSV 或 Markdown 表格)。
4. 自动化工作流
如果你是开发者,可以用 API 集成到自动化脚本里,比如自动识别发票信息、批量处理图片文字等。
演示视频
更新日志
v0.1.0
新功能:
- 增加提示词自定义设置,可以根据供应商调整合适的提示词,还可以通过自定义提示词实现截图+翻译和截图+解题等功能(#16);
- 增加绑定截图快捷键功能
- 绑定截图快捷键后,只有通过该截图快捷键获取的截图才会被识别;(例:将截图快捷键绑定为”Alt+A(微信截图快捷键)”后,只有微信截图才会被识别,其他截图工具的截图或手动复制的图片不会被识别)
- 若截图快捷键设置为空,则所有剪贴板中的截图都会被处理;
- 软件不带截图功能,需要你将想要绑定的截图工具的快捷键输入到软件中;
- 添加“是否处理软件启动时剪贴板中的图片”设置;
- 增加”最大Token限制“设置,解决;
- UI更新,将不同设置分类到左侧导航栏。
Bug 修复:
- 更改快捷键注册逻辑,分为三个输入框依次输入(只想注册两键可以将最后一个输入框留空),修复#13;
- 修复 当模型返回内容默认使用”$ $“和”$$ $$”为公式包装符时自定义包装符无法生效 的问题(#14)。
获取方式
官方网站
https://github.com/OB0NE/PillOCR
网盘下载
夸克网盘
https://pan.quark.cn/s/7799d35a1870
更多趣软酷站请访问:
https://www.gewuzhizhi.vip/software-store/all-software-store/internet-resources
★★★ 强烈推荐 ★★★ 点击下图,500+常用办公精品软件一键直达!
© 版权声明
文章版权归作者所有,未经允许请勿转载。