日常办公、学习、摸鱼之余,大家总会遇到不少零碎需求:想和 AI 对话梳理思路,看到屏幕外文内容需要翻译,图片里的文字没法快速提取,遇到截图、图表还想让 AI 帮忙解读。来回切换聊天软件、翻译工具、OCR 程序,不仅打乱工作节奏,多开软件也会占用电脑资源,低配设备运行起来格外卡顿。软件格律诗 给大家推荐一下这款实用性拉满的轻量桌面工具 Kivio 它把 AI 聊天、智能工具、多语种翻译、屏幕 OCR、视觉问答五大核心能力整合在同一个应用里,体积小巧、运行流畅,无需复杂配置,一台普通电脑就能稳定运行。

如今市面上的桌面 AI 工具种类不少,有的主打对话聊天,功能单一;有的专注 OCR 识别,缺少智能交互;还有的功能堆砌,安装包臃肿,老旧电脑根本带不动。Kivio 跳出了这类产品的固有问题,主打轻量化 + 全功能整合,定位屏幕级 AI Agent,深度适配桌面使用场景,所有操作围绕电脑屏幕展开,贴合用户日常操作习惯。它启动速度快,后台驻留几乎不占用内存,就算同时打开办公软件、浏览器,也不会出现延迟、闪退的情况。



主要功能特点
Kivio 最早是一个轻量屏幕翻译工具。现在它已经演进成一个小体积桌面 AI 客户端,内置 Agent 运行时:
- Kivio Agent:长对话、项目、助手、记忆、文件附件、MCP、Skill、本地工具。
- Lens:基于截图的视觉问答、OCR、公式提取、文本优化、联网来源回答。
- 快速翻译:输入文本、选中文本、窗口截图、屏幕区域都可以翻译。
- 自带模型选择权:支持 OpenAI 兼容接口、Anthropic Messages,以及按功能路由模型。
它常驻托盘或菜单栏,需要时再出现;比浏览器里的 AI 工作台更轻,也更贴近桌面操作。
- 桌面 Agent 工作区 —— 对话、项目、助手、文件/图片附件、本地记忆。
- 本地感很强的工具调用 —— 内置文件工具、终端执行、网页抓取/搜索、Pyodide
run_python、MCP 服务和内置 Skills。 - 文档分析可直接用 —— PDF、Word、Excel 工作流随包带 Pyodide 和常用数据/文档库,不依赖首次运行时临时从 CDN 下载。
- 屏幕优先 —— 选中文本翻译、截图 OCR、Lens 问公式/图表/报错/代码/UI。
- 模型路由 —— Chat、翻译、OCR、Lens、视觉预分析、标题总结、上下文压缩、图片生成都可以分别选模型。
- 供应商容灾 —— 多服务商、多 Key、失败重试、模型元数据、工具能力默认开启。
- 默认安静 —— 无遥测。API Key 和本地对话数据留在你的机器上。
Kivio Agent
Kivio Agent 是主要的桌面 AI 工作区:
- 对话和项目 —— 用项目组织聊天,侧边栏管理最近工作,每个对话可以切换模型。
- 助手中心 —— 创建可复用助手,配置提示词、工具预设和任务行为。
- 记忆 —— 本地维护记忆层,开启后注入 Chat 上下文。
- 附件 —— 发送图片和可读取的本地文件;图片对话可自动走视觉模型。
- 工具 —— 启用内置工具、MCP 服务、Skill 工作流、联网搜索/抓取、Pyodide Python。
- 工具审批 —— 写文件、改文件、运行命令等敏感动作保留确认;读取和分析类任务可以更顺畅地执行。
- 流式和思考 —— 渐进显示回答、思考块、工具卡片和错误信息,不丢上下文。
Lens 与翻译
Lens 仍然是从屏幕内容到答案的最快路径:
- 截取屏幕区域或窗口后,对看到的内容直接提问。
- 截图翻译使用系统 OCR:macOS 是 Apple Vision,Windows 是
Windows.Media.Ocr。 - 选中文本可直接翻译,不用截图。
- 遇到需要实时信息或外部上下文的问题,可选 Tavily / Exa 联网搜索。
- 保留截图历史和追问上下文,适合视觉对话。
模型与工具设置
重点设置项:
- 模型供应商 —— 服务商列表、API Key、启用模型、模型元数据、连接测试。
- 默认模型 —— Chat、翻译、截图翻译、Lens、视觉、标题总结、上下文压缩、图片生成都可单独设置。
- Mixer —— 把副任务交给更小或更专用的模型,主对话模型保持不变。
- 工具与扩展 —— 内置工具、MCP、Skill、联网搜索、Python 沙箱、工具轮次和审批策略。
- 记忆 —— 开启或编辑 Kivio Agent 使用的本地记忆层。
- 提示词 —— 调整各功能提示词和 Chat 基础系统提示词。

部分功能详解
轻量本体,低配置电脑也能流畅运行
Kivio 最大的亮点之一就是轻量化设计,这也是它区别于大型桌面 AI 软件的核心优势。安装包体积小巧,安装过程简单,没有捆绑插件、弹窗广告,几步操作就能完成部署。软件启动速度很快,点击图标几秒内即可进入主界面,后台静默运行时资源占用极低,笔记本、老旧台式机等低配置设备都能流畅使用。
它采用轻量化架构设计,摒弃冗余模块,聚焦桌面高频使用功能,不会在后台加载多余进程。长时间挂机、反复唤醒功能,也不会出现内存占用飙升、电脑卡顿的问题。对于办公人群、学生群体而言,无需为了使用 AI 工具特意升级设备,普通家用电脑就能满足全部使用需求。同时软件界面简洁清爽,布局一目了然,没有复杂的菜单层级,新手打开就能上手,不用花费时间学习操作逻辑。


智能 AI 聊天,多场景对话交互
AI 聊天是 Kivio 的基础核心功能,依托成熟的大模型能力,支持日常闲聊、文案创作、问题解答、思路梳理、代码辅助等多种对话场景。区别于网页端 AI,桌面端聊天窗口常驻桌面,随时唤醒,无需打开浏览器、登录网页,鼠标轻点就能发起对话。
对话支持上下文记忆,连续提问、延展话题时,模型可以关联前文内容,不会出现逻辑断层。写工作总结、演讲稿、朋友圈文案、学习笔记,或是咨询专业知识、梳理解题思路、修改文字内容,都可以直接在聊天窗口完成。同时支持文本一键复制、对话记录本地保存,重要内容不会丢失。针对办公人群,还能用来梳理工作流程、优化话术;学生可以用来解答学科疑问、整理知识点,实用性覆盖全人群。


全能工具集,覆盖桌面高频操作
作为屏幕级 AI Agent,Kivio 内置多款实用小工具,把日常零散的桌面操作整合到应用内,不用额外下载第三方工具。工具模块分类清晰,调用方式简单,从基础文本处理到进阶辅助功能,一站式满足需求。
文本处理方面,支持文字改写、语句润色、长短文互转、格式整理,复制粘贴文本后,一键就能完成优化,写文案、改文档效率大幅提升;快捷指令功能支持自定义常用命令,把 “精简文案”“优化语句”“生成提纲” 等高频需求保存为快捷指令,下次使用一键触发,省去重复输入文字的步骤。此外,工具模块还适配办公辅助需求,简单的数据整理、内容归纳都能快速完成,适配职场日常办公场景。


多语种翻译,屏幕全域翻译无压力
翻译是桌面使用的刚需功能,浏览外文网页、阅读英文文档、查看海外资料、处理外语文件,都离不开翻译工具。Kivio 内置独立翻译引擎,支持主流多国语言互译,包含中英、中日、中韩、小语种等,翻译准确度高,语句通顺,贴合日常用语与专业文档表达习惯。
它支持多种翻译模式,满足不同使用场景。手动输入文本翻译适合短句、段落翻译;粘贴整篇文档内容,也能快速完成全文翻译。结合屏幕级特性,软件支持屏幕划词翻译,鼠标选中屏幕上的外文文字,即可快速弹出翻译结果,浏览外文网页、软件界面时格外方便。翻译结果支持一键复制,可直接粘贴到文档、聊天框中,整个流程连贯顺畅。对比独立翻译软件,它无需单独启动,和聊天、OCR 功能联动使用,效率更高。


高清 OCR 文字识别,截图图片一键提字
很多时候我们遇到图片、截图、纸质文档扫描件,想要提取其中文字,手动打字费时费力,传统 OCR 工具又经常出现识别错乱、格式混乱的问题。Kivio 搭载高精度 OCR 识别模块,专门适配桌面截图、图片、电子文档等场景,识别准确率高,对印刷体、常规手写体、小字体都有不错的识别效果。
使用方式十分简单,启动 OCR 功能后,框选屏幕任意区域,软件自动截取画面并提取文字,全程几秒完成。识别后的文字会保留基础排版,减少后期格式调整的工作量,内容可直接编辑、复制、导出。不管是截取网页图文、软件弹窗文字、课件图片,还是识别证件、表格类内容,都能轻松应对。办公时提取报表文字、学习时整理课件内容、日常保存图片文案,这款功能都能发挥作用,彻底摆脱手动打字的麻烦。


视觉问答,屏幕内容智能解读
这是 Kivio 极具特色的屏幕级 Agent 核心功能,也是普通聊天工具、翻译工具不具备的能力。依托视觉问答技术,软件可以 “看懂” 屏幕画面,针对截图、图片、图表、界面内容发起提问,AI 结合画面内容给出精准解答。
日常使用中,遇到看不懂的图表、数据分析图,截取画面后提问,AI 会拆解图表含义、解读数据趋势;看到陌生的界面、报错弹窗,截图询问就能得到问题解析和解决办法;学习时遇到习题图片、知识点配图,可直接让 AI 讲解题目、梳理知识点。该功能打通了 “视觉内容 + 智能问答” 的壁垒,不再局限于纯文字交互,真正实现和整个桌面屏幕联动。对于职场数据分析、学生刷题学习、技术人员排查问题,都能提供不小的帮助。

联动协同,多功能无缝衔接
Kivio 最核心的设计逻辑,就是实现各大功能无缝联动,打造闭环使用体验。OCR 提取文字后,可直接跳转翻译功能完成语种转换,或是发送到 AI 聊天窗口进行润色、解读;翻译后的文本,能借助工具模块整理格式;视觉问答得到的结论,可一键保存为文字记录。
所有功能集成在同一个窗口内,模块之间切换流畅,没有卡顿和加载延迟。从 “截图提字→翻译解读→文案优化→保存记录”,整套流程无需切换任何软件,在 Kivio 内部就能完成。这种一体化的设计,完美适配碎片化的桌面操作,大幅减少操作步骤,提升整体使用效率,这也是多软件组合无法比拟的优势。
隐私可控,本地运行更安心
针对大家关心的隐私问题,Kivio 充分考虑桌面端使用的安全性。核心操作、截图识别、本地文本处理等环节,支持本地运算,敏感的办公文档、个人截图、私密对话内容,不会随意上传至云端。软件没有后台偷跑、数据收集等行为,对话记录、识别内容仅保存在本地设备中,用户可手动清理记录,自主掌控数据安全。
日常处理合同、个人证件、私密工作内容时,不用担忧信息泄露,兼顾实用性与安全性,适合注重隐私保护的用户使用。
更新日志
v2.6.8
- 新增主题色预设:保留浅色/深色模式的同时,可以切换应用强调色。
- 新增项目工作区文件系统能力,Kivio Agent 可以更安全地读取和处理项目本地文件。
- 改进 Agent 工作流:新增计划模式、待办运行时、交互式追问,并增强工具执行稳定性。
- 改进 Chat 输出渲染:支持 Mermaid 图表,优化推理/时间线片段、浅色代码块和流式输出体验。
- 新增用量统计,并统一模型与设置页的显示体验。
- 提升网页抓取可靠性,优化助手中心的项目与侧边栏交互。
- 优化 Windows 无边框 Chat 窗口,恢复更接近原生应用的圆角、描边和窗口行为。
- 精简随包 Python/Pyodide 沙箱,同时保留 PDF、Excel、图表和 Python 分析常用离线库。
- 新增
pypdfPDF 文本提取支持,并保留 Python 生成图表/图片所需的 CJK 字体。 - 调整发布流程:Apple Silicon macOS DMG 由本机打包上传,GitHub Actions 只发布 Windows NSIS
.exe安装包。
获取方式
官方网站
https://github.com/ZMGID/kivio
