Voquill 是一款免费、开源、注重隐私的桌面语音输入软件,用户通过说话快速输入文字,并支持在任意应用程序中使用。它集成了本地运行的语音识别引擎(如 Whisper)和可选的云端 AI 服务(如 Groq),能将语音实时转为文本,并提供自动清理填充词、自定义术语替换、全局热键唤起等功能。所有语音数据默认在本地处理,无需联网即可使用,充分保障用户隐私。
需求分析
程序员:口述注释或函数逻辑,减少手部劳损;作家/记者:快速记录灵感或采访内容;学生:语音整理课堂笔记或论文草稿;无障碍用户:替代键盘输入,提升数字包容性;多语言工作者:利用 Whisper 多语种支持,处理跨语言内容。
J.Cling 推荐拓展:
- 豆包输入法 – 豆包同款语音输入法
- OpenWhispr – 开源的AI桌面语音输入工具
- FluidVoice – 苹果MacOS开源AI语音转文字工具
- 小企鹅输入法 – 注重隐私保护的开源免费安卓输入法
- 万象拼音输入法 – 替换搜狗输入法,基于Rime输入法引擎开发
- Sokuji – AI实时语音翻译工具|会议、英文学习、直播等
- 闪电说 – 端侧优先AI语音输入法|内置本地语音模型

主要功能特点
1. 全系统语音输入,支持任意应用
Voquill 的核心优势在于其全局输入能力。通过系统级集成(如 macOS 的输入法框架、Windows 的文本注入机制),用户可在 Word、微信、浏览器、代码编辑器等任何可输入文字的程序中唤出语音面板,直接口述内容并插入。无需切换窗口或复制粘贴,真正实现“在哪说,就在哪出字”。
2. 本地语音识别,保障隐私安全
默认采用开源的 Whisper 模型(由 OpenAI 发布)在本地设备运行,语音音频不上传至任何服务器,所有识别过程在用户电脑完成。即使在无网络环境下,也能正常使用。对于处理敏感信息(如医疗记录、商业文档、个人日记)的用户,这一特性至关重要。
3. 可选高性能云端识别(需 API 密钥)
若用户追求更快的识别速度或更高准确率,可配置使用 Groq 提供的托管 Whisper 服务(需自行申请 API 密钥)。此时语音会加密传输至 Groq 服务器处理,适合对实时性要求较高的场景。用户可自由切换本地/云端模式,按需选择。
4. AI 后处理:自动清理口语冗余
人们说话常带“嗯”“啊”“那个”等填充词,或重复修正(如“明天——不,后天开会”)。Voquill 内置 AI 文本后处理管道,可自动识别并清理这些冗余内容,输出更接近书面语的干净文本,减少后期编辑负担。
5. 个人术语库:精准识别专业词汇
用户可创建自定义术语表,例如将“Qwen”始终识别为“通义千问”,或将“LSTM”正确拼写而非听成“L-S-T-M”。该功能对技术、医学、法律等专业领域用户尤为实用,显著提升特定名词的识别准确率。
6. 灵活唤起方式:热键 + 覆盖层
- 全局热键:设置快捷键(如 Ctrl+Shift+V),随时启动语音输入;
- 浮动覆盖面板:点击桌面小图标即可呼出,支持拖拽、置顶;
- 静音/暂停控制:说话中途可临时禁用,避免误录。
这些设计兼顾效率与控制,适应不同使用习惯。
7. 跨平台一致体验
基于 Tauri 框架开发,Voquill 在 Windows、macOS 和 Linux 上提供几乎一致的功能与界面。开发者还为各平台定制了原生集成方案(如 Linux 的 GTK 支持、Windows 的 MSVC 兼容),确保稳定运行。
8. 开源透明,社区驱动
项目代码完全公开于 GitHub(josiahsrc/voquill),采用 AGPLv3 开源协议,允许用户审查、修改或自行构建。社区活跃,持续优化模型加载速度、GPU 加速支持(如 Vulkan)及多语言识别能力。
9. 离线可用,资源可控
用户可手动下载不同大小的 Whisper 模型(tiny、base、small、medium 等),根据设备性能权衡速度与精度。低配电脑可选小型模型实现流畅运行,高端设备则可启用 GPU 加速提升响应速度。
更新日志
v0.0.244
- 该应用程序现在支持简体中文,扩展了偏好使用这种语言的用户的可访问性。
- 增强的日志功能提供了对登录活动的更深入了解,提高了安全性和用户体验。
- 各种改进和错误修复。
获取方式
官方网站
https://github.com/josiahsrc/voquill
网盘下载
https://pan.quark.cn/s/2312beccbad1
更多办公输入软件请访问:
https://www.gewuzhizhi.vip/software-store/all-software-store/libreoffice
★★★ 强烈推荐 ★★★ 点击下图,500+常用办公精品软件一键直达!
