Voquill – 免费语音输入法|本地运行 Whisper|AI自动去除语气词

AI软件2天前更新 J.Cling
2 0

Voquill 是一款免费、开源、注重隐私的桌面语音输入软件,用户通过说话快速输入文字,并支持在任意应用程序中使用。它集成了本地运行的语音识别引擎(如 Whisper)和可选的云端 AI 服务(如 Groq),能将语音实时转为文本,并提供自动清理填充词、自定义术语替换、全局热键唤起等功能。所有语音数据默认在本地处理,无需联网即可使用,充分保障用户隐私。

需求分析

程序员:口述注释或函数逻辑,减少手部劳损;作家/记者:快速记录灵感或采访内容;学生:语音整理课堂笔记或论文草稿;无障碍用户:替代键盘输入,提升数字包容性;多语言工作者:利用 Whisper 多语种支持,处理跨语言内容。

J.Cling 推荐拓展:

主要功能特点

1. 全系统语音输入,支持任意应用

Voquill 的核心优势在于其全局输入能力。通过系统级集成(如 macOS 的输入法框架、Windows 的文本注入机制),用户可在 Word、微信、浏览器、代码编辑器等任何可输入文字的程序中唤出语音面板,直接口述内容并插入。无需切换窗口或复制粘贴,真正实现“在哪说,就在哪出字”。

2. 本地语音识别,保障隐私安全

默认采用开源的 Whisper 模型(由 OpenAI 发布)在本地设备运行,语音音频不上传至任何服务器,所有识别过程在用户电脑完成。即使在无网络环境下,也能正常使用。对于处理敏感信息(如医疗记录、商业文档、个人日记)的用户,这一特性至关重要。

3. 可选高性能云端识别(需 API 密钥)

若用户追求更快的识别速度或更高准确率,可配置使用 Groq 提供的托管 Whisper 服务(需自行申请 API 密钥)。此时语音会加密传输至 Groq 服务器处理,适合对实时性要求较高的场景。用户可自由切换本地/云端模式,按需选择。

4. AI 后处理:自动清理口语冗余

人们说话常带“嗯”“啊”“那个”等填充词,或重复修正(如“明天——不,后天开会”)。Voquill 内置 AI 文本后处理管道,可自动识别并清理这些冗余内容,输出更接近书面语的干净文本,减少后期编辑负担。

5. 个人术语库:精准识别专业词汇

用户可创建自定义术语表,例如将“Qwen”始终识别为“通义千问”,或将“LSTM”正确拼写而非听成“L-S-T-M”。该功能对技术、医学、法律等专业领域用户尤为实用,显著提升特定名词的识别准确率。

6. 灵活唤起方式:热键 + 覆盖层

  • 全局热键:设置快捷键(如 Ctrl+Shift+V),随时启动语音输入;
  • 浮动覆盖面板:点击桌面小图标即可呼出,支持拖拽、置顶;
  • 静音/暂停控制:说话中途可临时禁用,避免误录。

这些设计兼顾效率与控制,适应不同使用习惯。

7. 跨平台一致体验

基于 Tauri 框架开发,Voquill 在 Windows、macOS 和 Linux 上提供几乎一致的功能与界面。开发者还为各平台定制了原生集成方案(如 Linux 的 GTK 支持、Windows 的 MSVC 兼容),确保稳定运行。

8. 开源透明,社区驱动

项目代码完全公开于 GitHub(josiahsrc/voquill),采用 AGPLv3 开源协议,允许用户审查、修改或自行构建。社区活跃,持续优化模型加载速度、GPU 加速支持(如 Vulkan)及多语言识别能力。

9. 离线可用,资源可控

用户可手动下载不同大小的 Whisper 模型(tiny、base、small、medium 等),根据设备性能权衡速度与精度。低配电脑可选小型模型实现流畅运行,高端设备则可启用 GPU 加速提升响应速度。

更新日志

v0.0.244

  • 该应用程序现在支持简体中文,扩展了偏好使用这种语言的用户的可访问性。
  • 增强的日志功能提供了对登录活动的更深入了解,提高了安全性和用户体验。
  • 各种改进和错误修复。

获取方式

官方网站

https://github.com/josiahsrc/voquill

https://voquill.com

网盘下载

https://pan.quark.cn/s/2312beccbad1

更多办公输入软件请访问:

https://www.gewuzhizhi.vip/software-store/all-software-store/libreoffice

© 版权声明

相关文章