OpenWhispr – 开源的AI桌面语音输入工具

AI软件11小时前更新 J.Cling
2 0

OpenWhispr 是一款基于 OpenAI Whisper 开发的开源免费的桌面语音输入工具,支持随时随地用语音快速输入文字,提供本地和云端两种处理模式,既能保护隐私又能追求速度。通过全局快捷键即可启动录音,说完后自动转成文字并粘贴到光标位置的输入框,同时集成了 GPT-5、Claude Opus 4.1、Gemini 2.5 等最新 AI 模型,可以直接语音下达指令让 AI 帮我们处理文字,还提供了可拖动的悬浮面板,不遮挡我们本省的工作区域,所有历史数据存储在本地,隐私安全。

J.Cling 推荐拓展:


主要功能特点

  • 🎤 全局热键 :可自定义热键,在任何位置启动/停止语音转写(默认:反引号 `)
  • 🤖 多提供商 AI 处理 : 可选择 OpenAI、Anthropic Claude、Google Gemini 或本地模型
  • 🎯 代理命名 : 为您的 AI 助手设置自定义名称,实现自然交互
  • 🧠 最新 AI 模型 (2025 年 9 月):
    • OpenAI: GPT-5 系列、GPT-4.1 系列、o 系列推理模型(o3/o4-mini)
    • Anthropic: Claude Opus 4.1, Claude Sonnet 4, Claude 3.5 Sonnet/Haiku
    • Google: Gemini 2.5 Pro/Flash/Flash-Lite 具备思考能力, Gemini 2.0 Flash
    • 本地 : Qwen, LLaMA, Mistral 模型通过 llama.cpp
  • 🔒 隐私优先 : 本地处理确保您的语音数据完全私密
  • 🎨 现代 UI: 使用 React 19、TypeScript 和 Tailwind CSS v4 构建
  • 🚀 快速 : 使用 Vite 和现代工具优化
  • 📱 控制面板 : 管理设置、查看历史记录、配置 API 密钥
  • 🗄️ 转录历史 : SQLite 数据库在本地存储所有转录内容
  • 🔧 模型管理 : 下载和管理本地 Whisper 模型(tiny、base、small、medium、large、turbo)
  • 🧹 模型清理 : 一键删除缓存的 Whisper 模型,并使用卸载钩子保持磁盘整洁
  • 🌐 跨平台 : 支持 macOS、Windows 和 Linux
  • ⚡ 自动粘贴 : 识别的文本自动粘贴到您的光标位置
  • 🖱️ 可拖动界面 : 将语音输入面板移动到屏幕上的任何位置
  • 🔄 OpenAI 响应 API: 使用最新的响应 API 以提升性能
  • 🌐 地球键切换 (macOS): 可选的 Fn/地球键监听器,用于硬件级别的语音输入触发

官方使用说明

基本听写

  1. 启动应用 – 一个可拖动的小面板会出现在你的屏幕上
  2. 按下你的热键 (默认:反引号 `)- 开始听写(面板显示录音动画)
  3. 再次按下热键 – 停止听写并开始转录(面板显示处理动画)
  4. 文本出现 – 转录的文本将自动粘贴到您的光标位置
  5. 拖动面板 – 点击并拖动以将听写面板移动到屏幕上的任何位置

控制面板

  • 访问 : 右键点击托盘图标(macOS)或通过系统菜单
  • 设置 : 选择本地或云端处理
  • 历史 : 查看、复制和删除过去的转录内容
  • 模型 : 下载和管理本地 Whisper 模型
  • 存储清理 : 从缓存中删除下载的 Whisper 模型以释放空间
  • 设置 : 配置 API 密钥,自定义热键,和管理权限

卸载 & 缓存清理

  • 应用内 : 使用 设置 → 语音转文本处理 → 本地模型存储 → 删除已下载模型 来清除 ~/.cache/openwhispr/models (或 Windows 上的 %USERPROFILE%\.cache\openwhispr\models )。
  • Windows 卸载 : NSIS 卸载程序会自动删除相同的缓存目录。
  • Linux 软件包 deb/rpm 卸载后脚本也会移除缓存模型。
  • macOS: 如果手动卸载,可选择删除 ~/Library/Caches 或 ~/.cache/openwhispr/models

代理命名 & AI 处理

设置好代理名称后,您可以使用多个 AI 提供商与其交互:

🎯 代理指令 (用于 AI 辅助):

  • “嘿[代理名],让它更专业”
  • “嘿 [AgentName],将这个格式化为列表”
  • “嘿 [AgentName],写一封感谢邮件”
  • “嘿 [AgentName],将这个转换为项目符号”

🤖 AI 提供商选项 

  • OpenAI:
    • GPT-5 系列(Nano/Mini/全尺寸)- 最新一代,具备深度推理能力
    • GPT-4.1 系列 – 增强编码能力,支持 1M token 上下文
    • o3/o4 系列 – 高级推理模型,具备更长的思考能力
  • Anthropic: Claude Opus 4.1, Sonnet 4 – 前沿智能模型
  • Google: Gemini 2.5 Pro/Flash – 高级多模态功能
  • 本地 : 社区模型,完全保护隐私

📝 普通语音转文字 (用于普通文本):

  • “这只是我想转写的普通文本”
  • 会议记录:约翰提到了季度报告
  • 亲爱的莎拉,感谢你的帮助

AI 会自动检测你是下达指令还是进行普通文本输入,并从最终输出中移除代理名称的引用。

处理选项

  • 本地处理 :
    • 通过控制面板自动安装 Whisper
    • 下载模型:tiny(最快)、base(推荐)、small、medium、large(最佳质量)
    • 完全隐私 – 音频不会离开您的设备
  • 云端处理 :
    • 需要 OpenAI API 密钥
    • 处理速度更快
    • 使用 OpenAI 的 Whisper API

更新日志

v1.0.11

  • 现在您可以使用自定义端点进行推理清理。

获取方式

官方网站

https://github.com/HeroTools/open-whispr

https://openwhispr.com

网盘下载

https://pan.quark.cn/s/7bd178c3195a

更多办公输入软件请访问:

https://www.gewuzhizhi.vip/software-store/all-software-store/libreoffice

© 版权声明

相关文章