KrillinAI 是由 Krillin AI 开发的多功能音视频本地化和增强解决方案,这个极简而强大的工具集成了视频翻译、配音和语音克隆,支持横屏和竖屏格式,确保在所有主要平台(Bilibili、小红书、抖音、微信视频、快手、YouTube、TikTok 等)上完美呈现。通过端到端的工作流程,您只需几次点击即可将原材料转化为精美的跨平台内容。
主要功能特点
- 🎯 一键启动:无需复杂的环境配置,自动安装依赖,立即可用,提供新的桌面版本以便于访问!
- 📥 视频获取:支持 yt-dlp 下载或本地文件上传
- 📜 准确识别:基于 Whisper 的高精度语音识别
- 🧠 智能分段:使用 LLM 进行字幕分段和对齐
- 🔄 术语替换:一键替换专业词汇
- 🌍 专业翻译:基于上下文的 LLM 翻译,保持自然语义
- 🎙️ 语音克隆:提供 CosyVoice 中选择的语音音调或自定义语音克隆
- 🎬 视频合成:自动处理横屏和竖屏视频及字幕布局
- 💻 跨平台:支持 Windows、Linux、macOS,提供桌面和服务器版本


官方使用说明
🔍 支持的语音识别服务
服务来源 | 支持的平台 | 模型选项 | 本地/云 | 备注 |
---|---|---|---|---|
OpenAI Whisper | 所有平台 | – | 云 | 速度快,效果好 |
FasterWhisper | Windows/Linux | tiny /medium /large-v2 (推荐 medium+) | 本地 | 速度更快,无云服务费用 |
WhisperKit | macOS(仅限 M 系列) | large-v2 | 本地 | 针对 Apple 芯片的本地优化 |
WhisperCpp | 所有平台 | large-v2 | 本地 | 支持所有平台 |
Alibaba Cloud ASR | 所有平台 | – | 云 | 避免中国大陆的网络问题 |
🚀 大语言模型支持
兼容所有符合 OpenAI API 规范 的云/本地大语言模型服务,包括但不限于:
- OpenAI
- Gemini
- DeepSeek
- 通义千问
- 本地部署的开源模型
- 其他兼容 OpenAI 格式的 API 服务
🎤 TTS 文本转语音支持
- 阿里云语音服务
- OpenAI TTS
语言支持
- 支持的输入语言:中文、英语、日语、德语、土耳其语、韩语、俄语、马来语(持续增加中)
- 支持的翻译语言:英语、中文、俄语、西班牙语、法语及其他 101 种语言
更新日志
v1.4.0
优化(Optimization)
- 更好的时间戳匹配算法
- Better timestamp matching algorithm
- 更新部分界面文本和布局,修改导航项及按钮标签
- Update some UI text and layout, modify navigation items and button labels
修复 (Fix)
- 修复原本在 Windows 下 edge-tts 的下载错误
- Fix the download error of edge-tts on Windows
获取方式
官方网站
https://github.com/krillinai/KrillinAI
网盘下载
https://pan.quark.cn/s/4aa9ca60a7aa
更多媒体影音请访问:
https://www.gewuzhizhi.vip/favorites/multimedia
★★★ 强烈推荐 ★★★ 点击下图,500+常用办公精品软件一键直达!
© 版权声明
文章版权归作者所有,未经允许请勿转载。