Chatterbox TTS – 本文本转语音,无需训练即可模仿任何声音

AI软件17小时前更新 J.Cling
2 0

Chatterbox TTS 是一款开源免费的一个号称与 ElevenLabs 相媲美的开源 TTS 模型,基于 0.5B Llama 架构训练,不仅支持零样本语音克隆,还独创了情感夸张控制功能,能够让合成语音更生动有趣。同时 Chatterbox TTS 目前模型以及部署代码已经开源,也可以在 Hugging Face 上体验,有需要的同学可以试试。

J.Cling 推荐拓展:

主要功能特点

  • 零样本文本转语音,无需训练即可模仿任何声音
  • 情感夸张控制,可调节语音的戏剧化程度
  • 超稳定对齐推理,确保输出质量始终如一
  • 内置声音转换脚本,轻松实现声音克隆
  • 内置 PerTh 水印保护,防止恶意使用
  • 在盲测中击败 ElevenLabs,质量有保障

更新日志

v0.1.2

  • 在 mac M* 上的示例用法
  • 由 in #57 更新 Readme 致谢
  • 功能:通过 在 #35 中添加 cpu mps 支持
  • 通过 在 #75 中将 discord 添加到自述文件
  • 通过 在 #81 中将模型从 pt 更新为 safetensors
  • 通过 在 #80 中可选地应用 CFG
  • 修复 CUDA 错误 #72 由 在 #114
  • 功能:更新示例脚本,添加示例 wav,添加有关水印和 VC 模型中 safetensor 的信息,作者: in #82
  • 更新 Discord 加入链接,作者: in #131
  • 澄清操作系统与 Python 版本;调整依赖项,作者: in #138
  • 启用 Min_P 采样器的使用,通过在 #155 中修改其他采样器设置

获取方式

官方网站

https://github.com/resemble-ai/chatterbox

https://huggingface.co/spaces/ResembleAI/Chatterbox

网盘下载

https://pan.quark.cn/s/f872c3b32b7f

更多AI软件请访问:

https://www.gewuzhizhi.vip/software-store/all-software-store/ai-software

© 版权声明

相关文章