AI Media2Doc – 一键将音视频转化为小红书/公众号等各种风格文档

AI软件17小时前更新 J.Cling
6 0

AI Media2Doc AI视频图文创作助手 是一款开源免费的 Web 工具,,基于 AI 大模型,支持一键将视频和音频转化为小红书/公众号/知识笔记/思维导图/视频字幕等各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。

开发者“AI 视频创作助手源于我年初的一个想法, 作为一个喜欢阅读的人, 我更希望将一些视频内容转化为文字, 方便我进行二次阅读思考和总结记录笔记, 但市面上并没有一个好的工具来实现这个想法, 大多数工具都需要登录和付费, 我不太想在互联网上注册过多的账号, 同时也不想将自己想要总结的内容上传至除了云厂商之外的第三方平台,因此我开发了这个小应用,MIT 协议, 任何人都可以以极低的成本去体验音视频转文本。”

J.Cling 推荐拓展:

主要功能特点

  • ✅ 完全开源:MIT 协议授权,支持本地部署。
  • 🔒 隐私保护:无需登录注册,任务记录保存在本地
  • 💻 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg
  • 🎯 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。
  • 🤖 AI 对话:支持针对视频内容进行 AI 二次问答。
  • 🎬 支持字幕导出: 结果一键导出为字幕文件。
  • 🖼️ 智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。
  • 🎨 支持自定义 Prompt:支持在前端自定义配置 prompt。
  • 🐳 一键部署:支持 Docker 一键部署。
  • 🔒 支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。

官方使用说明

全新设计的首页, 尽力之作


更加简洁的加载页


全新功能: 支持智能截图并插入到文中对应位置(本地方案, 无需视觉大模型, 0成本)

开启方式, 点击自定义设置->智能截图 选择打开。


全新设计的结果页, 支持一键导出为字幕。


支持自定义 prompt


可基于视频内容进行 AI 二次对话


官方使用说明

📦 docker 本地一键部署

0️⃣:安装 docker, 这个网上有教程

1️⃣:镜像构建, 在项目根目录下执行:

$ make docker-image

2️⃣:参考variables_template.env 在项目根目录下生成 variables.env 文件。 请根据 后端部署指引 / 配置项说明 完善 variables.env 文件中的环境变量。

3️⃣:运行项目,在项目根目录下执行:

$ make run

更新日志

v0.6.1

  • 新增后端连通性测试 && 任务开启之前允许添加备注

获取方式

官方网站

https://github.com/hanshuaikang/AI-Media2Doc

网盘下载

https://pan.quark.cn/s/80e2ee1bd440

更多AI软件请访问:

https://www.gewuzhizhi.vip/software-store/all-software-store/ai-software

© 版权声明

相关文章