DocuTranslate – 本地AI翻译工具|精确识别表格、公式和代码块

AI软件4小时前更新 J.Cling
2 0

DocuTranslate 这个开源免费的本地文档翻译工具,能帮我们在文档结构原格式不变的情况下进行翻译,支持 PDF、Word、Excel、Markdown 等十余种文件格式,还能自动生成术语表保证翻译一致性,值得一提的是支持精确识别 PDF 中的表格、公式和代码块,并进行准确翻译。另外,提供大部分主流的 AI 模型供应商平台,允许自定义提示词,以及并发高性能 AI 翻译。

提供 Windows、Mac 整合包直接下载使用,也可通过 pip 安装,在局域网内还可以多人同时使用。

J.Cling 推荐拓展:


主要功能特点

  • ✅ 支持多种格式:能翻译 pdfdocxxlsxmdtxtjsonepubsrt 、ass等多种文件。
  • ✅ 自动生成术语表:支持自动生成术语表实现术语的对齐。
  • ✅ PDF表格、公式、代码识别:凭借doclingminerupdf解析引擎实现对学术论文中经常出现的表格、公式、代码的识别与翻译
  • ✅ json翻译:支持通过json路径(jsonpath-ng语法规范)指定json中需要被翻译的值。
  • ✅ Word/Excel保持格式翻译:支持docxxlsx文件(暂不支持docxls文件)保持原格式进行翻译。
  • ✅ 多ai平台支持:支持绝大部分的ai平台,可以实现自定义提示词的并发高性能ai翻译。
  • ✅ 异步支持:专为高性能场景设计,提供完整的异步支持,实现了可以多任务并行的服务接口。
  • ✅ 局域网、多人使用支持:支持在局域网中多人同时使用。
  • ✅ 交互式Web界面:提供开箱即用的 Web UI 和 RESTful API,方便集成与使用。
  • ✅ 小体积、多平台懒人包支持:不到40M的windows、mac懒人包(不使用docling本地解析pdf的版本)。

官方使用说明

  1. 选择工作流:根据您的输入文件类型(例如,PDF/Word 或 TXT)选择一个工作流,如 MarkdownBasedWorkflow 或 TXTWorkflow
  2. 构建配置:为所选工作流创建相应的配置对象(如 MarkdownBasedWorkflowConfig)。此配置对象包含了所有需要的子配置,例如:
    • 转换器配置 (Converter Config): 定义如何将原始文件(如PDF)转换为 Markdown。
    • 翻译器配置 (Translator Config): 定义使用哪个 LLM、API-Key、目标语言等。
    • 导出器配置 (Exporter Config): 定义输出格式(如HTML)的特定选项。
  3. 实例化工作流:使用配置对象创建工作流实例。
  4. 执行翻译:调用工作流的 .read_*() 和 .translate() / .translate_async() 方法。
  5. 导出/保存结果:调用 .export_to_*() 或 .save_as_*() 方法获取或保存翻译结果。

更新日志

v1.4.18

DocuTranslate.exe 支持minerU(在线)解析pdf文档(不需要本地解析pdf文档的下载这个就行)
需要使用docling本地解析pdf的下载DocuTranslate_full.exe 并解压docling_artifact.zip到DocuTranslate_full.exe同目录下

优化

  • 优化对文件名过长文件的处理
  • 提高术语表的稳定性

修复

  • 修复docx的译文附加模式时段落译文位置不正确的问题
  • 修复docx翻译时图片重复的问题
  • 修复xlsx工作流不能保留图片的问题

获取方式

官方网站

https://github.com/xunbu/docutranslate

网盘下载

https://pan.quark.cn/s/bd6c088a350a

更多AI软件请访问:

https://www.gewuzhizhi.vip/software-store/all-software-store/ai-software

© 版权声明

相关文章