iLab GPT Conjure – GPT image 2 绘图工具推荐｜自带素材库与任务队列无需搭建

做 AI 绘图、设计、短视频素材、IP 人设创作的朋友，大概率都踩过同一个大坑：只拿到 GPT-image-2 基础调用页面，只能单次输入提示词生成，完全没有配套生产工具。次批量作图要反复复制粘贴提示词，参考图存满电脑文件夹找不到，生成失败只能重新跑一遍，过往作品散落在硬盘各处，想复用模板、角色素材还要重新整理，折腾大半天，大半时间都浪费在重复操作上。

市面上主流绘图 WebUI 大多适配 Stable Diffusion，专门针对 GPT-image-2 做完整工作流的工具少之又少。简单套一层 OpenAI API 的页面，功能单薄，完全撑不起长期批量创作；ComfyUI 自定义流程强大，但对新手不够友好，素材库、提示词模板、任务队列这些实用功能需要自己搭建，上手门槛很高。

最近一直在用 iLab GPT Conjure，算是补齐了 GPT-image-2 本地绘图所有短板，定位类似轻量化生产版 ComfyUI，把素材复用、批量任务、历史归档、图像编辑全部整合在可视化 WebUI 里，同时配套 CLI 命令行满足自动化需求，不管是零基础创作者，还是做批量素材的设计师、开发都能直接上手。当前最新稳定版本 v0.5.2，开源协议 AGPL-3.0，还有免安装便携一键包，解压就能启动，不用复杂配置环境。

先聊聊普通 GPT-image-2 绘图页面，绕不开的几大痛点

很多人直接用官方 API 简易页面或者零散网页工具作图，长期使用会暴露一堆硬伤，也是我换 iLab GPT Conjure 最核心的原因。

1. 无本地素材库，参考图杂乱难复用：角色设定、产品参考、风格样图只能零散存在本地文件夹，每次生成都要重新上传，反复拖拽浪费时间，没有分类检索、快速引用功能。

2. 不支持多任务并发，只能单张排队生成：一次只能提交一组绘图任务，批量制作封面、人设、场景图需要逐个提交，中途网页关闭任务直接丢失，失败无法自动重试。

3. 提示词无模板、片段复用机制：常用风格、人物描述、构图关键词每次都要手动输入，无法保存成套模板，修改同类画面只能全量复制，调整效率极低。

4. 生成记录无统一归档，历史图难以检索：所有出图直接下载到本地，没有分页历史库，无法通过提示词、任务 ID、时间筛选过往作品，想要二次编辑、重新生成只能重新上传原图。

5. 两种接入模式难以兼顾，团队 / 个人需求割裂：简易工具仅支持 API 调用，想要本机 Codex OAuth 通道没有配套可视化界面；支持 OAuth 的工具又缺少稳定 API 适配，团队多人共用工作站完全不适用。

6. 环境部署繁琐，新手门槛高：源码部署需要手动配置 Python、前端依赖，不懂命令行很难启动；多数工具没有便携打包版本，换电脑就要重新搭建整套环境。

这些生产环节的短板，iLab GPT Conjure 全部针对性优化，不堆砌花哨功能，每一项设计都贴合长期批量绘图的真实场景，开箱即用，不用额外安装插件、搭建组件。

主要功能特点

面向 GPT-image-2 的文生图、参考图生成和图像编辑工作流。
支持 Codex Image、Codex Responses 和 OpenAI 兼容 API 接入；公开或共享使用优先选择 API 模式。
多任务并发、本地队列状态、分页历史库、缩略图和结果归档。
独立 /history 页面支持 SQLite 分页、搜索、筛选、网格/列表视图和懒加载详情。
Codex Responses 和 API Responses 生图可选启用联网搜索；生成页和历史库搜索支持提示词与任务 ID，并可命中历史任务。
单任务多图输出、部分失败处理和失败重试。
公用图库、最近参考图、颜色 chip、提示词片段 chip 和提示词模板。
图像编辑器支持插入输入框里的其他图片、多图层组合、默认锁定比例变换、 Shift 自由变换、局部擦除和真实图层缩略图。
系统设置提供语言下拉菜单，支持简体中文、正體中文、繁体中文、日语、韩语、English、西班牙语、葡萄牙语、法语、德语、俄语、意大利语和印地语；首次启动自动跟随浏览器语言，手动选择后偏好保存在当前浏览器。
系统设置整合 API 设置、Codex 通道、语言 / Language、存储与通知四个 Tab；API 设置默认第一位。
API 供应商以卡片快速选择，默认只读详情，支持显式编辑、复制、删除确认和多供应商排序。
免安装一键包启动脚本只负责本地启动；更新脚本需手动运行，会校验 SHA256、保留 data/，并把被替换文件备份到 .backup/。
高级本机 OAuth 工作流支持个人本地 Codex 使用，并明确提示接口风险。
API 供应商配置，支持 Base URL、API Key、图像模型、调用方式和并发上限。
CLI 支持生成、参考图、图像编辑、mask 和 dry-run。

双模式接入通道，兼顾个人本机与团队稳定生产

工具提供两套独立认证通道，按需选择，适配不同使用场景。

推荐优先使用 OpenAI 兼容 API 模式，适合团队协作、长期商用、公开工作站部署。在系统设置卡片填入服务商 Base URL、API Key、目标图像模型，可添加多供应商自由切换，支持自定义并发上限，接口稳定、不易失效，完全符合生产环境使用标准。

另一套是高级本机 Codex OAuth 模式，仅适合个人本地创作。复用本机 ChatGPT 登录态调用内部生图接口，可在设置中切换 Image/Responses 双通道，但官方明确提示该模式接口存在变更、失效风险，不建议商用、多人共享使用。

本地公用素材图库，永久留存参考图，一键快速引用

这是我日常创作使用频率最高的功能，彻底解决参考图杂乱的问题。

所有上传图片、生成结果、本地素材全部保存在本机 data 目录，不会上传云端。图库支持自定义分类、命名、添加用途备注，拖拽调整排序；写提示词时输入 @符号，就能检索图库图片一键插入作为参考图，自动同步至输入框。

不管是固定 IP 人设、产品实拍图、风格参考插画，都能长期收纳，下次作图不用重复上传。删除图库素材不会清理历史生成记录，过往任务依旧保留图片路径，素材管理逻辑清晰省心。

三类快捷 Chip + 完整提示词模板库，大幅缩减输入成本

提示词编辑器内置三种原子快捷片段，不用反复复制文字：

@图库 Chip：快速调取图库参考图，自动附加参考描述给模型；
#颜色 Chip：插入十六进制色值，精准把控画面主色调，适合海报、商品图创作；
~ 提示词片段 Chip：收藏短句关键词，输入波浪号一键插入，编辑器仅展示标签，提交模型自动展开完整文本。配套独立模板库，可保存成套长提示词结构，支持新建、编辑、导入导出、分类收藏，还能关联生成缩略图方便识别。插入模板直接覆盖 / 追加当前提示词，批量做同系列画面时，只需要微调少量参数，不用重复搭建整套描述。

多任务并发本地队列，失败自动重试，批量作图不用守着

支持一次性提交多组绘图任务，本地独立队列有序运行，关闭 WebUI 页面后台依旧执行任务。单任务支持批量输出多张图片，遇到接口报错、网络中断会自动重试，部分生成失败不会清空整组任务，已完成图片自动归档保存。

左侧任务面板实时展示排队、运行、完成任务状态，右侧预览区可直接对成品图精选、下载、打包、二次编辑；独立 /history 分页历史库采用 SQLite 本地存储，支持分页懒加载、关键词 / 任务 ID 检索，网格、列表双视图切换，海量历史图也能快速定位。

内置多层图像编辑器，支持参考图融合、局部擦除、自由变换

不用切换 PS、绘图软件，在工作台内直接完成图像编辑、重绘工作流。编辑器支持多图层叠加，插入多张参考图组合构图，默认锁定等比例缩放，按住 Shift 可自由调整尺寸；自带局部擦除蒙版，精准修改画面局部区域。

生成、编辑完成的图片可一键存入公用图库，形成完整闭环，从构思、绘图、修改到素材留存全程在工具内完成，无需来回切换软件。

多语言适配 + 轻量化便携一键包，新手零门槛部署

系统设置内置多语言切换，覆盖简繁中文、日韩、欧美十余种语言，首次启动自动跟随浏览器语言，手动选择后本地保存偏好。

项目提供免安装 portable 便携包，Windows、macOS（ARM/Intel 双版本）分平台打包，内置完整 Python 运行环境、所有依赖、前端静态资源，下载解压双击启动脚本即可打开 WebUI，地址默认 [127.0.0.1:8787](127.0.0.1:8787)。

更新也十分便捷，运行配套更新脚本，自动校验文件 SHA256 校验码，保留本地图库、历史记录 data 文件夹，替换文件自动备份至.backup 目录，不会丢失个人素材。

WebUI 可视化 + CLI 命令行双端，兼顾普通用户与自动化需求

非技术创作者直接使用可视化网页操作，全图形界面，参数、素材、任务一目了然；开发人员可使用配套 CLI 工具，支持文生图、参考图生成、蒙版编辑、试运行 dry-run 等指令，搭配脚本实现批量自动出图，适配本地自动化工作流。

底层技术栈基于 Python3.11+FastAPI，前端使用 TS/CSS 开发，源码开源可二次修改，内置完整单元测试脚本，CI 流程自动校验代码稳定性。

长期使用真实体验，大幅提升批量绘图效率

我平时做短视频封面、产品宣传图、人物 IP 设定，单次批量生成几十张素材，之前用简易 API 页面，完整流程至少两小时，切换 iLab GPT Conjure 之后，半小时就能完成整套素材产出。

公用图库收纳了几十套角色、产品参考图，写提示词直接调用，省去重复上传步骤；成套模板保存不同风格构图描述，切换系列画面只修改主体关键词；多任务队列后台自动运行，不用守在电脑前等待，中途关闭页面也不会丢失任务，失败自动重试，不用反复手动提交。

所有生成记录本地归档，想要复用之前的画面风格，直接在历史库检索，一键调取原图、配套提示词二次生成，用重新构思描述。便携包换电脑直接拷贝文件夹，所有素材、模板、历史记录完整迁移，不用重新配置 API、上传参考图。

对比 ComfyUI，它不用手动搭建节点流程，开箱即用，素材、模板、队列功能原生内置；对比简易 API 网页，补齐生产所需全套配套工具，不是单纯的提示词输入框，而是完整本地绘图工作台，真正适配长期批量使用 GPT-image-2 的创作者。

实用使用小技巧

1. 素材分类管理：将人设、产品、场景参考图分文件夹存入图库，标注用途备注，批量创作同系列素材时检索效率翻倍；

2. 模板分层保存：拆分基础风格、构图、主体三类提示词模板，搭配 Chip 片段自由组合，适配不同创作需求；

3. 批量自动化：高频固定绘图流程编写 CLI 脚本，一键批量生成整套素材，解放手动重复操作；

4. macOS 启动避坑：苹果芯片便携包解压后如遇系统拦截，执行移除隔离命令，或右键启动脚本选择打开；

5. 数据备份：定期复制根目录 data 文件夹，图库、历史生成图、模板全部存在此处，避免文件丢失；

6. 商用稳定优先：团队工作站、商用批量作图统一使用 OpenAI 兼容 API 通道，规避 OAuth 接口失效风险。

更新日志

v0.5.2

当前版本：v0.5.2。这个版本提供 Windows x64、macOS Apple Silicon、macOS Intel 三种免安装一键包；下载对应平台的 zip 后解压即可启动本地 WebUI，并可手动运行包内更新脚本升级到后续版本。

本版重点：这一版主要发布多语言界面和输入图像画布编辑能力。WebUI 增加语言设置下拉菜单和多语言字典，输入图片编辑器升级为可插入多张输入图、调整画布范围、缩放旋转和局部擦除的多图层编辑器；同时修复任务状态同步和公用图库窄卡片操作区溢出问题。

本版详情：

多语言界面：语言设置改为下拉菜单，第一次启动会按浏览器语言自动选择，手动选择后即时生效并记住偏好；已加入简体中文、正體中文、繁体中文、日本語、한국어、English、Español、Português、Français、Deutsch、Русский、Italiano 和 हिन्दी。
语言入口可找回：语言设置放在独立 Tab，Tab 标题保留当前语言文案和 English 提示，避免用户切错语言后找不到入口；右上角中英文切换按钮已移除。
输入图像画布编辑：编辑输入图片时可插入输入框里的其他一张或多张图片，进行多图组合、选择移动、缩放旋转、局部擦除和图层排序，编辑后保存为一张输入图。
画布范围控制：新增“首图范围 / 适应图层”画布范围选择；既可以保持第一张输入图的尺寸，也可以按全部图层自动扩展画布，适合把多张参考图拼成一张更大的编辑输入图。
图层和变换体验：图层列表显示真实缩略图；图片变换默认锁定长宽比例，按住 Shift 才自由变换；箭头和擦除等工具改进实时反馈，减少绘制延迟感和错位感。
公用图库溢出修复：合入 PR #3 的窄宽度卡片修复，图库卡片、标题、说明和操作按钮都允许收缩并使用省略显示，极窄容器下操作按钮自动变为单列，避免抽屉变窄时按钮挤出卡片。
任务状态同步：修复已生成结果但左侧任务列表仍显示“生成中”的状态不同步问题，任务状态、输出槽位和历史详情以真实可显示结果为准更新。
前端依赖与测试：图层编辑器使用 Konva，package-lock.json 锁定对应 npm 依赖；前端资源版本提升到 runtime-368，静态测试覆盖多语言字典、语言下拉菜单、输入图像画布范围、图层缩略图、图库卡片窄宽度按钮溢出和任务状态同步，降低后续回归风险。
完整版本说明见 RELEASES.md。