iLab GPT Conjure – GPT image 2 绘图工具推荐|自带素材库与任务队列无需搭建

AI软件14小时前更新 J.Cling
8 0

做 AI 绘图、设计、短视频素材、IP 人设创作的朋友,大概率都踩过同一个大坑:只拿到 GPT-image-2 基础调用页面,只能单次输入提示词生成,完全没有配套生产工具。次批量作图要反复复制粘贴提示词,参考图存满电脑文件夹找不到,生成失败只能重新跑一遍,过往作品散落在硬盘各处,想复用模板、角色素材还要重新整理,折腾大半天,大半时间都浪费在重复操作上。

市面上主流绘图 WebUI 大多适配 Stable Diffusion,专门针对 GPT-image-2 做完整工作流的工具少之又少。简单套一层 OpenAI API 的页面,功能单薄,完全撑不起长期批量创作;ComfyUI 自定义流程强大,但对新手不够友好,素材库、提示词模板、任务队列这些实用功能需要自己搭建,上手门槛很高。

最近一直在用 iLab GPT Conjure,算是补齐了 GPT-image-2 本地绘图所有短板,定位类似轻量化生产版 ComfyUI,把素材复用、批量任务、历史归档、图像编辑全部整合在可视化 WebUI 里,同时配套 CLI 命令行满足自动化需求,不管是零基础创作者,还是做批量素材的设计师、开发都能直接上手。当前最新稳定版本 v0.5.2,开源协议 AGPL-3.0,还有免安装便携一键包,解压就能启动,不用复杂配置环境。

先聊聊普通 GPT-image-2 绘图页面,绕不开的几大痛点

很多人直接用官方 API 简易页面或者零散网页工具作图,长期使用会暴露一堆硬伤,也是我换 iLab GPT Conjure 最核心的原因。

1. 无本地素材库,参考图杂乱难复用:角色设定、产品参考、风格样图只能零散存在本地文件夹,每次生成都要重新上传,反复拖拽浪费时间,没有分类检索、快速引用功能。

2. 不支持多任务并发,只能单张排队生成:一次只能提交一组绘图任务,批量制作封面、人设、场景图需要逐个提交,中途网页关闭任务直接丢失,失败无法自动重试。

3. 提示词无模板、片段复用机制:常用风格、人物描述、构图关键词每次都要手动输入,无法保存成套模板,修改同类画面只能全量复制,调整效率极低。

4. 生成记录无统一归档,历史图难以检索:所有出图直接下载到本地,没有分页历史库,无法通过提示词、任务 ID、时间筛选过往作品,想要二次编辑、重新生成只能重新上传原图。

5. 两种接入模式难以兼顾,团队 / 个人需求割裂:简易工具仅支持 API 调用,想要本机 Codex OAuth 通道没有配套可视化界面;支持 OAuth 的工具又缺少稳定 API 适配,团队多人共用工作站完全不适用。

6. 环境部署繁琐,新手门槛高:源码部署需要手动配置 Python、前端依赖,不懂命令行很难启动;多数工具没有便携打包版本,换电脑就要重新搭建整套环境。

这些生产环节的短板,iLab GPT Conjure 全部针对性优化,不堆砌花哨功能,每一项设计都贴合长期批量绘图的真实场景,开箱即用,不用额外安装插件、搭建组件。

主要功能特点

  • 面向 GPT-image-2 的文生图、参考图生成和图像编辑工作流。
  • 支持 Codex Image、Codex Responses 和 OpenAI 兼容 API 接入;公开或共享使用优先选择 API 模式。
  • 多任务并发、本地队列状态、分页历史库、缩略图和结果归档。
  • 独立 /history 页面支持 SQLite 分页、搜索、筛选、网格/列表视图和懒加载详情。
  • Codex Responses 和 API Responses 生图可选启用联网搜索;生成页和历史库搜索支持提示词与任务 ID,并可命中历史任务。
  • 单任务多图输出、部分失败处理和失败重试。
  • 公用图库、最近参考图、颜色 chip、提示词片段 chip 和提示词模板。
  • 图像编辑器支持插入输入框里的其他图片、多图层组合、默认锁定比例变换、 Shift 自由变换、局部擦除和真实图层缩略图。
  • 系统设置提供语言下拉菜单,支持简体中文、正體中文、繁体中文、日语、韩语、English、西班牙语、葡萄牙语、法语、德语、俄语、意大利语和印地语;首次启动自动跟随浏览器语言,手动选择后偏好保存在当前浏览器。
  • 系统设置整合 API 设置、Codex 通道、语言 / Language、存储与通知四个 Tab;API 设置默认第一位。
  • API 供应商以卡片快速选择,默认只读详情,支持显式编辑、复制、删除确认和多供应商排序。
  • 免安装一键包启动脚本只负责本地启动;更新脚本需手动运行,会校验 SHA256、保留 data/,并把被替换文件备份到 .backup/
  • 高级本机 OAuth 工作流支持个人本地 Codex 使用,并明确提示接口风险。
  • API 供应商配置,支持 Base URL、API Key、图像模型、调用方式和并发上限。
  • CLI 支持生成、参考图、图像编辑、mask 和 dry-run。

双模式接入通道,兼顾个人本机与团队稳定生产

工具提供两套独立认证通道,按需选择,适配不同使用场景。

推荐优先使用 OpenAI 兼容 API 模式,适合团队协作、长期商用、公开工作站部署。在系统设置卡片填入服务商 Base URL、API Key、目标图像模型,可添加多供应商自由切换,支持自定义并发上限,接口稳定、不易失效,完全符合生产环境使用标准。

另一套是高级本机 Codex OAuth 模式,仅适合个人本地创作。复用本机 ChatGPT 登录态调用内部生图接口,可在设置中切换 Image/Responses 双通道,但官方明确提示该模式接口存在变更、失效风险,不建议商用、多人共享使用。

本地公用素材图库,永久留存参考图,一键快速引用

这是我日常创作使用频率最高的功能,彻底解决参考图杂乱的问题。

所有上传图片、生成结果、本地素材全部保存在本机 data 目录,不会上传云端。图库支持自定义分类、命名、添加用途备注,拖拽调整排序;写提示词时输入 @符号,就能检索图库图片一键插入作为参考图,自动同步至输入框。

不管是固定 IP 人设、产品实拍图、风格参考插画,都能长期收纳,下次作图不用重复上传。删除图库素材不会清理历史生成记录,过往任务依旧保留图片路径,素材管理逻辑清晰省心。

三类快捷 Chip + 完整提示词模板库,大幅缩减输入成本

提示词编辑器内置三种原子快捷片段,不用反复复制文字:

  • @图库 Chip:快速调取图库参考图,自动附加参考描述给模型;
  • #颜色 Chip:插入十六进制色值,精准把控画面主色调,适合海报、商品图创作;
  • ~ 提示词片段 Chip:收藏短句关键词,输入波浪号一键插入,编辑器仅展示标签,提交模型自动展开完整文本。 配套独立模板库,可保存成套长提示词结构,支持新建、编辑、导入导出、分类收藏,还能关联生成缩略图方便识别。插入模板直接覆盖 / 追加当前提示词,批量做同系列画面时,只需要微调少量参数,不用重复搭建整套描述。

多任务并发本地队列,失败自动重试,批量作图不用守着

支持一次性提交多组绘图任务,本地独立队列有序运行,关闭 WebUI 页面后台依旧执行任务。单任务支持批量输出多张图片,遇到接口报错、网络中断会自动重试,部分生成失败不会清空整组任务,已完成图片自动归档保存。

左侧任务面板实时展示排队、运行、完成任务状态,右侧预览区可直接对成品图精选、下载、打包、二次编辑;独立 /history 分页历史库采用 SQLite 本地存储,支持分页懒加载、关键词 / 任务 ID 检索,网格、列表双视图切换,海量历史图也能快速定位。

内置多层图像编辑器,支持参考图融合、局部擦除、自由变换

不用切换 PS、绘图软件,在工作台内直接完成图像编辑、重绘工作流。编辑器支持多图层叠加,插入多张参考图组合构图,默认锁定等比例缩放,按住 Shift 可自由调整尺寸;自带局部擦除蒙版,精准修改画面局部区域。

生成、编辑完成的图片可一键存入公用图库,形成完整闭环,从构思、绘图、修改到素材留存全程在工具内完成,无需来回切换软件。

多语言适配 + 轻量化便携一键包,新手零门槛部署

系统设置内置多语言切换,覆盖简繁中文、日韩、欧美十余种语言,首次启动自动跟随浏览器语言,手动选择后本地保存偏好。

项目提供免安装 portable 便携包,Windows、macOS(ARM/Intel 双版本)分平台打包,内置完整 Python 运行环境、所有依赖、前端静态资源,下载解压双击启动脚本即可打开 WebUI,地址默认 [127.0.0.1:8787](127.0.0.1:8787)。

更新也十分便捷,运行配套更新脚本,自动校验文件 SHA256 校验码,保留本地图库、历史记录 data 文件夹,替换文件自动备份至.backup 目录,不会丢失个人素材。

WebUI 可视化 + CLI 命令行双端,兼顾普通用户与自动化需求

非技术创作者直接使用可视化网页操作,全图形界面,参数、素材、任务一目了然;开发人员可使用配套 CLI 工具,支持文生图、参考图生成、蒙版编辑、试运行 dry-run 等指令,搭配脚本实现批量自动出图,适配本地自动化工作流。

底层技术栈基于 Python3.11+FastAPI,前端使用 TS/CSS 开发,源码开源可二次修改,内置完整单元测试脚本,CI 流程自动校验代码稳定性。

长期使用真实体验,大幅提升批量绘图效率

我平时做短视频封面、产品宣传图、人物 IP 设定,单次批量生成几十张素材,之前用简易 API 页面,完整流程至少两小时,切换 iLab GPT Conjure 之后,半小时就能完成整套素材产出。

公用图库收纳了几十套角色、产品参考图,写提示词直接调用,省去重复上传步骤;成套模板保存不同风格构图描述,切换系列画面只修改主体关键词;多任务队列后台自动运行,不用守在电脑前等待,中途关闭页面也不会丢失任务,失败自动重试,不用反复手动提交。

所有生成记录本地归档,想要复用之前的画面风格,直接在历史库检索,一键调取原图、配套提示词二次生成,用重新构思描述。便携包换电脑直接拷贝文件夹,所有素材、模板、历史记录完整迁移,不用重新配置 API、上传参考图。

对比 ComfyUI,它不用手动搭建节点流程,开箱即用,素材、模板、队列功能原生内置;对比简易 API 网页,补齐生产所需全套配套工具,不是单纯的提示词输入框,而是完整本地绘图工作台,真正适配长期批量使用 GPT-image-2 的创作者。

实用使用小技巧

1. 素材分类管理:将人设、产品、场景参考图分文件夹存入图库,标注用途备注,批量创作同系列素材时检索效率翻倍;

2. 模板分层保存:拆分基础风格、构图、主体三类提示词模板,搭配 Chip 片段自由组合,适配不同创作需求;

3. 批量自动化:高频固定绘图流程编写 CLI 脚本,一键批量生成整套素材,解放手动重复操作;

4. macOS 启动避坑:苹果芯片便携包解压后如遇系统拦截,执行移除隔离命令,或右键启动脚本选择打开;

5. 数据备份:定期复制根目录 data 文件夹,图库、历史生成图、模板全部存在此处,避免文件丢失;

6. 商用稳定优先:团队工作站、商用批量作图统一使用 OpenAI 兼容 API 通道,规避 OAuth 接口失效风险。

更新日志

v0.5.2

当前版本:v0.5.2。这个版本提供 Windows x64、macOS Apple Silicon、macOS Intel 三种免安装一键包;下载对应平台的 zip 后解压即可启动本地 WebUI,并可手动运行包内更新脚本升级到后续版本。

本版重点:这一版主要发布多语言界面和输入图像画布编辑能力。WebUI 增加语言设置下拉菜单和多语言字典,输入图片编辑器升级为可插入多张输入图、调整画布范围、缩放旋转和局部擦除的多图层编辑器;同时修复任务状态同步和公用图库窄卡片操作区溢出问题。

本版详情:

  • 多语言界面:语言设置改为下拉菜单,第一次启动会按浏览器语言自动选择,手动选择后即时生效并记住偏好;已加入简体中文、正體中文、繁体中文、日本語、한국어、English、Español、Português、Français、Deutsch、Русский、Italiano 和 हिन्दी。
  • 语言入口可找回:语言设置放在独立 Tab,Tab 标题保留当前语言文案和 English 提示,避免用户切错语言后找不到入口;右上角中英文切换按钮已移除。
  • 输入图像画布编辑:编辑输入图片时可插入输入框里的其他一张或多张图片,进行多图组合、选择移动、缩放旋转、局部擦除和图层排序,编辑后保存为一张输入图。
  • 画布范围控制:新增“首图范围 / 适应图层”画布范围选择;既可以保持第一张输入图的尺寸,也可以按全部图层自动扩展画布,适合把多张参考图拼成一张更大的编辑输入图。
  • 图层和变换体验:图层列表显示真实缩略图;图片变换默认锁定长宽比例,按住 Shift 才自由变换;箭头和擦除等工具改进实时反馈,减少绘制延迟感和错位感。
  • 公用图库溢出修复:合入 PR #3 的窄宽度卡片修复,图库卡片、标题、说明和操作按钮都允许收缩并使用省略显示,极窄容器下操作按钮自动变为单列,避免抽屉变窄时按钮挤出卡片。
  • 任务状态同步:修复已生成结果但左侧任务列表仍显示“生成中”的状态不同步问题,任务状态、输出槽位和历史详情以真实可显示结果为准更新。
  • 前端依赖与测试:图层编辑器使用 Konva,package-lock.json 锁定对应 npm 依赖;前端资源版本提升到 runtime-368,静态测试覆盖多语言字典、语言下拉菜单、输入图像画布范围、图层缩略图、图库卡片窄宽度按钮溢出和任务状态同步,降低后续回归风险。
    完整版本说明见 RELEASES.md

获取方式

官方网站

https://github.com/kadevin/ilab-gpt-conjure

网盘下载

https://pan.quark.cn/s/663ea6c0431e

© 版权声明

相关文章