OpenAI релизнула GPT Image 2. Что изменилось и когда ждать API

21 апреля 2026 года OpenAI запустила фазовый роллаут GPT Image 2 — следующей версии нативной модели генерации изображений, встроенной в экосистему Chat GPT. Пока доступ ограничен подписчиками Plus, Team и Enterprise. Фришка и разработчики ждут до начала мая.

Итак, краткая хронология самого продукта:

Март 2025 — GPT Image 1 выходит вместе с GPT-4o. Первая нативная мультимодальная генерация, не DALL-E.
Декабрь 2025 — апдейт до GPT Image 1.5. И, скажем так – это был ощутимый прирост по фотореализму и скорости. Ну и как сейчас – без отдельно анонса.
Апрель 2026, начало месяца — на Arena появляются анонимные модели с codename maskingtape, gaffertape, packingtape. Комьюнити вычисляет новую генерацию за несколько недель до объявления.
21 апреля 2026 – ура, официальный старт роллаута GPT Image 2.

Заявленные технические изменения

Стандартный вывод — до 4096×4096 пикселей.

Примерно вдвое быстрее GPT Image 1.5 при сопоставимых параметрах запроса.

Заявленная точность на типографических бенчмарках — 99%. И это главное маркетинговое направление. GPT Image 1.5 держался на ~95%, что уже было лучшим результатом в классе. Хотя, естественно, проверить 99% независимо пока затруднительно — публичного бенчмарка с воспроизводимой методологией нет.

В релизе акцентируют новые классификаторы и водяные знаки следующего поколения, встроенные непосредственно в модель. OpenAI использует стандарт C2PA — защищённые метаданные с цифровой подписью, которые верифицируются через Content Credentials.

Важный нюанс. C2PA-метаданные стираются при скриншоте, пережатии или репосте в большинство соцсетей. Невидимые пиксельные паттерны устойчивее, но не абсолютны.

Кому доступно сейчас

Категория	Статус
ChatGPT Plus / Team / Enterprise	Роллаут начался 21 апреля
ChatGPT Free	Не заявлено, дата не называется
API (Images API / Responses API)	Запланировано на начало мая 2026

До выхода API на прод девелоперские интеграции остаются на GPT Image 1.5.

GPT Image 1.5 на момент выхода держала верхние строчки в Artificial Analysis Image Arena и Arena.ai по adherence к промпту и рендеру текста.

Ну и по нашему скромному мнению. Конкуренты — Midjourney v7-8.1 (лидирует по артистике), FLUX.2 Pro (скорость и API-масштабирование), Gemini 3.1 Flash Image (фотореализм). GPT Image 2 претендует минимум на удержание лидерства в text-in-image задачах.

Что на данный момент неизвестно

Ценовая модель API пока не раскрыта.
Архитектурные детали (diff с Image 1.5) не опубликованы.
Точные параметры watermarking-алгоритма не описаны.
Независимые бенчмарки появятся не раньше старта API-доступа.

Несколько простых примеров генерации

Запрос: Нарисуй карту Беларуси

Запрос: Сделай анатомическую схему человеческой головы

В третьем варианте мы использовали референс и детальный промпт

Как и во все предыдущие релизы – модель раскатывается постепенно. Проверяем изменения на chatgpt.com и тестируем новую модель.

ссылка на оригинал статьи https://habr.com/ru/articles/1026122/