21 апреля 2026 года OpenAI запустила фазовый роллаут GPT Image 2 — следующей версии нативной модели генерации изображений, встроенной в экосистему Chat GPT. Пока доступ ограничен подписчиками Plus, Team и Enterprise. Фришка и разработчики ждут до начала мая.
Итак, краткая хронология самого продукта:
-
Март 2025 — GPT Image 1 выходит вместе с GPT-4o. Первая нативная мультимодальная генерация, не DALL-E.
-
Декабрь 2025 — апдейт до GPT Image 1.5. И, скажем так – это был ощутимый прирост по фотореализму и скорости. Ну и как сейчас – без отдельно анонса.
-
Апрель 2026, начало месяца — на Arena появляются анонимные модели с codename maskingtape, gaffertape, packingtape. Комьюнити вычисляет новую генерацию за несколько недель до объявления.
-
21 апреля 2026 – ура, официальный старт роллаута GPT Image 2.
Заявленные технические изменения
Стандартный вывод — до 4096×4096 пикселей.
Примерно вдвое быстрее GPT Image 1.5 при сопоставимых параметрах запроса.
Заявленная точность на типографических бенчмарках — 99%. И это главное маркетинговое направление. GPT Image 1.5 держался на ~95%, что уже было лучшим результатом в классе. Хотя, естественно, проверить 99% независимо пока затруднительно — публичного бенчмарка с воспроизводимой методологией нет.
В релизе акцентируют новые классификаторы и водяные знаки следующего поколения, встроенные непосредственно в модель. OpenAI использует стандарт C2PA — защищённые метаданные с цифровой подписью, которые верифицируются через Content Credentials.
Важный нюанс. C2PA-метаданные стираются при скриншоте, пережатии или репосте в большинство соцсетей. Невидимые пиксельные паттерны устойчивее, но не абсолютны.
Кому доступно сейчас
|
Категория |
Статус |
|
ChatGPT Plus / Team / Enterprise |
Роллаут начался 21 апреля |
|
ChatGPT Free |
Не заявлено, дата не называется |
|
API (Images API / Responses API) |
Запланировано на начало мая 2026 |
До выхода API на прод девелоперские интеграции остаются на GPT Image 1.5.
GPT Image 1.5 на момент выхода держала верхние строчки в Artificial Analysis Image Arena и Arena.ai по adherence к промпту и рендеру текста.
Ну и по нашему скромному мнению. Конкуренты — Midjourney v7-8.1 (лидирует по артистике), FLUX.2 Pro (скорость и API-масштабирование), Gemini 3.1 Flash Image (фотореализм). GPT Image 2 претендует минимум на удержание лидерства в text-in-image задачах.
Что на данный момент неизвестно
-
Ценовая модель API пока не раскрыта.
-
Архитектурные детали (diff с Image 1.5) не опубликованы.
-
Точные параметры watermarking-алгоритма не описаны.
-
Независимые бенчмарки появятся не раньше старта API-доступа.
Несколько простых примеров генерации
Запрос: Нарисуй карту Беларуси
Запрос: Сделай анатомическую схему человеческой головы
В третьем варианте мы использовали референс и детальный промпт
Как и во все предыдущие релизы – модель раскатывается постепенно. Проверяем изменения на chatgpt.com и тестируем новую модель.
ссылка на оригинал статьи https://habr.com/ru/articles/1026122/