OpenAI запустила ChatGPT Images 2.0 21 апреля 2026 года. В ChatGPT это новый генератор изображений, а в API основная модель называется gpt-image-2. Обычная генерация в ChatGPT доступна на всех тарифах.
OpenAI делает упор на лучший рендер текста, мультиязычность, более сильное следование инструкции, сложные макеты, редактирование и более уверенную работу с реальными объектами и сценами. В официальных материалах прямо показывают постеры, инфографику, UI-мокапы, комиксы, редакционные развороты и многоязычные изображения.
Отдельно появился режим images with thinking. В нем модель получает больше времени на рассуждение перед генерацией: может лучше распланировать изображение, уточнить визуальную задачу и подключать reasoning, tools и live web search data. То есть если нужно, может подумать над сложной задачей, пере тем как приступить к рисованию.
8 Ключевых возможностей
|
№ |
Возможность |
Что это дает на практике |
|---|---|---|
|
1 |
Гибкие размеры до 4K (макс. сторона 3840px) |
Популярные: 1024×1024, 2048×2048, 3840×2160, 2160×3840 — без апскейла |
|
2 |
Значительно улучшенный рендеринг текста |
Постеры, меню, UI-мокапы, инфографика с читаемыми надписями |
|
3 |
Thinking Mode (reasoning + возможный веб-поиск) |
Модель может исследовать контекст, трансформировать входные данные, генерировать варианты и самопроверяться |
|
4 |
Несколько изображений за запрос (параметр |
Варианты, сториборды, мультиформатные кампании |
|
5 |
Гибкие соотношения сторон |
Баннеры, сторис, постеры — без кропа |
|
6 |
Многоязычный текст |
Кириллица, японский, корейский, хинди, арабский, китайский в одном изображении |
|
7 |
Мультиреференсный ввод |
Несколько изображений как входные данные (точный лимит официально не указан) |
|
8 |
Структурированная генерация |
Диаграммы, инфографика, комиксы, презентации |
Два режима работы
|
Режим |
Кому доступен |
Что делает |
|---|---|---|
|
Обычная генерация |
Все планы, включая Free |
Быстрая генерация без дополнительного reasoning |
|
Images with Thinking |
Plus, Pro, Business (Enterprise и Edu — скоро) |
Reasoning + возможный веб-поиск + самопроверка |
Готовые шаблоны промптов
Если говорить про промпты, официальный совет OpenAI довольно приземленный — должна быть нормальная структура. Рекомендуется писать запрос в понятном порядке — scene/background → subject → key details → constraints — и сразу указывать use case, например: ad, UI mock, infographic. Это полезнее, чем засыпать модель эпитетами типа masterpiece и insane details.
Ниже приведу универсальные шаблоны и правила.
Универсальный шаблон
[СООТНОШЕНИЕ СТОРОН]. [СУБЪЕКТ], [ДЕЙСТВИЕ], [КОНТЕКСТ].
Scene: [где происходит, время суток, фон, окружение]
Subject: [кто или что в центре]
Important details: [материалы, одежда, текстура, освещение, угол камеры, настроение]
Use case: [editorial photo / product mockup / poster / UI screen / infographic]
Constraints: [no watermark / no logos / preserve face / preserve layout]
Шаблон для текстовых элементов
[СООТНОШЕНИЕ СТОРОН]. [СУБЪЕКТ], [КОНТЕКСТ]. Текстовые элементы в кавычках:
-
Заголовок: “ТОЧНЫЙ ТЕКСТ” -
Подзаголовок: “ТОЧНЫЙ ТЕКСТ” -
CTA: “ТОЧНЫЙ ТЕКСТ” [Стилевой якорь - художник/эпоха/медиум]. [Освещение + настроение]. [Камера/объектив + технические параметры].
5 правил, которые реально работают
-
Соотношение сторон — первым словом: «16:9», «3:1 banner», «1:1 square».
-
Весь текст — в кавычках: модель воспринимает их буквально.
-
Конкретный стилевой якорь: «
Editorial fashion photograph, shot on Hasselblad, 90mm, f/2.8» вместо «professional photo«. -
Освещение и настроение — отдельными инструкциями: «
Rembrandt key light from upper-left, soft fill from right, warm tones«. -
Для мультиязычного текста — явно указывать каждый язык: «Title in Japanese (Hiragana): 「春が来た」; subtitle in Korean: ‘봄이 왔다’».
Антипаттерны (что НЕ работает)
Избегать: stunning, incredible, epic, masterpiece, gorgeous, insane detail.
Предпочитать: overcast daylight, brushed aluminum, chipped paint, 50mm feel, soft bounce light.
Вы дочитали до середины статьи, а значит, статья, вероятнее всего, вам понравилась, как и моя подача и стиль письма, так что вы можете поддержать меня в моем телеграм канале, где уже собрано много полезного и проверенного.
Цены (API)
|
Модальность |
Input |
Cached Input |
Output |
|---|---|---|---|
|
Image |
$8.00 / 1M токенов |
$2.00 / 1M токенов |
$30.00 / 1M токенов |
|
Text |
$5.00 / 1M токенов |
$1.25 / 1M токенов |
$10.00 / 1M токенов |
Для ориентира: генерация одного изображения 1024×1024 в качестве medium обходится примерно в $0.05–0.06.
Сравнение: GPT Image 2 vs Nano Banana 2 vs Nano Banana Pro
Я сразу хочу сказать, что пока модель гораздо менее цензурированная, чем Nano Banana 2 или Nano Banana Pro. Пока эти двое писали мне: “Изображение было отфильтровано, поскольку оно нарушало политику Google ...”, GPT Image 2 просто взял и сделал:

Неизвестно, как долго будет такое послабление в цензуре, так как сначала все модели генерируют почти все, что ни попросишь, а по прошествии времени закручивают гайки.
Сравнение по ключевым параметрам
|
Параметр |
GPT Image 2 |
Nano Banana 2 |
Nano Banana Pro |
|---|---|---|---|
|
Макс. разрешение |
до 4K (3840px) |
4K нативное |
4K нативное |
|
Рендеринг текста |
Значительно улучшен |
Высокий |
Высокий |
|
Reasoning / веб-поиск |
Да (Thinking Mode) |
Да (image search grounding) |
Да (Gemini 3 Pro + Google Search) |
|
Кол-во изображений за запрос |
до 10 (API) |
1–4 |
1–4 |
|
Мультиреференсный ввод |
Да (лимит не указан) |
Ограничен |
Да |
|
Скорость (API) |
~40 сек |
~10 сек |
~20 сек |
|
Доступность |
Free / Plus / Pro / API |
Gemini Free / Pro |
Google AI Pro ($19.99/мес) |
|
Thinking Mode |
Plus, Pro, Business |
Через Gemini 3.1 |
Через Gemini 3 Pro |
Позиция в лидерборде (Image Arena, апрель 2026)
В arena.ai модель с большим отрывом заняла первое место, причем это еще medium-версия.
Цена за 1000 изображений (API, ориентировочно)
|
Модель |
Цена / 1000 изображений |
|---|---|
|
Nano Banana (Gemini 2.5 Flash) |
~$39 |
|
Nano Banana 2 |
~$67 |
|
Nano Banana Pro |
~$134 |
|
GPT Image 2 (medium) |
~$50–60 |
Скорость генерации (медиана, API)
|
Модель |
Время |
|---|---|
|
Nano Banana 2 |
~10 сек |
|
Nano Banana Pro |
~20 сек |
|
GPT Image 2 |
~40 сек |
Где каждая модель выигрывает
-
GPT Image 2 — если важна интеграция с ChatGPT и Codex, мультишаговое редактирование через Responses API, и работа в экосистеме OpenAI.
-
Nano Banana 2 — лучшее соотношение цена/качество: сопоставимое качество при цене в 2–3 раза ниже и скорости в 4 раза выше.
-
Nano Banana Pro — если уже используете Google AI Pro и нужна глубокая интеграция с Google-инструментами.
P.S. Вы можете поддержать меня в моем телеграм канале, там я пишу о том, в чем разбираюсь или пытаюсь разобраться сама, тестирую полезные ИИ-сервисы, инструменты для офиса, бизнеса, маркетинга и видео.
ссылка на оригинал статьи https://habr.com/ru/articles/1026724/