ChatGPT Images 2.0 — все, что нужно знать прямо сейчас. Сравнение с Nano Banana 2 и Nano Banana Pro

от автора

Сгенерировала в новом ChatGPT Images 2.0

Сгенерировала в новом ChatGPT Images 2.0

OpenAI запустила ChatGPT Images 2.0 21 апреля 2026 года. В ChatGPT это новый генератор изображений, а в API основная модель называется gpt-image-2. Обычная генерация в ChatGPT доступна на всех тарифах.

OpenAI делает упор на лучший рендер текста, мультиязычность, более сильное следование инструкции, сложные макеты, редактирование и более уверенную работу с реальными объектами и сценами. В официальных материалах прямо показывают постеры, инфографику, UI-мокапы, комиксы, редакционные развороты и многоязычные изображения.

Отдельно появился режим images with thinking. В нем модель получает больше времени на рассуждение перед генерацией: может лучше распланировать изображение, уточнить визуальную задачу и подключать reasoning, tools и live web search data. То есть если нужно, может подумать над сложной задачей, пере тем как приступить к рисованию.

8 Ключевых возможностей

Возможность

Что это дает на практике

1

Гибкие размеры до 4K (макс. сторона 3840px)

Популярные: 1024×1024, 2048×2048, 3840×2160, 2160×3840 — без апскейла

2

Значительно улучшенный рендеринг текста

Постеры, меню, UI-мокапы, инфографика с читаемыми надписями

3

Thinking Mode (reasoning + возможный веб-поиск)

Модель может исследовать контекст, трансформировать входные данные, генерировать варианты и самопроверяться

4

Несколько изображений за запрос (параметр n, до 10 в API)

Варианты, сториборды, мультиформатные кампании

5

Гибкие соотношения сторон

Баннеры, сторис, постеры — без кропа

6

Многоязычный текст

Кириллица, японский, корейский, хинди, арабский, китайский в одном изображении

7

Мультиреференсный ввод

Несколько изображений как входные данные (точный лимит официально не указан)

8

Структурированная генерация

Диаграммы, инфографика, комиксы, презентации

Два режима работы

Режим

Кому доступен

Что делает

Обычная генерация

Все планы, включая Free

Быстрая генерация без дополнительного reasoning

Images with Thinking

Plus, Pro, Business (Enterprise и Edu — скоро)

Reasoning + возможный веб-поиск + самопроверка

Готовые шаблоны промптов

Если говорить про промпты, официальный совет OpenAI довольно приземленный — должна быть нормальная структура. Рекомендуется писать запрос в понятном порядке — scene/background → subject → key details → constraints — и сразу указывать use case, например: ad, UI mock, infographic. Это полезнее, чем засыпать модель эпитетами типа masterpiece и insane details.

Ниже приведу универсальные шаблоны и правила.

Универсальный шаблон

[СООТНОШЕНИЕ СТОРОН]. [СУБЪЕКТ], [ДЕЙСТВИЕ], [КОНТЕКСТ].

Scene: [где происходит, время суток, фон, окружение]

Subject: [кто или что в центре]

Important details: [материалы, одежда, текстура, освещение, угол камеры, настроение]

Use case: [editorial photo / product mockup / poster / UI screen / infographic]

Constraints: [no watermark / no logos / preserve face / preserve layout]

Шаблон для текстовых элементов

[СООТНОШЕНИЕ СТОРОН]. [СУБЪЕКТ], [КОНТЕКСТ]. Текстовые элементы в кавычках:

  • Заголовок: “ТОЧНЫЙ ТЕКСТ”

  • Подзаголовок: “ТОЧНЫЙ ТЕКСТ”

  • CTA: “ТОЧНЫЙ ТЕКСТ” [Стилевой якорь - художник/эпоха/медиум]. [Освещение + настроение]. [Камера/объектив + технические параметры].

5 правил, которые реально работают

  1. Соотношение сторон — первым словом: «16:9», «3:1 banner», «1:1 square».

  2. Весь текст — в кавычках: модель воспринимает их буквально.

  3. Конкретный стилевой якорь: «Editorial fashion photograph, shot on Hasselblad, 90mm, f/2.8» вместо «professional photo«.

  4. Освещение и настроение — отдельными инструкциями: «Rembrandt key light from upper-left, soft fill from right, warm tones«.

  5. Для мультиязычного текста — явно указывать каждый язык: «Title in Japanese (Hiragana): 「春が来た」; subtitle in Korean: ‘봄이 왔다’».

Антипаттерны (что НЕ работает)

Избегать: stunning, incredible, epic, masterpiece, gorgeous, insane detail.

Предпочитать: overcast daylight, brushed aluminum, chipped paint, 50mm feel, soft bounce light.

Вы дочитали до середины статьи, а значит, статья, вероятнее всего, вам понравилась, как и моя подача и стиль письма, так что вы можете поддержать меня в моем телеграм канале, где уже собрано много полезного и проверенного.

Цены (API)

Модальность

Input

Cached Input

Output

Image

$8.00 / 1M токенов

$2.00 / 1M токенов

$30.00 / 1M токенов

Text

$5.00 / 1M токенов

$1.25 / 1M токенов

$10.00 / 1M токенов

Для ориентира: генерация одного изображения 1024×1024 в качестве medium обходится примерно в $0.05–0.06.

Сравнение: GPT Image 2 vs Nano Banana 2 vs Nano Banana Pro

Я сразу хочу сказать, что пока модель гораздо менее цензурированная, чем Nano Banana 2 или Nano Banana Pro. Пока эти двое писали мне:  “Изображение было отфильтровано, поскольку оно нарушало политику Google ...”, GPT Image 2 просто взял и сделал:

Неизвестно, как долго будет такое послабление в цензуре, так как сначала все модели генерируют почти все, что ни попросишь, а по прошествии времени закручивают гайки.

Сравнение по ключевым параметрам

Параметр

GPT Image 2

Nano Banana 2

Nano Banana Pro

Макс. разрешение

до 4K (3840px)

4K нативное

4K нативное

Рендеринг текста

Значительно улучшен

Высокий

Высокий

Reasoning / веб-поиск

Да (Thinking Mode)

Да (image search grounding)

Да (Gemini 3 Pro + Google Search)

Кол-во изображений за запрос

до 10 (API)

1–4

1–4

Мультиреференсный ввод

Да (лимит не указан)

Ограничен

Да

Скорость (API)

~40 сек

~10 сек

~20 сек

Доступность

Free / Plus / Pro / API

Gemini Free / Pro

Google AI Pro ($19.99/мес)

Thinking Mode

Plus, Pro, Business

Через Gemini 3.1

Через Gemini 3 Pro

Позиция в лидерборде (Image Arena, апрель 2026)

В arena.ai модель с большим отрывом заняла первое место, причем это еще medium-версия.

Цена за 1000 изображений (API, ориентировочно)

Модель

Цена / 1000 изображений

Nano Banana (Gemini 2.5 Flash)

~$39

Nano Banana 2

~$67

Nano Banana Pro

~$134

GPT Image 2 (medium)

~$50–60

Скорость генерации (медиана, API)

Модель

Время

Nano Banana 2

~10 сек

Nano Banana Pro

~20 сек

GPT Image 2

~40 сек

Где каждая модель выигрывает

  • GPT Image 2 — если важна интеграция с ChatGPT и Codex, мультишаговое редактирование через Responses API, и работа в экосистеме OpenAI.

  • Nano Banana 2 — лучшее соотношение цена/качество: сопоставимое качество при цене в 2–3 раза ниже и скорости в 4 раза выше.

  • Nano Banana Pro — если уже используете Google AI Pro и нужна глубокая интеграция с Google-инструментами.

P.S. Вы можете поддержать меня в моем телеграм канале, там я пишу о том, в чем разбираюсь или пытаюсь разобраться сама, тестирую полезные ИИ-сервисы, инструменты для офиса, бизнеса, маркетинга и видео.

ссылка на оригинал статьи https://habr.com/ru/articles/1026724/