Вышла GPT Images 2 — модель отлично работает с шрифтами, «думает» и ищет в сети

от автора

OpenAI запустила GPT Images 2 — свою новую модель генерации изображений. Модель «раскатали» на пользователей ChatGPT в течение последних часов, при этом базовая версия доступна в том числе пользователям бесплатного плана.

Разработчики уделили особое внимание тому, как ИИ работает с текстом на изображении. Если GPT Images 1.5 регулярно делала ошибки даже в коротких фразах, то Images 2 способна качественно рендерить целые страницы текста на одном кадре. Улучшение касается не только английского языка — модель способна работать сразу с несколькими языками одновременно. В моих личных текстах она выдавала качественные надписи на русском.

Помимо бесплатной «быстрой» версии, владельцы подписок Plus и выше получат доступ к рассуждающему варианту GPT Images 2 — для этого надо перейти в режим рассуждений в основном меню.

В рассуждающем режиме модель готовит кадр за несколько приемов: сначала дорабатывает промпт, затем набрасывает черновик, смотрит на результат и если видит ошибки, то делает еще один проход. Также рассуждающая модель умеет искать в интернете: если пользователь просит сгенерировать изображение по мотивам недавних событий, которые не попали в обучающую выборку модели, то она попробует найти изображения в поиске и использовать их как референс.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть«, где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1026306/