Нейросети-Художники. ChatGPT в этой роли

Нейросети или как их ещё любят называть «Искусственный интеллект» развивается каждый день, каждый час и каждую минуту, обучаясь чему-то новому. Наверное уже каждый смог их попробовать, а кто-то интегрировать их в свои процессы: разработка продуктов, автоматизация бизнес-процессов, написание дипломных работ и очень большой спектр применения. Кто-то боится их, переживает, что «роботы» захватят мир, но пока к этому не стремиться. Тут разберем именно нейросети, которые умеют рисовать, т.е. генерировать картинки, и одной из них будет ChatGPT от OpenAI.

ChatGPT — одна из самых популярных нейросетей в мире, которой пользуются миллионы людей, кто-то с помощью Codex пишет код, кто-то ищет ответы в чате на свои вопросы, и есть люди, которые генерируют картинки. Наверное уже все слышали и видели сгенерированные «советские» плакаты с разными мемами и персонажами, обработки фотографий в стиле аниме студии Ghibli и т.д. Очень порой качественно получается, ничего сказать, но неидеально.

Основными проблемами, с которыми можно столкнуться, это различные артефакты, шесть пальцев у человека, кривые глаза, кривой или нечитаемый текст и много ещё всякого. Причём забавно, что иногда нейросеть способна выдать почти фотореалистичный портрет человека, но «сломаться» на самой простой надписи на вывеске или количестве пальцев на руке. И это, пожалуй, очень хорошо показывает текущее состояние генеративного ИИ: технологии уже впечатляют, но до идеала им всё ещё далеко.

При этом важно понимать одну вещь: нейросеть не «рисует» в человеческом понимании этого слова. У неё нет вдохновения, эмоций или осознанного художественного вкуса. Она анализирует огромные массивы данных, находит закономерности и на основе запроса пользователя генерирует наиболее вероятный результат. По сути — это очень сложная математическая модель, которая научилась угадывать, как должна выглядеть картинка.

И вот здесь начинается самое интересное.

Почему ChatGPT вообще умеет рисовать

Многие до сих пор воспринимают ChatGPT исключительно как текстового помощника: написать код, составить письмо, придумать план статьи или помочь с документацией. Но современные версии модели давно вышли за рамки обычного чата. Сейчас ChatGPT умеет работать с изображениями, анализировать их и генерировать новые.

Причём отличие от многих «классических» генераторов изображений в том, что ChatGPT делает акцент не только на картинке, но и на понимании контекста. Это особенно заметно при сложных запросах. Например, если попросить:

«Нарисуй постер в стиле советской пропаганды, но про работу DevOps-инженера, с красными оттенками, заводом на фоне и смешным лозунгом»

то модель поймет не только отдельные слова, но и саму идею, настроение, культурный контекст и даже тип юмора и на этой основе сгенерирует изображение.

Именно поэтому нейросети стали массовым инструментом не только для дизайнеров, но и для обычных пользователей. Сегодня человеку уже не обязательно владеть Photoshop, Paint, Illustrator или навыками рисования, чтобы получить визуал для статьи, презентации, обложки видео или поста в соцсетях.

Но заменят ли нейросети художников?

Это, наверное, самый спорный вопрос вокруг всей темы генеративного ИИ.

С одной стороны — да, часть задач уже автоматизируется. Если раньше для простого баннера нужно было искать дизайнера, писать ТЗ, ждать несколько дней и платить деньги, то сейчас можно за 30 секунд получить десятки вариантов.

С другой стороны — нейросети пока очень плохо заменяют именно профессиональное творчество. Хороший дизайнер или художник решает задачу, а не просто делает красивую картинку. Он понимает композицию, смысл, бренд, эмоцию, аудиторию и то, зачем вообще создаётся изображение.

ИИ же пока остаётся инструментом. Очень мощным, очень удобным, иногда даже пугающе качественным, но всё-таки инструментом.

И здесь можно провести интересную аналогию. Когда появились фотоаппараты, многие тоже говорили, что художники больше не нужны. Потом появился Photoshop — и снова были разговоры о «конце профессии». Но по факту инструменты менялись, а профессия адаптировалась.

Примеры генераций картинок

Чтобы лучше понимать, что умеет нейросеть и как у ней получается справится с задачами, можно дать ей пару запросов, которые она должен реализовать.

Можно взять запрос на генерацию арта для визуальной новеллы «Iron Team», чтобы понять как ИИ может помогать при разработки игры. Сам запрос будет таким:

Нарисуй арт для визуальной новеллы. Соотношение сторон 16:9. Стиль — Аниме.

Мяч оказывается над сеткой, Володя выпрыгивает и замахивается на удар, с другой стороны сетки на в воздух взмывает Рома со своим стенообразным блок со зловещей ухмылкой и светящимися глазами

На результате видим неплохой арт, хорошего качества и если не вглядываться, то даже может показаться очень отличным, но не так все гладко.

Пальцы — как можно заметить у игрока, который атакует, у него на правой руке средний и безымянный палец слиплись, и на левой руке безымянный палец сломан или просто кривой;
Мяч — у него очень неестественные узоры, которые ему нехарактерны;
Фон — если приглядеться, то можно заметить моменты, где фон смазывается. Неприятная мелочь, но не сильно бросается в глаза.

Дальше попросим нейросеть сделать более анимешным стиль, поменять персонажей местами и убрать проблемы прошлого арта.

Что стало лучше, а что хуже?

Арт стал более приближенным к классической аниме рисовке;
Мяч стал лучше, узоры хоть и остались хаотичными, но уже больше напоминает классические волейбольные мячи;
Фон стал четким благодаря освещению и простоте;
У атакующего игрока левая рука отличается. Кажется, что на ней шесть пальцев, но это из-за особенности большого пальца, на котором растет еще один.
На футболке есть проблема: номер блокирующего игрока не дорисован и выглядит размытым.

И всё же есть ощущение «искусственности»

Как бы ни развивались модели, у многих изображений всё ещё есть странное ощущение. Они красивые, иногда очень детализированные, но будто «стерильные». Не хватает какого-то человеческого хаоса, случайности или авторского характера.

Наверное, именно поэтому сейчас особенно ценится комбинация человека и ИИ, а не что-то одно.

Человек задаёт идею, настроение, смысл и направление. Нейросеть ускоряет реализацию и помогает быстро экспериментировать. И вот такая связка уже действительно выглядит как будущее индустрии.

Итог

Нейросети-художники — это не временный тренд и не очередная «игрушка из интернета». Это новый этап развития цифровых инструментов, который уже меняет подход к созданию контента.

Да, у технологий ещё много проблем: артефакты, ошибки, вопросы авторского права, переизбыток однотипного контента и даже определённая «усталость» от ИИ-картинок в интернете. Но отрицать прогресс уже невозможно.

И, возможно, главный вывод здесь в том, что нейросети не заменяют человека полностью. Они меняют сам способ работы человека.

А насколько это хорошо или плохо — каждый решит для себя сам.

А на последок, сгенерированная манга по визуальной новелле «Iron Team».

Отрывок ИИ-манги по игре "Iron Team" — Отрывок ИИ-манги по игре «Iron Team»

ссылка на оригинал статьи https://habr.com/ru/articles/1033920/