Как ИИ трансформирует геймдев

от автора

Я знаю не мало людей, труждающихся на айтишной ниве и даже пару инди-разрабов, активно выпускающих что-то новое для своего продукта раз в квартал. В комьюнити моих знакомых вихрь опасений с суицидальными нотками пронесся стремительно и болезненно, не скрою. 

Но сейчас все более-менее устаканилось. Пособирав живой фидбэк, полазив на Реддите и Стакэксчейндже, ну и подключив голову я сделал пару кое-каких наблюдений. 

Тейк 1: Кодеры на мороз

  • Правда: Да, ландшафт уже точно прежним не будет. 

Если раньше кодер воспринимался как жрец мистического культа однерок и нулей и уговорить его работать за идею над очередным “убийцей Майнкрафта” было нереально, то сейчас, как я слышал, условно-бесплатные модели легко ставятся на домашний компьютер с помощью какого-нибудь llama.cpp и продуцируют вполне сносный код меньше чем за час. 

То есть с улицы хлынули тысячи “Вась”, знающие как сделать лучше, чем Кармак. Так уже было с музыкой, когда в нулевых появилась FL Studio и трескучие мобилки с ИК-портами играли самопальный транс “под Тиесто”. И так было с видеомейкингом, когда Sony Vegas стал общественным достоянием на торрентах, а камеру засунули буквально в каждый калькулятор. 

  • Миф: Остается идти в курьеры.

Вот здесь можно поспорить. Да, ЛЛМ-ки стремительно поумнели за последний год, освоив циклы обратной связи компилятора, граф зависимостей модулей и Бог знает что еще.

Код Дипсика, написанный для Андроид-шутера про кибернетических котов и огурцемёты. Такое годится в прод?

Код Дипсика, написанный для Андроид-шутера про кибернетических котов и огурцемёты. Такое годится в прод?
Ещё код

Ещё код

Потому можно, к примеру, делегировать Qwen’у написание кода для небольшой “индюшатины” или пробного проекта. Создать своего рода шарнирный набросок, чтобы посмотреть как оно все будет гудеть и двигаться. Но вот что ни Qwen, ни Claude, ни всем остальным нельзя делегировать — это ответственность. Прежде всего перед игроками. 

ЛЛМ — это стохастический попугай, подсмотревший чужую работу, но до сих пор едва понимающий как сделать код компактным и неубиваемым. Я уже слышал, что ИИ в упор игнорирует боттлнеки ЦПУ, вставляет неудобные костыли, ведущие к накоплению гор технического долга или упускает из виду пользовательские автоматы состояния, делая НПС глупее, чем обычно.

Так кто понесет ответственность, если механика игры начнет ломаться, “персы” будут разговаривать со стенами, а игра, не прошедшая сито оптимизации занимать половину харда? Вопрос, скорее, риторический.

На кратинке не Майнкрафт, а его AI-клон Oasis, который стал мемом из-за сумбурной игровой логики, блеклого визуала и неспособностью поддержать игровой процесс больше 5 минут — по истечении неизменно наступал рестарт.

Today was gonna be the day...

Today was gonna be the day…

Тейк 2: Художники туда же

Художники люди ранимые, как известно, поэтому от них “плач Андромахи” был особенно громким и душераздирающим.

  • Правда: Да, ассеты можно делать за секунды.

Красивые, сочные, месмерические ассеты всегда были проблемой не меньшей, чем кодерская начинка. Здесь ИИ попадает в кассу: можно нагенерить космолеты, замки, джедайские мега-сабли и тайлсеты c декорациями в какой угодно эстетике.

Lord Mazarok — сгенерированный Nano Banana босс. Угадывается сходство с толкиеновским Огнемраком:

The abysmal Lord Mazarok — плагиат?

The abysmal Lord Mazarok — плагиат?

Поначалу некоторые мои знакомцы ощетинивались при упоминании GenAI и отчаянный крик “В нем нет души!” был единственным и, надо заметить, все же правдивым аргументом, пока не пришла внезапная эврика: рисовать ручками каждый куст больше не нужно.

Ручная работа — это прекрасно, как тёплый домашний хлеб из печи. Но лучше посвятить ее каким-то ключевым элементам визуального повествования, где “human touch” со своей иррациональностью, непредсказуемостью и прочими отвалите, я так вижу добавляет эфемерную грань оживленности, сочащуюся сквозь разбитые черепки клише.

  • Миф: ИИ все нарисует, где веревка?

Да, нарисовать может, но мы упираемся в пару серьезных барьеров.

Первое — это пресловутый эффект зловещей долины. Он расхайпился недавно, но вообще был впервые замечен еще в 1970 году робототехником Масахиро Мори, выведшего свою гипотезу из работ Эрнста Йенча и Зигмунда Фрейда, которые также активно обсуждали феномен жуткости. 

Вкратце: все неодушевленное, что слишком сильно пытается казаться живым, вызывает отвращение и ужас — возможно виной тому когнитивный диссонанс, вызванный конфликтующими перцептивными сигналами.

Зловещая долина, uncanny valley или bukimi no tani, если в оригинале

Зловещая долина, uncanny valley или bukimi no tani, если в оригинале

Я наблюдал в прямом эфире как одна кастомная модель на базе ComfyUI генерировала романтические сцены для любовной новеллы. Если бы не ответственный за “допил” дежурный художник, игроки оставили бы достаточно кирпичей для строительства небольшого коттеджного поселка. У главгероини в разных кадрах были: пристальный потусторонний взгляд, достойные тасманийского дьявола клыки и зрачки накофеиненного нетопыря. В продакшен такое, ясное дело, не годится.

А второе — это то, что GenAI имеет склонность беспардонно воровать чужие работы. При чем этим чаще всего грешат диффузионные модели в силу алгоритмической специфики. Виной тому метод обучения:

  • Берется сэмпл из реальной жизни, например фотография Таноса.

  • Сэмпл “топится” в гауссовском шуме до полного исчезновения.

  • Модель запоминает, как именно шум «портит» картинку на каждом шаге.

  • Затем пошагово восстанавливает изображение.

Эксперимент, опубликованный IEEE показал, что по запросу “Мульт из 90-х с желтой кожей” ИИ копирует уже существующие рисунки Симпсонов:

The AImpsons

The AImpsons

Источник: https://spectrum.ieee.org 

Проблема в том, что обратный диффузионный процесс на последнем шаге часто побуждает модель повторить референсную картинку почти один в один. А это уже настоящее минное поле для потенциальных исков по копирайту. Так кто же спасет положение, как не герой с цифровым мольбертом и нетривиальными решениями на перевес?

Тейк 3: Поздно. Мы достигли сингулярности. Оно делает игру ОТ и ДО!

  • Правда: Такие игры есть.

И они на положении бесполезного нейрослопа в Стиме и на других площадках, который никто покупать не хочет. Вот например скриншот из тайтла AI Roguelite 2D, который презентуется как “первая в мире 2D-экшен игра, полностью спроектированная GenAI”.

AI Roguelite 2D

AI Roguelite 2D

Игра в раннем доступе, однако не особо высокая активность и полученные на сегодня оценки с преобладающими пальцами вниз дают понять, что продукт вышел не ахти.

Кто-то может привести контр-пример более распиаренного “некромантического сурвайвала” Codex Mortis, тоже полностью сделанного GenAI как заявляется на твичевских стримах. Выглядит она вроде ничего и стимовские оценки сплошь положительные, но…

  • Миф: Человекам тут не место.

Заявления “Это 100% AI-игра” не стоит воспринимать всерьез. До тех пор пока человек координирует, руководит и принимает ключевые решения — результат никогда не станет эксклюзивным детищем GenAI от слова совсем. 

Codex Mortis и ее левел-дизайн:

И это подтверждается на практике даже с приведенными примерами: как оказалось из треда с ответами авторов на вопросы, Codex Mortis творение преимущественно человеческое. Чего стоит только этот пассаж:

«Что касается тестирования, ИИ смог помочь с планированием некоторых автоматизированных тестов, но основная проверка проводилась руками живых тестировщиков.»

Или вот еще:

«Насчет игрового дизайна: основные идеи — системы, мир, темы — они полностью мои. ИИ здесь не имел голоса.»

Что же, неудивительно, что эта игра стала успешной. Делал-то ее самый мощный интеллект на свете — человек.

Превью выглядит симпатично, но сколько здесь от ИИ, а сколько от человека?

Превью выглядит симпатично, но сколько здесь от ИИ, а сколько от человека?

Геймдизйн, живи

Казалось бы, при чем тут Queen? Фишка в том, что они ставили штемпель “No synthesizers” на свои альбомы, когда начался бум аналоговых синтов. То есть живая естественность была их УТП и творческим кредо одновременно.

Джон Дикон (крайний справа брюнет) как будто бы увидел гейм-слоп. Источник: vocal.media

Джон Дикон (крайний справа брюнет) как будто бы увидел гейм-слоп. Источник: vocal.media

Я считаю это здорово, что у нас есть богатый GenAI-тулкит. Теперь буквально каждый энтузиаст может втиснуть синематик не хуже разрушения Даларана Архимондом или спасти проект, если творческий партнер ушел в режим радиомолчания, прихватив с собой весь код на дорожку.

Но это не значит, что человеческому таланту пришел конец. Как раз-таки, честно заработанные потом и кровью скиллы заиграют в новом свете с помощью такого волшебного инструментария да и еще и сэкономят уйму человеко-часов. Главное не отдавать самый важный элемент своего детища на откуп машине — душу.

А что вы думаете по поводу лавины ИИ-игр в Стиме? Гейм-слоп или все же заслуживают право на жизнь? 

ссылка на оригинал статьи https://habr.com/ru/articles/1026368/