Как устроены world models, что показал Google на прошлой неделе и где это меняет gamedev и робототехнику

от автора

19 мая 2026 года на Google I/O разработчики DeepMind показали то, что неделей раньше казалось демкой для технотвиттера. Project Genie теперь умеет привязывать сгенерированный 3D-мир к реальным координатам Google Street View. Робот, который пока ездит только по виртуальному Сан-Франциско, сможет получить тренировочную сессию в Лондоне или Токио, не покидая дата-центр. И всё это — за деньги $200 в месяц на тарифе Google AI Ultra.

Эта статья — про то, как устроена технология под капотом, чем она принципиально отличается от Sora и Veo, что уже работает в проде (Waymo), кто играет на этом поле кроме Google, и что произойдёт с разработкой игр и робототехникой, если эту штуку завтра состыкуют с открытыми MCP-серверами для Unity и Blender.

Project Genie + Street View: робот тренируется на снежной версии нью-йоркского квартала, который снимали летом

Project Genie + Street View: робот тренируется на снежной версии нью-йоркского квартала, который снимали летом

Чем мировая модель отличается от видеогенерации

Самая частая путаница в новостях: «Sora — это мировая модель». Нет.

Sora и Veo генерируют видео. На вход — текст или картинка. На выход — фиксированный набор кадров. Вы не можете повернуть камеру, нажать кнопку «вперёд», открыть дверь. Видео — это результат, а не среда.

Genie 3 генерирует играбельную среду. На вход — текст или картинка. На выход — мир, в который вы заходите через клавиатуру (стрелки, WASD), идёте, поворачиваете голову, и модель в реальном времени дорисовывает то, что должно появиться в поле зрения. Никакого предзаписанного видео нет. Каждый кадр — это новый кадр, сгенерированный в момент, когда вы на него смотрите.

CNIL (французский регулятор) в марте 2026 формализовал это разделение в статье «From language models to world models». Мировая модель — это ИИ-система, которая моделирует динамику окружения: предсказывает, как среда эволюционирует, и как действия игрока на неё влияют. У видео-моделей этого нет в принципе — они генерируют «фиксированную траекторию», без интерактивности и без альтернативных сценариев.

Различие в одном слове — действие. Видео-модель не принимает действие на вход. Мировая модель принимает действие на каждом кадре и предсказывает следующий кадр с учётом этого действия.

Слева — Sora/Veo: фиксированное видео. Справа — Genie 3: интерактивная среда, реагирующая на ввод

Слева — Sora/Veo: фиксированное видео. Справа — Genie 3: интерактивная среда, реагирующая на ввод

История: путь от Genie 1 до Genie 3

Хронология короткая, но плотная — три прыжка за два года.

Genie 1 (март 2024). Первая итерация. Генерирует двумерные интерактивные среды по картинке или эскизу. Уровень платформера в духе старых аркад. Доказательство концепции: можно вообще генерировать интерактивный мир, а не видео.

Genie 2 (декабрь 2024). Прыжок в 3D. Появилась глубина, перспектива, навигация в трёх измерениях. Но память модели — 10–20 секунд. Если игрок отвернулся от дома и снова повернулся, дом мог стать другим. Объекты «забывались».

Genie 3 (август 2025). Публичный исследовательский релиз. 720p при 24 кадрах в секунду. Память расширилась до минуты. Появились события, управляемые промптом — можно в процессе игры написать «начался снегопад» или «добавь медведя», и модель добавит это в мир, не перегенерируя сцену с нуля.

Project Genie (январь 2026). Платный доступ для подписчиков Google AI Ultra в США. Веб-интерфейс, лимит — 60-секундные сессии.

Waymo World Model (февраль 2026). Waymo взял Genie 3 как основу и построил поверх него специализированный симулятор для тренировки своих роботакси на редких событиях.

Привязка к Street View (19 мая 2026). Свежее. Genie 3 теперь умеет якорить сгенерированный мир к реальным координатам Street View, и доступ открыт глобально через тариф AI Ultra за $200/месяц.


Как Genie 3 работает технически

Под капотом — авторегрессионный трансформер. Та же базовая архитектура, что у больших языковых моделей, но адаптированная под видео-кадры вместо текстовых токенов.

Языковая модель предсказывает следующий токен в последовательности текста. Genie 3 предсказывает следующий визуальный кадр в последовательности состояний мира. И это не метафора, это буквально так и работает: один трансформер, авторегрессивная генерация, внимание на историю.

Внутри модель состоит из трёх компонентов, описанных в оригинальной публикации DeepMind по Genie:

1. Видео-токенизатор (VQ-VAE). Сжимает «сырые» видео-кадры в дискретные токены. Кодирует и пространственные, и временные паттерны. Цель — уменьшить размерность данных до уровня, который может обрабатывать трансформер. Каждый кадр превращается в набор токенов, как слова в предложении.

2. Модель скрытых действий (latent action model). Отдельная сетка, которая выводит скрытое действие между каждой парой кадров. Это нужно, чтобы тренироваться можно было на видео без размеченных действий пользователя — модель сама учится выводить, какой ввод привёл к данному переходу. Революция в обучении мировых моделей: раньше нужны были игровые сессии с зафиксированными нажатиями клавиш, теперь хватает обычного видео.

3. Модель динамики (dynamics model). Авторегрессивный трансформер. На вход — скрытое действие и токены предыдущих кадров. На выход — предсказание токенов следующего кадра.

Архитектура Genie 3: видео-токенизатор + модель скрытых действий + модель динамики

Архитектура Genie 3: видео-токенизатор + модель скрытых действий + модель динамики

Кадровый бюджет жёсткий: при 24 кадрах в секунду на каждый кадр у модели есть 41.67 миллисекунды. По утёкшей документации, Genie 3 — около 11 миллиардов параметров, оптимизирован не под предсказание одного кадра (как видео-модели), а под непрерывную симуляцию с памятью.

И тут самое интересное — физика в Genie 3 не запрограммирована. В отличие от Unity или Unreal, где гравитация, столкновения и инерция — это явно описанный код, Genie 3 ничего этого не знает на уровне правил. Модель просто видела миллионы часов видео, где объекты падают вниз, вода течёт, стекло разбивается, — и научилась воспроизводить эти закономерности как эмерджентное свойство.

Это и сильная, и слабая сторона. Сильная: модель работает в любых сюрреалистичных мирах, где «обычная физика» неприменима. Слабая: она может ошибиться. Стакан, балансирующий на краю стола, может упасть, а может зависнуть. Жидкость может потечь не туда. Долгосрочная связность тоже даёт сбои — отойдёшь на минуту, вернёшься, и комната может выглядеть слегка по-другому.

Альтернативные подходы — NeRF (нейронные поля излучения) и Gaussian Splatting — требуют явного 3D-представления сцены. У них связность жёстко гарантирована геометрией. У Genie 3 связность эмерджентная, выводится из памяти модели. Это и есть тот самый «промпт → играбельный мир за секунды»: не нужно строить меш-структуру, не нужно расставлять источники света, не нужно настраивать материалы.


Waymo World Model: что уже работает в продакшене

В феврале 2026-го Waymo опубликовала Waymo World Model — специализированный форк Genie 3 для тренировки самоуправляющихся машин.

Идея простая: чтобы научить машину правильно реагировать на торнадо, нужно показать ей торнадо. Поставить машину под настоящий торнадо нельзя. Снимать со стороны бесполезно — нужен вид с точки зрения самой машины. Раньше для этого использовали игровые движки с захардкоженной физикой, и получалось плохо: торнадо в Unity выглядит как мультик.

Waymo показала, что Genie 3 в этой задаче работает лучше, потому что:

  • Эффекты выглядят правдоподобно благодаря обучению на реальном видео

  • Не нужно ничего «программировать» — описал ситуацию текстом, получил сцену

  • Можно сгенерировать комбинации событий, которых вообще никогда не было в реальных данных Waymo: торнадо + сломанный светофор + перевернувшийся грузовик одновременно

В блог-посте Waymo на февраль 2026-го перечислены сценарии, которые они симулируют: торнадо, наводнения, слоны на шоссе, львы, пешеходы в костюмах динозавров (последнее — реальный пример). Плюс события, критичные для безопасности: машины едущие против движения, неуравновешенные грузовики, рассыпающие груз.

Waymo World Model на Genie 3: тренировочная сцена с пешеходом в костюме динозавра. Реальный кадр из публикации Waymo, февраль 2026

Waymo World Model на Genie 3: тренировочная сцена с пешеходом в костюме динозавра. Реальный кадр из публикации Waymo, февраль 2026

Парадокс ситуации: Waymo с 2009 года катает свои тестовые машины по дорогам и собрала, по их же оценке, десятки миллионов миль реальных логов. Этих данных хватит, чтобы научить машину обычным ситуациям. Но редким событиям машину можно научить, только сгенерировав их синтетически — потому что в реальности они случаются раз в миллион миль или вообще никогда.


Привязка к Street View — что добавила эта неделя

До 19 мая 2026 года Genie 3 генерировал «миры из ниоткуда». Опишешь «средневековый замок» — получишь замок, который не привязан ни к какому реальному месту.

Привязка к Street View меняет это фундаментально. Теперь Genie 3 может сгенерировать снежную версию конкретного квартала в Манхэттене, который Google снимал летом. Или солнечную версию лондонской улицы, которую снимали в пасмурный день. Или ночную версию рынка в Бангкоке.

В блоге Google это объясняется на примере робота, который скоро поедет в Лондон. Лондон редко видит прямое солнце. Когда оно появится — викторианские дома с их белым известняком и зеркальными окнами могут ослепить камеру робота резким бликом. Genie 3 умеет сгенерировать именно те редкие солнечные минуты на знакомых лондонских улицах, чтобы робот успел натренироваться до того, как впервые их увидит.

Второе важное свойство — смена точки зрения. Симулятор Waymo привязан к камере машины. Связка Street View + Genie позволяет тот же мир рассматривать с точки зрения пешехода, велосипедиста, доставочного робота. Один сгенерированный кусок Манхэттена — десяток разных тренировочных сценариев для разных типов агентов одновременно.


Конкуренты: кто ещё делает мировые модели

Genie 3 — лидер рынка по интерактивности и реальному времени, но не единственный игрок. Поле плотное.

World Labs Marble. Fei-Fei Li (та самая, ImageNet) собрала $230 миллионов на стартап в 2024 году, а в ноябре 2025-го выкатила первую коммерческую модель — Marble. Принципиально другой подход: вместо покадровой генерации Gaussian Splatting — миллионы полупрозрачных частиц, которые представляют 3D-объём. Геометрия жёсткая, физика гарантирована, миры можно открывать в Vision Pro и Quest 3. Минус — миры не интерактивные в режиме реального времени, это статичные 3D-сцены, в которых можно перемещаться, но не воздействовать. У Marble есть отдельный 3D-редактор Chisel, где можно набросать форму комнаты руками, а потом модель заполнит детали.

Microsoft Muse. Анонсирована в начале 2025-го. Заточена специально под видео-игры. Тренировочный корпус — игровые видео + захваты ввода клавиатуры и геймпада, благо у Microsoft есть Xbox и Activision. Muse понимает связку «нажатие → результат» лучше, чем модели, тренировавшиеся на YouTube. По состоянию на середину 2026-го — в основном исследовательский инструмент, не публичный сервис.

Decart Lucy / Oasis. Израильский стартап, $300 миллионов финансирования, в марте 2026-го выпустили DOS 2.0 со свежими версиями Lucy (иммерсивный опыт) и Oasis (физический ИИ / робототехника). Их фишка — оптимизированный стек инференса для сценариев в реальном времени с низкой задержкой. Целятся в робототехнику, автоматизацию, виртуальную примерку в электронной коммерции, живую рекламу.

OpenAI Sora 2. На вопрос «а Sora?» — мы уже выше ответили. Sora — это видеогенерация, а не мировая модель. Можно сделать видео с игровой эстетикой, но войти в это видео и пройти по нему нельзя.

Краткое сравнение:

Модель

Подход

В реальном времени

Память

Доступ

Genie 3

Авторегрессионный трансформер

Да, 24 fps

~1 минута

Google AI Ultra $200/мес

Marble

Gaussian Splatting

Нет (статика)

Полная (геометрия)

World Labs freemium

Muse

Авторегрессионный (на играх)

Частично

Только исследования

Lucy/Oasis

Оптимизированный стек инференса

Да

API Decart

Sora 2

Видеодиффузия

Нет (видео)

ChatGPT Plus / API

Карта мировых моделей в мае 2026: подход, интерактивность, время отклика

Карта мировых моделей в мае 2026: подход, интерактивность, время отклика

Что это значит для разработки игр в ближайшие 3 года

Тут начинается самая интересная часть — спекулятивная, но опирающаяся на то, что уже сейчас существует и доступно в открытом исходном коде.

Где мировые модели работают уже сегодня

Google Cloud в марте 2026-го опубликовал отчёт «A new era of gaming», где назвал три студии, которые уже строят игры на генерации с помощью Gemini:

  • 10Six Games (ветераны Rockstar, Aardman, 2K) — игра YOU vs Zombies, лето 2026. Фича The Ritual: игрок описывает героя («огнедышащая балерина»), Gemini генерирует под него ассеты в реальном времени, используя кастомные LoRA-адаптеры на стиль студии. Каждый игрок получает буквально своего персонажа, нарисованного под него.

  • Antstream Arcade — конвейер генерации стилизованных под архивные игры макетов уровней.

  • Dreamlands — генеративный крафтинг-движок, где предметы синтезируются на лету по словесному описанию.

Это не мировые модели в чистом виде, это гибрид: жёсткая логика игры в Unity/Unreal + сгенерированные ассеты + сгенерированный визуал. То, что Josh English в декабре 2025-го в статье «A Blueprint for World-Model Games» назвал «слой истины + генеративная оболочка»: детерминированная истина игры остаётся в традиционном движке, а перцептивный слой делегируется генеративной модели.

Где не работает и не будет работать в ближайшие 1–2 года

  • Полная игровая сессия. Genie 3 держит минуту памяти. Современная игровая сессия — часы. Открытый мир — десятки часов. Между ними — два-три порядка магнитуды разрыва, который нельзя закрыть просто увеличением контекстного окна.

  • Многопользовательские сценарии. Когда два игрока в одном сгенерированном мире, у них должна совпадать «реальность». Сейчас этого нет — мир дорисовывается отдельно для каждого наблюдателя, и они могут разойтись.

  • Точная физика для соревновательных игр. Counter-Strike не сделать на эмерджентной физике. Хитбоксы, баллистика, отдача — это области, где «модель видела миллион видео и догадалась» не работает. Здесь Unity и Unreal останутся доминирующими.

  • Большие ассеты, которые перевозятся между игроками. Мировая модель генерирует кадры. Если вы хотите дать игроку готовый меш персонажа, чтобы он его поставил в свой инвентарь, экспортировал в Blender или продал на маркетплейсе, — Genie 3 этого не делает. Это делает Marble (выдаёт 3D Gaussian Splats) или сторонние генераторы 3D.

Где это станет нормой — и как именно

Тут пора вспомнить про открытые MCP-серверы для игровых движков и 3D-инструментов, которые уже существуют. Они не часть Genie 3 и не часть экосистемы Google, но именно их связка с мировой моделью может перевернуть индустрию.

В открытом исходном коде сейчас есть как минимум четыре зрелых проекта:

  • Unity MCP (официальный, docs.unity3d.com) — встроенный в Unity AI Assistant 2.0, бесплатный, поддерживает Claude Code, Cursor, любой MCP-клиент. Даёт 51 встроенный инструмент: создать GameObject, изменить сцену, собрать Canvas-UI, управлять Input Actions, билдить проект. Полный контроль редактора Unity через естественный язык.

  • Bluepuff71/UnityMCP (GitHub) — Unity-нативная альтернатива, 40+ инструментов, без Node.js и Python, ноль телеметрии. HTTP-сервер на localhost:8080.

  • CoderGamester/mcp-unity (GitHub) — мост через Node.js, поддерживает не только Claude/Cursor, но и Google Antigravity, GitHub Copilot, OpenCode.

  • Blender MCP (ahujasid, GitHub) — сокет-сервер, который связывает Claude с Python API Blender. Создание мешей, материалов, освещения, выполнение скриптов на Python в Blender, интеграция с Poly Haven (бесплатные ассеты) и Hyper3D (генерация 3D из текста).

Связка, которая напрашивается сама собой: Genie 3 генерирует мир → Claude через Unity MCP создаёт игровую логику в этом мире → Blender MCP генерирует уникальные ассеты, которых нет в Genie → всё собирается в один билд.

Конкретный сценарий, который технически возможен уже сейчас, в мае 2026:

  1. Разработчик пишет в Claude Code: «Сделай мне средневековую таверну, как в World of Warcraft, но с японской эстетикой»

  2. Genie 3 (через Project Genie) генерирует играбельный 3D-мокап среды — можно зайти и походить

  3. Скриншоты из этого мокапа уходят как референс в Blender MCP, который генерирует конкретные меши (стол, табуретки, кружки, лампы) под нужным стилем

  4. Unity MCP импортирует эти меши и Genie-мир в сцену Unity, расставляет коллайдеры, освещение, навигацию для ИИ

  5. Claude Code пишет игровую логику на C# — диалоги NPC, квесты, инвентарь

  6. Разработчик играет билд, говорит «таверна получилась слишком тёмная», и весь конвейер запускается с правкой

Звучит как фантастика. На уровне «каждый компонент отдельно — работает» — это уже реальность. На уровне «все компоненты работают слаженно как конвейер» — это вопрос интеграции, которой может быть пара кварталов до первого рабочего прототипа.

Экосистема Google: вторая половина уравнения

Если на стороне разработки игр для интеграции нужны Unity MCP и Blender MCP, то для создания персонажей и ассетов Google уже выстроил свой собственный, гораздо более прямой конвейер. В нём четыре модели работают вместе как одно целое:

  • Imagen 4 — генерирует концепт-арт персонажа в высоком разрешении с почти точным рендерингом текста и нанесённой типографикой на материалах.

  • Veo 3.1 / Veo 4 — берёт референсную картинку персонажа из Imagen и генерирует видео-клипы с этим же персонажем в разных сценах, сохраняя его внешность между шотами (фича «Ingredients to Video»).

  • Nano Banana 2 — быстрая итеративная генерация картинок для UI-ассетов, иконок, мокапов.

  • Lyria 2 — генерация музыки и звуков под нужное настроение.

В тариф Google AI Ultra за $200/месяц (тот же, что даёт доступ к Project Genie) входит весь этот набор. То есть один и тот же подписчик может: сгенерить персонажа в Imagen, оживить его в Veo, поместить в мир, сгенерированный Genie, добавить саундтрек из Lyria.

Если предположить, что Google в течение 2026–27 годов выпустит официальный экспорт миров Genie (например, в формате glTF или USD), и добавит API для пакетной генерации в Veo/Imagen — конвейер «студия из одного человека» из научной фантастики превращается в продукт, который можно купить.


Что это значит для робототехники

Робототехника может выиграть от мировых моделей даже больше, чем разработка игр — по простой причине.

Игры можно делать на ассетах. Робота нельзя обучить на ассетах. Робот должен видеть реальные сцены с реальными вариациями. Сбор таких данных — это десятки тысяч человеко-часов команды разметчиков, тысячи часов вождения, специальные погодные условия, законные ограничения на симуляцию опасных сценариев.

Мировая модель снимает все эти ограничения одним движением. Хочешь обучить робота-пылесоса работать в квартире с тремя кошками — генерируешь миллион сцен с кошками. Хочешь обучить доставочного робота переходить улицу — генерируешь снежные, дождливые, ночные, солнечные версии нужного квартала.

В апреле 2026-го Decart прямо заявил, что Oasis (их вторая мировая модель) создана специально для физического ИИ — робототехники, автономного транспорта, производства, дронов. NVIDIA ещё в 2024-м встроилась в этот рынок через Omniverse и партнёрства с Toyota и Continental.

Ключевая фраза в этой нише — разрыв между симуляцией и реальностью (sim-to-real gap). Чем реалистичнее симуляция, тем меньше разрыв. Мировые модели на авторегрессионных трансформерах, обученных на видео, дают качество, которого симуляторы на Unity не достигают даже близко.


А что внутри этих миров? Виртуальная муха от Eon Systems

Всё, что выше — это про среду. Мир, в котором что-то происходит. Но в среде должны быть обитатели. Игры — это NPC, города в симуляторах — это пешеходы и водители, виртуальный квартал в Genie — это люди и животные.

В марте 2026-го стартап Eon Systems из Сан-Франциско показал то, что превращает прогноз про «обитателей виртуальных миров» из спекуляции в практику. Они загрузили в виртуальную муху работающий полный коннектом её мозга — все 139 255 нейронов и более 50 миллионов синаптических связей. Это не нейросеть, обученная вести себя как муха. Это цифровая копия мозга реальной мухи, нейрон за нейроном.

Виртуальная муха Eon Systems: 139 000 нейронов, 50 миллионов синапсов, симулированное тело в MuJoCo. Поведение не запрограммировано — оно эмерджентно из коннектома

Виртуальная муха Eon Systems: 139 000 нейронов, 50 миллионов синапсов, симулированное тело в MuJoCo. Поведение не запрограммировано — оно эмерджентно из коннектома

Цепочка событий выглядит так:

  1. 2024 год. Консорциум FlyWire (Princeton, 200+ исследователей, 50 лабораторий) публикует в Nature полную карту мозга взрослой мухи Drosophila melanogaster — все 139 тысяч нейронов и 50 миллионов синапсов, восстановленные через электронную микроскопию.

  2. Тоже 2024. Philip Shiu (ведущий учёный Eon) и коллеги публикуют в Nature вычислительную модель этого мозга, предсказывающую моторное поведение мухи с точностью 95%. Модель умеет «думать», но у неё нет тела.

  3. Март 2026. Eon Systems интегрирует эту модель с виртуальным телом мухи через фреймворк NeuroMechFly v2 и физический движок MuJoCo от Google DeepMind. Сенсорный ввод (то, что муха «видит» и «чувствует») идёт в коннектом, проходит через все 50 миллионов синапсов, превращается в моторные команды, симулированное тело их выполняет.

Виртуальная муха ходит, ухаживает за собой, ест. Никто не программировал ей эти движения. Никто не обучал её на тысячах часов видео реальных мух. Скопировали мозг — мозг включился — муха пошла.

Цитата из публикации Eon — в вольном переводе с английского: «Сенсорный ввод входит, активность распространяется через полный коннектом, моторные команды выходят, симулированное тело их исполняет — впервые в истории полной эмуляции мозга замкнут цикл от восприятия к действию».

Eon Systems открыто говорит про следующие шаги: полная цифровая эмуляция мозга мыши, а затем — эмуляция мозга человеческого масштаба. Сроки не названы. У мыши примерно 71 миллион нейронов, в человеке — 86 миллиардов. Разрыв в три порядка магнитуды, но та же самая методология.

Параллельная работа была у DeepMind в 2025 году — они тоже моделировали плодовую мушку, но обучением с подкреплением для управления симулированным телом, без использования коннектома. То есть рынок одновременно идёт двумя путями: «скопировать настоящий мозг» (Eon) и «обучить искусственный мозг вести себя как настоящий» (DeepMind).

Что меняется при связке с мировыми моделями

Здесь начинается самое интересное. Виртуальная муха пока бегает по примитивной 3D-арене на MuJoCo — несколько плоскостей, базовая геометрия. Что, если поместить её в мир, сгенерированный Genie?

Это технически возможно. MuJoCo от Google DeepMind и Genie 3 от Google DeepMind — это один и тот же стек одной компании. Мост между ними — вопрос инженерии, не вопрос принципиальной невозможности.

Что получается в итоге:

  • Среда генерируется Genie 3 — это любая сцена, любая погода, любое место

  • Тело агента симулируется в MuJoCo — это реалистичная физика и моторика

  • Мозг — это либо коннектом реального организма (подход Eon), либо обученная нейросеть (подход DeepMind)

  • Виртуальное существо живёт в виртуальном мире и ведёт себя как биологический организм, не как игровой NPC с прописанным деревом поведения

Для разработки игр это означает NPC, которые не «следуют скрипту», а реально реагируют на среду. Не «персонаж по триггеру убегает от игрока», а «у персонажа есть моторные паттерны, и при определённом стимуле он действительно убегает».

Для робототехники это означает, что физический робот может тестироваться в симуляции, где другие участники сцены — не запрограммированные актёры, а биологически правдоподобные модели. Лошадь, которая шарахается от грузовика, шарахается так, как шарахается реальная лошадь, потому что внутри у неё симулированный коннектом, а не цепочка «если — то».

Для науки это означает, что в виртуальном мире можно ставить эксперименты, которые невозможны или неэтичны в реальном. Что произойдёт с мухой при определённом нейромедиаторе? Загрузил симуляцию, ввёл нейромедиатор в коннектом, посмотрел.

Eon Systems указала эмуляцию мозга мыши как ближайшую цель. Если коннектом мыши будет завершён к 2027–28 году (текущие проекты по картированию мозга млекопитающих идут в эту сторону), то связка «мир Genie + мышь в нём + полный коннектом мыши» становится технически достижимой к 2028–29 году.

Тогда фраза «виртуальный мир» начинает значить буквально то, что значит — мир со своими организмами, физикой и поведением, отличающийся от реального только тем, что его можно поставить на паузу и сбросить к началу.


В сентябре 2025-го, когда Demis Hassabis в ответ на твит «когда уже играбельные мировые модели?» написал «вот это было бы что-то», он, скорее всего, уже знал, что выйдет на сцену через восемь месяцев. Мировые модели из категории «академическое исследование» переехали в категорию «коммерческий продукт за $200/месяц». Через год они переедут в категорию «открытый API», ещё через год — в категорию «модель с открытым исходным кодом, которая запускается локально».

И в этот момент мы окажемся в ситуации, в которой индустрия разработки игр ещё ни разу не была: средство производства игр сравнивается по доступности со средством их потребления. Что произойдёт дальше — зависит от того, кто к этому моменту успеет построить нужные мосты между мировыми моделями, игровыми движками и 3D-инструментами.

Большая часть кирпичей для этих мостов уже лежит в открытом исходном коде. Кто-то возьмёт и сложит.

ссылка на оригинал статьи https://habr.com/ru/articles/1038818/