ЦИПР — «Цифровая индустрия промышленной России» — это одна из главных в стране конференций про промышленную цифровизацию, проходит уже одиннадцатый год. И это, вопреки названию, не выставка станков и не парад чиновников. Это место, где разработка встречается с промышленностью: Яндекс, Сбер, «Газпром нефть», «Росатом», «Северсталь», операторы связи привозят сюда не пресс-релизы, а свои инженерные команды и то, что эти команды собрали: ИИ-агентов, компьютерное зрение, языковые модели, MLOps-платформы. По стендам ходят не только министры и губернаторы, но и те, кто эти системы реально пишет: CTO, тимлиды, руководители ИИ-направлений. На пленарке — премьер-министр; на сессиях рядом — доклады про инференс, дообучение и архитектуру агентов. В этом году форум собрал больше 13 тысяч человек из 46 стран, около 185 стендов и за 350 подписанных соглашений. Если коротко — это место, где видно не моду, а то, что промышленность и госкорпорации реально готовы внедрять и за что готовы платить.
Я только что оттуда вернулся — и первым делом полез на Хабр посмотреть, что пишут с форума. Почти ничего. Профильная же тема, ну? Ладно, напишу сам. Только это будет не обзор стендов: три дня я ходил по сессиям, слушал, говорил с людьми — и дальше попробую разобрать, как рынок ИИ в России устроен на самом деле, без презентационного глянца.
На всякий случай напомню, меня зовут Климент Викулов, я сооснователь GPTunneL. Это платформа, через которую 2 миллиона человек и 4500 компаний работают с ИИ: единый доступ к двум сотням типовым ИИ-моделей с оплатой в рублях, а поверх — RAG, агенты, оркестрация, и, собственная модель GROM. Среди наших корпоративных клиентов Северсталь, Евраз, ряд дочерних компаний Сбера, и ещё с полсотни компаний такого же калибра; с самим Сбером работаем по GigaChat. Энтерпрайз такого уровня не приходит на сервис, который не прошёл ряд его корпоративных проверок, а это долгая и муторная процедура, и в сфере ИИ её проходят единицы.
Говорю это не ради хвастовства, а чтобы было понятно, откуда я смотрю на рынок: не из зала, а изнутри — вижу, что реально внедряется у крупных заказчиков, а что остаётся красивым слайдом. На ЦИПР мы стояли на стенде МТС, с которым делаем совместное решение, к нему я ещё вернусь позже, отдельным разделом.
И сразу обозначу: всё, что дальше — это моё личное мнение, взгляд из нашей практики, а не истина в последней инстанции. Что-то я говорю как факт, а что-то — это просто моя оценка, и я буду честно показывать, где одно, а где другое. С какими-то выводами вы не согласитесь — и это нормально.
Вывод, к которому я пришёл, простой. Весь промышленный ИИ в России сегодня держится на двух компаниях — на Сбере и Яндексе. Дальше — о том, почему так вышло, к чему это ведёт и где в этой картине все остальные.
Форум двух компаний
Я походил по стендам и сессиям, послушал, кто что внедряет и поймал ощущение, которое потом подтверждалось в каждом втором разговоре. С кем из корпоратов ни заговоришь про ИИ, за спиной у него либо Сбер, либо Яндекс.
Это не фигура речи. Объединённая авиастроительная корпорация (ОАК) тестирует GigaChat для проектирования авиадеталей. Объединённая двигателестроительная корпорация (ОДК) делает со Сбером компьютерное зрение для контроля качества двигателей. «Газпром нефть» и «Норникель» строят промышленных агентов с Яндексом. «Северсталь» принципиально идёт своим путём на открытых моделях, но это лишь исключение, подтверждающее правило. Слушаешь сессии по промышленному ИИ, и складывается устойчивая картинка: по одну сторону стола заказчик, по другую — один из двух.
Дальше можно было бы съехать в публицистику про монополизацию. Но мне интереснее разобрать, почему так вышло. Потому что это не лень рынка и не заговор — это его физика.
Три дефицита: вычисления, данные, деньги
Чтобы построить и содержать сильную модель, нужны три вещи: вычисления, данные и деньги. Деньги — это ещё и люди, и время. Не хватает хотя бы одного — и ты уже не игрок в лиге моделей. В России в дефиците все три сразу. И всё, что по этим трём пунктам в стране вообще набралось, собрано ровно у двух компаний.
Разберу по очереди — от самого обсуждаемого дефицита к самому, на мой взгляд, недооценённому.
Дефицит первый: вычисления
Про дефицит железа на форуме говорил каждый, кто внедряет ИИ. Цифры, которые звучали: в 2024-м в России запустили около 14 тысяч серверных стоек, в 2025-м — примерно впятеро меньше. Срок окупаемости одного ЦОДа из-за ключевой ставки вырос с 6–8 до 10–12 лет — замораживать деньги на такой срок мало кто готов. Все дата-центры страны потребляют порядка 1,5 ГВт; в Китае для сравнения — около 30 ГВт. Новейших чипов Blackwell в товарных количествах нет почти ни у кого.
Это уровень, на котором ресурс конечен даже у гигантов. Сбер в своё время просил у государства 450 млрд рублей на дата-центр и получил отказ — предложили строить за свой счёт. Если уж Сберу говорят «стройте сами», то у остальных вопрос «где взять вычисления для своей модели» закрыт по умолчанию.
И здесь — оговорка, без которой вся картина выйдет кривой. «Держится на двух» не значит, что эти двое сильны по мировым меркам. По оценкам отраслевых источников, у Сбера и Яндекса вместе — порядка пары десятков тысяч ускорителей NVIDIA. Для России это много. Но один крупный западный гиперскейлер ворочает сотнями тысяч, а у мировых лидеров счёт идёт уже на миллионы. Так что два игрока держат рынок не потому, что они огромные, а потому что все остальные отстали ещё сильнее.
Дефицит в России вообще не точечный, а сплошной. Не хватает, по сути, всего сразу: мощных дата-центров под обучение, размеченных датасетов, денег и — отдельная боль — собственных чипов. Россия не производит ИИ-ускорители; всё, на чём работают и Сбер, и Яндекс, и мы, — это NVIDIA, приехавшая по параллельному импорту. Именно поэтому Сбер лезет в микроэлектронику: в начале 2026-го он выкупил долю в группе «Элемент», крупнейшем российском производителе чипов, по сути, заявка на роль «русского Huawei». История долгая, не на один год, но сам факт показателен: лидер рынка вынужден закрывать дефицит на уровне физического кремния.
А теперь — то, в чём я с рынком расхожусь.
Смотрел инфраструктуру у крупных российских игроков и обратил внимание: инференс крутится на тяжёлых датацентровых картах NVIDIA — A100, H100, где-то и H200. Это отличное железо — для обучения моделей это топ, без вариантов. Но гонять на такой карте продакшн-инференс средних моделей — это как возить пиццу на КамАЗе. Доедет, просто посмотрите на расход.
Логика простая. Большая часть реальных корпоративных задач — это модели на 7–32 миллиарда параметров: агенты, ассистенты, классификаторы, разбор документов. Фронтир на 200B+ нужен далеко не везде. А модель уровня 30B в квантизации спокойно живёт на потребительском Blackwell — RTX 5090 с 32 ГБ и даёт цену за миллион токенов ниже, чем H100 на сопоставимой нагрузке. Это не маркетинг, это публичные бенчмарки. Китайцы, которых зажали экспортными ограничениями, давно считают экономику инференса именно так — дешёвое железо плюс агрессивная квантизация плюс грамотный батчинг.
Честный нюанс: 70B+ и фронтир на потребительской карте не закрыть — не хватит памяти, нет NVLink, нет ECC. Для этого по-прежнему нужен датацентровый Blackwell или связка A100/H100. Так что нехватка вычислений никуда не девается: фронтир требует масштаба, который есть у двоих.
Но часть дефицита — рукотворная. Дорогое железо занято тем, что прекрасно уехало бы на железо в разы дешевле. И это не теория: я и сам на ЦИПР искал, у кого взять серверы под инференс нашей модели GROM, предварительно нашёл поставщиков. Потребительский Blackwell, привезённый через Китай и сертифицированный для ввоза в РФ, задачу закрывает. Российская модель на видеокартах, приехавших по параллельному импорту — над словом «суверенитет» тут можно иронизировать сколько угодно, но экономически это работает.
Дефицит второй: данные
А вот это, на мой взгляд, самый недооценённый из трёх дефицитов, и я бы хотел, чтобы на форуме про него говорили больше, чем про видеокарты.
Современная модель учится на триллионах токенов текста. И тут неудобная арифметика: качественного русскоязычного текста в мире кратно меньше, чем англоязычного. Для общих моделей Сбер и Яндекс выгребли русскоязычный веб настолько, насколько он вообще выгребается. Лёгкие данные закончились.
Но ЦИПР — форум не про общие модели, а про промышленный ИИ. А самые ценные промышленные данные — чертежи, телеметрия станков, базы дефектов, логи ремонтов, технологические карты лежат запертыми внутри корпораций. Это их интеллектуальная собственность, и просто так наружу её никто не отдаст. На пленарке это, кстати, прямо признали: данных для обучения индустриальных моделей у разработчиков, по сути, нет, а как корпоративную ИС «допускать» к обучению — Минцифры ещё только предстоит придумать.
И вот тут ключевая мысль всего текста.
Промышленный ИИ в России сегодня нельзя купить как готовый продукт. Потому что это пока и не продукт — это серия партнёрств вокруг доступа к данным. ОАК пускает партнёра к своим данным по нервюрам — и тот обучает модель. ОДК пускает к данным с производства двигателей — и появляется компьютерное зрение. Каждый промышленный кейс — это отдельная сделка про данные, а не покупка лицензии.
А чтобы такие сделки заключались, нужна не технология. Нужен вес: масштаб, репутация, возможность сесть за стол с ОАК или «Норникелем» на равных. Такой вес в стране есть у двух компаний. Поэтому Сбер и Яндекс в каждом проекте — не потому, что у них «лучшая российская модель», а потому что промышленный ИИ устроен как переговоры о данных, а вести их по плечу единицам.
Это и есть ответ на вопрос «почему два имени». Не модель — данные.
Здесь добавлю и свой опыт. У нас есть собственная модель, GROM, и работа над ней показывает то же самое. Видеокарты — вопрос решаемый: ищем варианты, и в ближайшее время закроем. А данные — нет. Самое ценное здесь, отраслевые наборы, заперто у тех, кто сам модели не строит. И в этот потолок упирается каждый — лидеры тоже, просто у них он выше.
Дефицит третий: деньги
И последнее. Обучение конкурентоспособной фронтир-модели — это, по оценкам, которые звучали на форуме, расходы порядка триллиона рублей, и дальше будет только дороже. Один только Сбер вкладывает в ИИ около 600 млрд рублей за 2024–2026 годы, из них 350 млрд — в одном лишь 2026-м. Это не венчурные деньги и не раунд — это бюджет корпорации или государства, который надо жечь годами без гарантии возврата.
Любопытно, что отставания в кадрах и фундаментальной науке эксперты на форуме как раз не фиксируют — российские специалисты сильны и востребованы, в том числе в западных командах. То есть деньги тут не про то, чтобы нанять умных. Они про то, кто может позволить себе не останавливаться.
Сложите три дефицита вместе — и список тех, кто закрыл все три, закономерно сходится к двум.
Что показал сам Сбер и Яндекс
Раз уж речь о них — коротко, что Сбер и Яндекс привезли на форум.
Сбер показывал ГигаКоворк — платформу управления автономными агентами для всей компании. На стенде нам сказали, что решение уже в проде. Я честно попробовал это пощупать: потыкал демо, нажал «назад» — и поймал моргающий курсор, будто страница всё ещё считает себя полем ввода. Мелочь, не спорю, и вполне может быть частностью конкретного стенда. Но ощущения готового боевого продукта у меня лично не возникло. Сразу оговорюсь: это субъективное впечатление от 30 минут у чужого стенда, а не вердикт.
Зацепило меня другое, посерьёзнее. Под капотом у платформы — только GigaChat. На мой взгляд, агентскому решению такого масштаба логично уметь работать и с открытыми моделями: под разные задачи — разные модели, так и дешевле, и гибче. Но тут признаю честно — не мне решать: у Сбера своя модель и свои причины её продвигать.
Яндекс зашёл с другой стороны — со стороны продукта для людей: Алиса, агенты, которые выполняют задачи за пользователя, агентная коммерция, носимые устройства со встроенным ИИ. Если совсем коротко, разница в акцентах такая: Сбер заходит в ИИ как инфраструктура, Яндекс — как продукт. Обе ставки выглядят рабочими.
«Промт-инженер» — это не профессия
Отдельно зацепила одна реплика. Андрей Белевцев, старший вице-президент Сбера и руководитель блока «Технологическое развитие», высказался про модную профессию «промт-инженер». Смысл был такой: отдельной должности «промт-инженер» не существует, и если кто-то предлагает вас на неё выучить — это инфоцыганство. Писать промты сегодня должен уметь каждый. Это как 30 лет назад искали «человека, который умеет работать с компьютером», а потом навык стал базовым для всех, и отдельная вакансия отпала сама собой.
Согласен полностью. Уметь писать промты обязан каждый — от бухгалтера до разработчика. Это не отдельная каста, это новая базовая грамотность. И если видите курс «выучись на промт-инженера за два месяца» — сэкономьте деньги: навык набивается ежедневной практикой, а не сертификатом в рамочке от новомодного коуча из инстаграмма.
Где в этой картине все остальные
Если фронтир-модели — удел двоих, значит ли это, что остальным на рынке ИИ делать нечего? Наоборот. Ценность для бизнеса создаётся не на уровне модели, а поверх неё — в продуктах, которые решают конкретную задачу. И этот слой открыт для всех: тут не нужны ни свой дата-центр, ни триллион рублей, ни доступ к данным «Норникеля» — нужно понимать боль заказчика и быстро собирать работающее.
И тут пора разобраться с термином, который на нас вешают регулярно. GPTunneL почти в каждом обзоре записывают в «агрегаторы нейросетей» — и я знаю эту категорию изнутри, поэтому скажу прямо: как самостоятельный бизнес чистый агрегатор сегодня мёртв. Собрать в одном окне доступ к чужим моделям было хорошей идеей для 2023–2024 годов, когда дефицитом был сам доступ. Сейчас это просто арбитраж — обернул чужой API, добавил оплату рублём, взял маржу, — и эту маржу схлопнули с двух сторон.
Снизу давит серый рынок: масса продавцов, в том числе китайских, льёт доступ через API кратно дешевле себестоимости — фермы аккаунтов, серые ключи, промокредиты. Часто это даже не настоящий API: продавцы проксируют доступ через подписочные продукты вроде Codex и выдают его за API — снаружи похоже, но функционал урезан, ни стабильных лимитов, ни гарантий. И главное — это ненадёжно: такие сервисы появляются десятками в месяц и так же тихо закрываются через пару месяцев (нам в компанию только за неделю прилетает два-три подобных предложения). В моменте выигрываешь на цене, а потом остаёшься без доступа посреди рабочего процесса.
Сверху маржу давят крупные игроки с собственной инфраструктурой. Когда у тебя свои дата-центры, доступ к моделям перестаёт быть отдельным бизнесом и становится копеечной услугой поверх того, что и так есть. Чистому перепродавцу против этого играть нечем: ни серых схем, ни своего железа. Токен стал биржевым товаром, а бизнесом — то, что строится поверх него.
Поэтому всерьёз закрепляются те, кто пошёл глубже: снаружи всё то же окно с моделями, а внутри — пайплайны и целые продукты на нейросетях, RAG, агенты, оркестрация, контроль данных. В этот слой зашли и сами крупные компании. У Ростелекома есть Нейрошлюз. Билайн пошёл к малому бизнесу и ИП: доступ к топовым моделям — Claude, Seedance 2.0, Veo, NanоBanana и тд — можно подключить прямо в личном кабинете оператора; ход, на мой взгляд, разумный. Свои сборки есть у MWS GPT и ещё у нескольких крупных компаний.
ИИ-Фабрика: продуктовый слой встречает инфраструктуру
Вот на этом, продуктовом слое, работаем и мы. GPTunneL даёт бизнесу доступ ко всем актуальным моделям в одном интерфейсе — да, это в том числе и есть тот самый «доступ», и это нормальная, живая часть продукта. Но только им мы не ограничиваемся: поверх — пайплайны, RAG, агенты, оркестрация, своя модель GROM. Доступ — это вход; ценность создаёт то, что на нём построено.
На стенде МТС мы показывали ИИ-Фабрику — совместный продукт GPTunneL и МТС. Он хорошо объясняет, что я имею в виду под «продуктом поверх инфраструктуры», поэтому разберу его как пример, а не как витрину.
Для заказчика это выглядит как наш типовой интерфейс — т.е. одно окно ко всем топовым нейросетям: 200+ моделей, доступных без VPN и с оплатой российской картой, причём не только текстовых — модели для фото, видео и музыки тоже здесь. Одна из моделей под капотом — наша GROM. Всё это либо работает в дата-центрах МТС, либо разворачивается on-premise, в контуре заказчика — и тогда данные не покидают периметр компании вообще.
Зачем это бизнесу — видно на простом примере. Маркетингу нужно снять киношную рекламу на современных видеомоделях, разработчикам — подключить Claude для написания кода. Обычный путь сегодня — идти на сторону, и тут два варианта, оба так себе. Первый — сомнительный посредник: непонятно, как закрывать оплату документами, лишние вопросы от бухгалтерии, и тот самый риск, о котором шла речь выше, — сегодня сервис есть, завтра нет. Второй — личная иностранная карта: корпоративный контент уходит через чужой периметр, а аккаунт, который сегодня работает, завтра может быть заблокирован. ИИ-Фабрика делает ту же задачу внутри собственного контура компании. Ценность здесь — не в моделях, модели у всех одни и те же. Ценность в том, что вокруг них собрано.
Лоукод, который всё никак не кончится
Ещё одно наблюдение, и оно тревожит меня сильнее моргающего курсора.
На ЦИПР очень много лоукода и ноукода: конструкторы, визуальные сборщики пайплайнов, «перетащи блок, соедини стрелочкой». Само по себе это не плохо — лоукод закрывает реальную боль. Проблема в другом: когда лоукодом меряют передовой край.
Мир разработки за последний год уехал в другую сторону — в vibe coding. Ты формулируешь, что хочешь, а агент пишет код, чинит баги, гоняет тесты, патчит репозиторий. Это не «блоки мышкой» — это работа с кодовой базой на естественном языке. На ЦИПР вайбкод как мейнстрим почти не звучал. И тут Россия выглядит на полтакта позади: мы обстоятельно осваиваем конструкторы ровно тогда, когда передовой край уже сместился к агентам, которые пишут сами. Ощущение, будто все увлечённо учатся водить машину с автоматом, а по соседней полосе уже едут вообще без водителя.
Телеком: своя железка наконец поехала
Физически чуть ли не половину форума занимали операторы связи — повестка у них своя, отдельная от ИИ-трека. Коротко: МегаФон с YADRO впервые запустил отечественную базовую станцию в городе-миллионнике, она работает прямо в Нижнем. Билайн тестирует 5G в 11 городах, но коммерчески запуститься пока не может — нет разрешения регулятора. МТС показала аэромобильный комплекс связи — по сути, дрон с базовой станцией, разворачивающий покрытие там, где его нет.
Что показательно: для ИИ-трека новость дня — «агент заменил рабочую роль», для телекома — «наконец-то своя железка вместо импортной». Один форум, а скорости — будто из разных десятилетий.
Что в итоге
Дуополия, с которой я начал — это палка о двух концах.
С одной стороны, концентрация сейчас эффективна. Кто-то должен тащить инфраструктуру и заключать тяжёлые сделки про данные, и хорошо, что в стране есть кому. С другой — это хрупко. Когда хребет всего промышленного ИИ страны — это один банк и одна интернет-компания, любой их сбой или разворот становится сбоем целой отрасли. И главный дефицит в этой картине — даже не видеокарты и не данные, а тонкий продуктовый слой поверх двух гигантов. Лидеры дают инфраструктуру. А тепло по домам должен развозить кто-то ещё, и вот этого «кого-то ещё» в стране пока мало.
Отставание есть, отрицать его глупо. Но закрывается оно не лозунгами с пленарок, а скучной работой: считать экономику инференса, доводить продукты до боевого состояния, придумать наконец рамку, по которой корпорации смогут отдавать данные в обучение, не теряя на этом интеллектуальную собственность. Вот это — повестка. А «у нас тоже есть своя модель» — давно уже почти не новость.
И последнее, чтобы по-честному. Всё выше — мой личный разбор: один форум, одна точка зрения, взгляд практика, а не объективный отчёт. В деталях я вполне могу ошибаться. Если вы видите рынок иначе — спорьте в комментариях, ради такого разговора я это и пишу.
ЦИПР для меня не последняя точка в ближайший месяц. Дальше — ПМЭФ: если там будет что-то стоящее по части ИТ, напишу отдельно. А в середине июня едем в Китай — искать решения для наших моделей и заключать официальные партнёрства с рядом китайских поставщиков. По сути, едем напрямую к лидерам — и в моделях, и в железе. Про эту поездку расскажу отдельным постом, как вернёмся. Так что продолжение следует.
Если хотите следить за этим вживую, не дожидаясь статей на Хабре, то у меня есть телеграм-канал https://t.me/kliment_vikulov , там пишу о таких вещах намного чаще и подробнее и показываю изнанку (которая не под NDA): поездки, переговоры, тесты моделей, иногда — неожиданных пользователей нашего сервиса.
ссылка на оригинал статьи https://habr.com/ru/articles/1039834/