Домик для ИИ: как завод пришёл к идее AI ready для бизнеса

от автора

Бизнес нацелился делать свой собственный AI. Все задают вопрос: «Какая модель мне нужна?» Но никто не задумывается, на каких мощностях модель будет работать. 

Мы тоже сначала не задумывались. Разработали корпоративного AI-агента, прокачали ИТ-команду, чтобы двигаться дальше — и споткнулись о «железный порог». Так родилась идея AI ready модуля. В статье рассказали, что это такое и почему AI начинается не с модели, а с инфраструктуры. 

Как в чатах с GPT родилась истина

Первая, реально полезная и применяемая, функция GPT — поиск. Поиск в Гугле 30 лет назад избавил нас от многочасовых бдений в библиотеках, теперь ИИ экономит время на сёрфинг в браузере. 

Я технооптимист. Мой личный опыт поиска в GPT быстро перекинулся на корпоративную среду — проник во все бизнес-процессы машиностроительной компании. К поиску присоединились аналитика, расчёты, мониторинг и копирайтинг. Летом мы начали разрабатывать собственного AI-агента.  

На первом этапе внедрения хватило своих действующих серверов. Для следующих R&D-проектов запланировали закупку первого GPU (графического процессора). Тут мы задумались: что делать промышленникам, которым нужно сразу несколько моделей — например, AI-агент c RAG, видеоаналитика, предиктив?

Чат-бот может пожить и в офисной серверной. Когда появляются сложные LLM- и VLM-модели, ИИ нужна жилплощадь побольше. Конечно, можно всё разместить в облаке, но директора по информационной безопасности это не обрадует. А если ИИ нужен на месторождении или заводе в удалённом регионе? Там и вовсе никаких вычислительных мощностей под рукой нет.

ПСМ работает в области ИТ, но базовый профиль — инжиниринг. Поэтому в создании моделей мы увидели прежде всего инфраструктурный вызов. 

Искусственный интеллект работает на вполне осязаемой инженерной базе: энергия, холод, процессоры и серверы. Поэтому прежде чем завести себе корпоративный ИИ, нужно решить, где он будет жить. 

Проект AI ready запустили полгода назад. Однажды вечером я позвонил Антону, нашему директору по развитию в ЦОДах: «Нужно собрать инженерку, вычисления и прикладной AI в один модуль». Быстро подключили инженеров, ИТ, маркетинг и упаковали новый продукт. Но обо всём по порядку.  

Модульный ЦОД: первая гипотеза

Чтобы запустить модели, нужна собственная инженерная и вычислительная мощность для AI-нагрузки. Мы говорим не о временных «игрушках», а об AI-сценариях, которые реально оптимизируют бизнес-процессы — именно их имеют в виду, когда грозят операционному персоналу ИИ-замещением.

Почему «реальному AI» нужна какая-то особая нагрузка? Представьте умную колонку у вас на кухне: она включит любимую музыку, только если есть розетка, подписка и плейлист «мне нравится». Так же с моделями: чем умнее колонка, чем больше у неё функций — тем мощнее розетка, дороже подписка и объёмнее данные. 

 Где взять мощность? Первое, что пришло в голову, — модульный ЦОД.   

Модульные ЦОДы (МЦОД) — локальная альтернатива классическому дата-центру. Их применяют, когда нужно быстро развернуть вычислительную мощность на удалённом объекте, или как временное решение, пока строится «капитальный» ЦОД.

Модульные ЦОДы (МЦОД) — локальная альтернатива классическому дата-центру. Их применяют, когда нужно быстро развернуть вычислительную мощность на удалённом объекте, или как временное решение, пока строится «капитальный» ЦОД.

Чтобы составить техзадание на проектирование МЦОДа, нужно рассчитать мощность для управления моделями. ИТ-мощность МЦОДов в среднем не превышает 300 кВт, т.е. они спроектированы под меньшую плотность нагрузки, чем требует AI.

Расчётная тепловая нагрузка на стойку в базовой конфигурации AI-МЦОДа — 25–40 кВт. Это в 2 раза больше, чем в модульных ЦОДах, которые тиражируют российские производители. Да, эти МЦОДы можно масштабировать, наращивая мощность. Но увеличение нагрузки на стойку полностью меняет подход к энергоснабжению и охлаждению. 

У высокоплотных стоек с GPU выше требования к мощности ИБП, номиналу распредоборудования, токовым нагрузкам кабелей и шинопроводов. GPU греются, как чёрный седан посреди пустыни, и нуждаются в спасительном водовоздушном охлаждении стойки (RDHx) или чипов напрямую (Direct-to-Chip) вместо привычного внутрирядного охлаждения (In-Raw). С учётом всего этого в AI-МЦОДе нужно пересматривать компоновку.

Одним словом, мы не нашли готового решения для AI-нагрузки, в котором были бы интегрированы энергетика, охлаждение, вычисления, системы безопасности и автоматика. Поэтому решили сделать его сами.

От энергетики к цифре

Задача «построить домик для ИИ» оказалась профильной для ПСМ, благодаря тому, что мы — завод по производству энергетического оборудования. Компетенции в распределённой энергетике, производстве блок-модулей и строительстве энергосистем для классических ЦОДов стали трамплином для проектирования.      

В 2024 году мы взяли в работу большой проект для компании Selectel — энергоцентр для резервирования центра обработки данных уровня Tier IV.

В составе энергоцентра: 

  • Дизельные электростанции общей мощностью 8 МВт;

  • КТП общей мощностью 40 МВА;

  • Энергомодули с ИБП общей мощностью 8 МВт.

В контексте AI интересен энергомодуль. Это префаб-решение, которое отвечает за переключение электропитания от сети на аварийную генерацию без токовых пауз.

В комплектации энергомодуля: распределительное оборудование, аккумуляторные батареи, источники бесперебойного питания, блоки управления и автоматизации. Всё это установлено в едином пространстве контейнера.

В комплектации энергомодуля: распределительное оборудование, аккумуляторные батареи, источники бесперебойного питания, блоки управления и автоматизации. Всё это установлено в едином пространстве контейнера.

ИБП вырабатывают большой объём тепла, поэтому пространство энергомодуля мы разделили на холодный и горячий коридоры — так же, как в машинном зале дата-центра. Проект для Selectel выявил общие точки энергетической и вычислительной инфраструктур в компоновке, организации воздушных потоков, резервировании и охлаждении. Этот опыт приблизил нас к концепции AI-МЦОДа. 

Ещё один повод убедиться: развитие технологий искусственного интеллекта напрямую зависит от энергетики. Лидерство в гонке за ИИ стоит не только за ИТ-компаниями, но и за производителями энергосистем.

Вычисляем лучшие предложения рынка

Сформировали пул поставщиков графических процессоров для работы с моделями. Хорошая новость: они знают всё про графускорители, серверы и подключение по сети. Плохая — за синхронизацию с инженеркой они не отвечают. И наоборот: те, кто делает инженерную базу, не торопятся отвечать за интеграцию GPU и серверов.

Решили, что стыковать инженерную и вычислительную части модуля будем сами. На изучение рынка GPU потратили полгода: нашли профильных специалистов в команду, посетили несколько производств и работающих AI-проектов за рубежом. 

За исследованиями и наработками инженеров с интересом наблюдала команда ПСМ UNLIM — отдельной ИТ-компании в структуре ПСМ. На одном из тактических совещаний по AI коллеги озвучили решающий тезис:

Мы самостоятельно обучаем модели, проработали автономную инфраструктуру для AI-нагрузки — значит можем создавать локальные AI-контуры под ключ

Так оформилась концепция AI ready модуля — домика для ИИ.

Сколько этажей в домике?

AI ready — инфраструктура, готовая к обучению моделей и созданию прикладных AI-решений для бизнеса. 

В AI ready есть 3 функциональных слоя: 

  • Инженерная база (энергетика и охлаждение);

  • Вычисления (GPU, графические процессоры);

  • Платформа управления моделями.

ИИ живёт в домике из трёх этажей. Облако для многих компаний пока работает, как лифт, доставляя бизнес сразу на третий этаж — к рабочей прикладной модели. Но облачный ресурс планомерно исчерпывает себя, а «лестницы» для подъёма на третий ИИ-этаж пока не оборудованы. Это и есть главная предпосылка к созданию AI ready.

Пройдёмся по всем этажам. Мы не зря сравниваем AI ready с трёхэтажным домом: каждая последующая составляющая в контуре базируется на предыдущей и дополняет её.

AI Base

Основа AI ready — это не процессоры и не модели, как можно подумать. Большую часть инфраструктуры составляют энергетика, охлаждение и безопасность. Инженерная концепция по сути такая же, как в любом дата-центре.

Этот «этаж» ПСМ обустраивает самостоятельно: расчёт мощности, блок-модуль, распредка, жидкостное охлаждение, охранно-пожарная безопасность и автоматизация через SCADA. Если на площадке размещения AI ready нет доступной мощности от сети, но есть лимит газа (или возможность проведения), то мы также закрываем задачу электроснабжения собственной газовой генерацией.

Пример газового энергоцентра: может работать автономно в островном режиме или в параллели с сетью для снижения затрат и стабилизации нагрузки.

Пример газового энергоцентра: может работать автономно в островном режиме или в параллели с сетью для снижения затрат и стабилизации нагрузки.

AI Cluster

В базовую инфраструктуру AI ready модуля встраивается контур вычислений и информационной безопасности. Пока без прикладных сценариев. К пятой итерации пилота спецы из инжинирингового центра ПСМ зафиксировали рабочую конфигурацию AI ready в заводской готовности к «заселению» ИИ.

В конфигурацию входят:

  • Процессоры GPU / CPU;

  • Система хранения данных;

  • Структурированная кабельная система;

  • Сеть передачи и управления данными;

  • Виртуальная или контейнерная среда запуска AI-сервисов;

  • Базовый мониторинг вычислительного контура.

AI Factory

Третий этаж AI ready — ключевой слой, который гарантирует, что ИИ «приживётся» в домике.

В структуре ПСМ есть своя ИТ-компания — ПСМ UNLIM — которая закрывает вопрос обучения моделей и выхода на прикладные сценарии. Поскольку продукт AI ready мы полностью разработали сами, интеграция всех «ИИ-этажей» проходит с минимальными и быстро устранимыми нестыковками.

На самый верх: ИТ-контур и прикладной ИИ 

Надо сказать, что команда ПСМ UNLIM изначально вообще не занималась искусственным интеллектом. Компания органически сформировалась из внутренних потребностей завода-производителя электростанций в автоматизации. Первые задачи были связаны с внедрением 1С:ERP и 1С:MES для производства. 

Позднее ИТ-разработчик с компетенциями завода запустил собственные цифровые решения: платформу для мониторинга и предиктивной аналитики и  системы управления на базе SCADA.

Корпоративный AI-агент — тоже внутренняя потребность. 

С конца 2025 года в ПСМ внедрили:

  • Attention-ботов, которые мониторят входящие обращения и предупреждают о возможных рисках, связанных со сроками реагирования и реализации;

  • AI-помощника на базе Bitrix24 и в веб-формате, который работает с текстовыми запросами и файлами в контексте корпоративной базы знаний (RAG); 

  • RAG-технологии для создания цифровых паспортов оборудования и эксплуатационной документации;

  • Юридические AI-сценарии для ускорения процессов согласования контрактов;  

  • Видеоаналитику для контроля соблюдения требований охраны труда и контроля качества на производстве.

На очереди — запуск первого сервера для R&D локальных моделей. 

Внутренний AI-стартап дал ПСМ UNLIM новый статус — разработчика AI-платформ и прикладных моделей. AI ready транслирует технологии в рынок, даёт бизнесу и регионам мощный старт в мировой гонке за ИИ.

Тем, кто не хочет читать всё, но хочет понять, что такое AI ready

  • Развитие сложных прикладных AI-моделей возможно только при наличии энергетической и вычислительной мощности — по сути локальных модульных ЦОДов. 

  • На российском рынке AI-ЦОДы продают только «по кускам»: энергия, холод, вычисления, софт — всё по отдельности. Размытие ответственности — риск для интеграции и корректной работы  прикладного AI-слоя.

  • Продукт AI ready собирает ответственность за все «куски» в одной точке. Это инженерная и вычислительная база с интегрированной AI-платформой для управления моделями.

  • AI ready строится последовательно, как «трёхэтажный дом» для ИИ:

  1. AI Base. Блок-модуль с электротехникой, охлаждением, системами автоматизации и безопасности;

  2. AI Cluster. GPU и серверы для вычислительной готовности модуля;

  3. AI Factory. ИТ-контур для управления моделями и разработки прикладных AI-сценариев.

  • Конечный результат — закрытый локальный AI-контур с широкими прикладными возможностями: от компактных LLM-моделей для оптимизации рутины до видеоаналитики и цифровых двойников. 

  • Концепция AI ready может включать строительство собственной газовой генерации для удалённых и энергодефицитных площадок.

  • AI ready придумал не ИТ-разраб, а завод-производитель энергетического оборудования.

  • Лирическое заключение: AI ready решает эту проблему дефицита мощности, приводит к полной заводской и цифровой готовности — для мощного старта в гонке за ИИ.

ссылка на оригинал статьи https://habr.com/ru/articles/1046576/