Сбербанк рассчитывает использовать китайские чипы для GigaChat

от автора

Сбербанк рассчитывает использовать китайские микрочипы для развития GigaChat — своей флагманской модели искусственного интеллекта. Об этом глава банка Герман Греф заявил во время визита Владимира Путина в Китай.

Причина проста: из-за санкций российским компаниям ограничен доступ к передовому западному AI-железу, а крупные языковые модели требуют всё больше вычислительных мощностей. Поэтому развитие ИИ всё сильнее упирается не только в качество моделей и данных, но и в наличие ускорителей, на которых эти модели можно обучать и запускать.

Сберу придётся конкурировать за китайские AI-чипы с крупнейшими интернет-компаниями самого Китая. ByteDance, Tencent и Alibaba тоже активно заказывают ускорители Huawei Ascend 950. Это один из самых продвинутых китайских AI-чипов, но он всё ещё уступает Nvidia H200. Какие именно чипы Сбербанк пытается получить для GigaChat, Греф не уточнил.

GigaChat остаётся одним из главных российских проектов в области генеративного ИИ. Но для таких систем вопрос инфраструктуры становится критическим. У крупнейших мировых игроков есть доступ к большим кластерам Nvidia, TPU или собственным вычислительным платформам. Российским разработчикам приходится искать альтернативные маршруты поставок и сильнее опираться на китайскую электронику.

На данный момент Россия в целом отстаёт от США и Китая в области ИИ и сильно зависит от импортных компонентов, в том числе в чувствительных секторах. Китай при этом остаётся главным поставщиком электроники. Сбер пытается частично изменить эту зависимость: банк стал заметным игроком на рынке электроники после покупки доли в производителе «Элемент».

На фоне переговоров России и Китая стороны также заявили о развитии сотрудничества в сфере ИИ, open-source software и технологических решений. В совместной декларации отдельно отмечается, что искусственный интеллект становится важным фактором экономических преобразований.

История с GigaChat хорошо показывает, куда смещается конкуренция в ИИ. Речь уже не только о том, у кого лучше чат-бот или больше данных. Всё чаще решающими становятся доступ к чипам, поставки, энергомощности и возможность масштабировать вычислительную инфраструктуру. Без этого даже сильная модель быстро упирается в потолок.


Источник

ссылка на оригинал статьи https://habr.com/ru/articles/1037308/