AI-бум вытесняет научные суперкомпьютеры: лаборатории США тестируют альтернативу Nvidia и AMD

от автора

Американская Sandia National Laboratories тестирует чипы израильского стартапа NextSilicon для будущих суперкомпьютеров. Причина — крупные производители вроде Nvidia и AMD все сильнее смещают фокус в сторону AI-нагрузок, а научным и государственным HPC-системам по-прежнему нужны другие типы вычислений.

Sandia — одна из трех лабораторий США, которые занимаются разработкой и поддержкой ядерного арсенала страны. Ее суперкомпьютеры используются для сложного физического моделирования: например, симуляций поведения гиперзвукового ядерного оружия в атмосфере или сценариев взаимодействия боеголовок.

Для таких задач важна не только высокая производительность, но и точность вычислений. Один из ключевых параметров — double-precision floating point computation, то есть вычисления с двойной точностью. Они нужны, когда система должна работать с очень большими и очень малыми числами без критичных ошибок округления.

Проблема в том, что AI-нагрузки не всегда требуют такой же точности. Поэтому рынок ускорителей постепенно перестраивается под обучение и инференс моделей, а не под классическое научное моделирование. В Sandia говорят, что давление ощущается сразу с двух сторон: по доступности вычислительных ресурсов и по цепочкам поставок.

На этом фоне лаборатория начала тестировать альтернативные архитектуры. Чипы NextSilicon отличаются от привычных GPU и CPU: они используют data flow architecture. Такой подход должен тратить меньше энергии на постоянное перемещение данных между вычислительными блоками и памятью.

NextSilicon, Sandia и Penguin Solutions сообщили, что система с этими чипами прошла важный технический этап на наборе общих суперкомпьютерных тестов. Осенью должно решиться, начнут ли их проверять на более тяжелых задачах, близких к реальным сценариям ядерной безопасности.

Интересно, что Sandia уже раньше влияла на развитие HPC-инфраструктуры. Например, жидкостное охлаждение больше десяти лет назад считалось нишевой технологией, но лаборатория продвигала его вместе с Intel, AMD и Nvidia. Сейчас оно стало обычной частью современных высокопроизводительных систем.


Источник

ссылка на оригинал статьи https://habr.com/ru/articles/1036366/