Покупатели процессоров Blackwell от Nvidia столкнулись с проблемой перегрева

от автора

Первые покупатели новых графических процессоров для нужд ИИ Blackwell B200 от Nvidia заявили, что они вызывают перегрев серверов. Теперь некоторые заказчики опасаются того, что не смогут вовремя запустить свои дата-центры.

Осведомлённые разработчики поделились, что проблема возникает при использовании серверных стоек на 72 чипа, когда системы охлаждения перестают справляться с перегревом.

По данным источников издания в Nvidia, а также среди поставщиков и клиентов, компания уже несколько раз просила партнёров изменить конструкцию стоек. Эта работа может вызвать задержку поставок ускорителей. В Nvidia заявили, что «инженерные изменения являются нормальными и ожидаемыми».

Новые чипы представили в марте. Они обеспечивают в 30 раз более быстрое выполнение ИИ-задач. Blackwell B200 выполнен по 4-нанометровому техпроцессу компании TSMC и содержит в себе 208 млрд транзисторов. Пара из таких чипов станет ядром видеокарты GB200. Nvidia рассказала, что оценивает её производительность в 20 петафлопс. Вместе с базовой видеокартой компания выпустила серверную стойку GB200 NVL72, которая состоит из 72 новых графических ускорителей. Её производительность составляет уже 1,4 экзафлопса.

Сообщалось, что Blackwell B200 будет стоить $30-40 тысяч и будет в 25 раз дешевле, чем H100.


ссылка на оригинал статьи https://habr.com/ru/articles/859650/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *