Первые покупатели новых графических процессоров для нужд ИИ Blackwell B200 от Nvidia заявили, что они вызывают перегрев серверов. Теперь некоторые заказчики опасаются того, что не смогут вовремя запустить свои дата-центры.
Осведомлённые разработчики поделились, что проблема возникает при использовании серверных стоек на 72 чипа, когда системы охлаждения перестают справляться с перегревом.
По данным источников издания в Nvidia, а также среди поставщиков и клиентов, компания уже несколько раз просила партнёров изменить конструкцию стоек. Эта работа может вызвать задержку поставок ускорителей. В Nvidia заявили, что «инженерные изменения являются нормальными и ожидаемыми».
Новые чипы представили в марте. Они обеспечивают в 30 раз более быстрое выполнение ИИ-задач. Blackwell B200 выполнен по 4-нанометровому техпроцессу компании TSMC и содержит в себе 208 млрд транзисторов. Пара из таких чипов станет ядром видеокарты GB200. Nvidia рассказала, что оценивает её производительность в 20 петафлопс. Вместе с базовой видеокартой компания выпустила серверную стойку GB200 NVL72, которая состоит из 72 новых графических ускорителей. Её производительность составляет уже 1,4 экзафлопса.
Сообщалось, что Blackwell B200 будет стоить $30-40 тысяч и будет в 25 раз дешевле, чем H100.
ссылка на оригинал статьи https://habr.com/ru/articles/859650/
Добавить комментарий