Google анонсировала TPU 8: два ускорителя вместо одного — для обучения и ИИ-агентов

от автора

На конференции Cloud Next ’26 Google представила восьмое поколение своих тензорных процессоров — впервые в истории линейки компания разделила поколение на два специализированных ускорителя: TPU 8t для обучения моделей и TPU 8i для инференса и работы ИИ-агентов. До этого каждое поколение было единым чипом, включая прошлогодний Ironwood. Логика разделения — ставка на агентную эру: обучение frontier-модели и обслуживание потока запросов от агентов требуют принципиально разного железа, и универсальный чип на обе задачи становится компромиссом.

TPU 8t — тренировочный чип — в одном суперподе (так Google называет связку ускорителей, которая работает как единый суперкомпьютер) объединяет 9 600 штук с 2 петабайтами общей памяти и выдаёт 121 экзафлопс вычислений. Это втрое больше производительности на суперпод, чем у Ironwood. Через новую сетевую фабрику Virgo и стек JAX + Pathways один логический кластер масштабируется до миллиона чипов с почти линейным приростом производительности. Цель — сократить цикл тренировки новой флагманской модели с месяцев до недель.

TPU 8i — чип для инференса и агентов — получил 288 ГБ высокоскоростной памяти и 384 МБ on-chip SRAM, втрое больше предшественника: активные веса модели теперь полностью помещаются на самом чипе и не требуют лишних обращений к медленной памяти. Interchip-пропускная способность удвоена до 19,2 Тб/с. По заявлению Google, TPU 8i на 80% выгоднее по соотношению производительности и цены, чем Ironwood — на том же бюджете можно обслужить почти вдвое больше пользователей. Оба чипа впервые работают на собственных ARM-процессорах Axion в качестве хост-CPU.

Анонс ложится на конкретный коммерческий контекст. В октябре 2025-го Anthropic подписал с Google контракт на до миллиона TPU v7 через Google Cloud, Meta* (признана экстремистской и запрещена в РФ) этой весной получила первую партию тестовых чипов, а в ноябре 2025-го котировки Nvidia просели почти на 5% — около 150 миллиардов долларов капитализации — на одних слухах о переходе Meta* на TPU. Восьмое поколение усиливает сдвиг: теперь Google предлагает не просто альтернативу GPU, а отдельный ускоритель под каждую половину AI-рабочих нагрузок.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть«, где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1026734/