
Google примерно в марте сообщила Meta* (компания признана экстремистской и запрещена в России), что не сможет выделить весь объем вычислительных мощностей, который компания хотела закупить для работы с Gemini. Об этом со ссылкой на собственные источники пишет Financial Times. Отказ нарушил планы Meta* и задержал часть ее внутренних ИИ-проектов.
Под ограничения попали и другие клиенты Google Cloud, но именно Meta* пострадала сильнее всех — из-за необычно высокого спроса на Gemini. Модель понадобилась ей в том числе для модерации: удаления вредоносного контента и борьбы со скамом, где Gemini показал себя лучше собственных open-source-моделей Llama. На фоне ограничений сотрудникам велели экономнее расходовать токены.
Парадокс в том, что мощностей не хватает и самой Google. На апрельском отчете перед инвесторами гендиректор Сундар Пичаи признал, что облачное подразделение ограничено в вычислениях в ближайшей перспективе и выручка Google Cloud была бы выше, если бы компания могла удовлетворить спрос. А в начале июня Google законтрактовала у SpaceX около 110 000 GPU Nvidia за примерно $920 млн в месяц — почти $30 млрд за весь срок — назвав это временной мощностью под спрос на Gemini Enterprise.
Для Meta* зависимость от модели прямого конкурента всегда была некомфортной, и компания уже пытается обеспечить выход. В апреле она запустила Muse Spark — первую модель нового подразделения Meta Superintelligence Labs и заметный отход от прежней ставки на открытые Llama: Muse Spark проприетарна. Часть нагрузок, включая ту же модерацию, Meta* постепенно переводит на нее, чтобы меньше зависеть от внешних поставщиков. Но, видимо, пока модель не так хороша: на это указывает и постоянный перенос выпуска Muse Spark для широкой публики.
История показывает, во что превратилась гонка ИИ: главным дефицитом стали не модели, а железо под ними. Когда даже Google вынуждена нормировать доступ для клиента размером с Meta* и одновременно арендовать чипы у прямого конкурента — это, пожалуй, самый наглядный сигнал, что вычислительных мощностей в индустрии остро не хватает.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1053182/