
Гендиректор криптобиржи Coinbase Брайан Армстронг поделился стратегией, которая позволяет компании наращивать использование нейросетей без пропорционального роста затрат на токены.
По словам Армстронга, ключевой инструмент — умная маршрутизация запросов: промпты перенаправляются на более дешёвые модели там, где это уместно. По его словам, в ряде случаев криптобирже удаётся удерживать расходы примерно на одном уровне, несмотря на то что потребление токенов продолжает расти в геометрической прогрессии.
Топ‑менеджер прогнозирует, что в ближайшие 12–18 месяцев индустрию ждёт жёсткое разделение труда: 80% рабочих нагрузок будут выполняться на моделях, которые на 99% дешевле флагманских. Самые дорогие и мощные модели останутся востребованными только в случаях, когда требуется экстремальная вычислительная сложность — научные прорывы или оркестровка сложных автономных ИИ‑агентов. По мнению Армстронга, ограничивающим фактором станут энергия и вычислительные мощности, а не создание более совершенных моделей.
Мнения коллег Армстронга разделились. Венчурный капиталист Марк Андриссен назвал идею интересной, сооснователь Hugging Face Жюльен Шомон подтвердил, что маршрутизация моделей «стремительно набирает обороты», а гендиректор Box Аарон Леви назвал прогноз «несколько экстремальным», хотя согласился с тем, что ИИ‑нагрузки в целом распределятся по ценовым уровням.
Проблема неконтролируемого роста расходов на токены уже ударила по ряду компаний: Uber израсходовал годовой ИИ‑бюджет за четыре месяца после того, как доля инженеров, активно использующих Claude Code, выросла с 32% до 84%. Ещё одна неназванная американская компания потратила $500 млн на токены за один месяц, поскольку руководство не установило лимиты для сотрудников.
ссылка на оригинал статьи https://habr.com/ru/articles/1045971/