Гендиректор Coinbase рассказал, как наращивать использование нейросетей, не раздувая бюджеты на токены

от автора

Гендиректор криптобиржи Coinbase Брайан Армстронг поделился стратегией, которая позволяет компании наращивать использование нейросетей без пропорционального роста затрат на токены.

По словам Армстронга, ключевой инструмент — умная маршрутизация запросов: промпты перенаправляются на более дешёвые модели там, где это уместно. По его словам, в ряде случаев криптобирже удаётся удерживать расходы примерно на одном уровне, несмотря на то что потребление токенов продолжает расти в геометрической прогрессии.

Топ‑менеджер прогнозирует, что в ближайшие 12–18 месяцев индустрию ждёт жёсткое разделение труда: 80% рабочих нагрузок будут выполняться на моделях, которые на 99% дешевле флагманских. Самые дорогие и мощные модели останутся востребованными только в случаях, когда требуется экстремальная вычислительная сложность — научные прорывы или оркестровка сложных автономных ИИ‑агентов. По мнению Армстронга, ограничивающим фактором станут энергия и вычислительные мощности, а не создание более совершенных моделей.

Мнения коллег Армстронга разделились. Венчурный капиталист Марк Андриссен назвал идею интересной, сооснователь Hugging Face Жюльен Шомон подтвердил, что маршрутизация моделей «стремительно набирает обороты», а гендиректор Box Аарон Леви назвал прогноз «несколько экстремальным», хотя согласился с тем, что ИИ‑нагрузки в целом распределятся по ценовым уровням.

Проблема неконтролируемого роста расходов на токены уже ударила по ряду компаний: Uber израсходовал годовой ИИ‑бюджет за четыре месяца после того, как доля инженеров, активно использующих Claude Code, выросла с 32% до 84%. Ещё одна неназванная американская компания потратила $500 млн на токены за один месяц, поскольку руководство не установило лимиты для сотрудников.

ссылка на оригинал статьи https://habr.com/ru/articles/1045971/