Конец эпохи халявного ИИ или когда подписки станут стоить как аренда квартиры

от автора

Пользователям пора осознать, что ИИ требует ресурсов, а ресурсы — денег.

Вы просыпаетесь, листаете ленту новостей и вдруг — Anthropic убирает Claude Code из стандартного Pro-плана. То есть, чтобы пользоваться их агентом для программирования, нужно покупать более дорогую подписку.

Не спешите рвать на себе волосы, ведь Anthropic тут же реагируют на гнев коммьюнити пользователей: «Это всего лишь АБ-тест на 2% новеньких».


Нас разводят или деньги кончились?

Давайте по фактам:

  • Anthropic ужесточили использование API через сторонние обёртки (вроде OpenClaude).

  • GitHub Copilot новым пользователям Pro, Pro+ и Student явно указал, что лимиты будут жестче, а модели Opus отныне не для вас.

  • Вы тоже чувствуете, что модели тупеют? Возможно, это не иллюзия, а следствие экономии ресурсов на инференсе (вычислении ответов).

Все эти точки складываются в одну тревожную картину. Дни, когда вы могли купить подписку за $20 и бездумно сжигать миллионы токенов в Claude Code, подходят к концу.


Сколько на самом деле стоит ваш запрос

$20 в месяц — это промо цена. Более-менее реальную цену подсказывают API-тарифы:

  • Claude Opus 4.7: $5 за миллион входных токенов, $25 за миллион выходных.

  • GPT-4: $2,5 за вход, $22,5 за выход.

Предположим, что API-цены — это точка безубыточности. То есть именно столько компания тратит на генерацию ответов.

Теперь посчитаем на примере $200 (Max-план Anthropic).

По API-цене $25 за миллион выходных токенов вы за эти деньги получили бы 8 миллионов токенов. Но это в идеале — без учёта входных токенов, системных инструкций и внутренних размышлений модели. В реальности с учётом всего этого — 6-7 миллионов.

А сколько вы сжигаете на практике?

Любой, кто неделю поработал с Claude Code, понимает, что вы проглатываете десятки миллионов токенов в месяц. Одна сложная сессия рефакторинга это 2-3 миллиона за пару часов. За месяц активный пользователь легко использует 30-50+ миллионов.

Ваши 30-50 миллионов токенов по API-ценам стоили бы $500-1000+, а вы платите $200 (или даже $20 в Pro-плане). Разницу доплачивает Anthropic. Это и есть субсидирование, и как любой стартап, они не смогут вечно тратить деньги инвесторов.


Что изменилось

Раньше люди задавали пару вопросов в чате и тратили мало токенов. Теперь агенты вроде Claude Code работают часами и сжигают миллионы за один день. Подписки остались старыми, а расходы выросли в десятки раз.

  1. Агентные рабочие процессы (Agentic workflows). Вы больше не задаете один вопрос в чате. Ваш Claude Code сам гоняет циклы «подумал -> написал ->проверил -> исправил». Одна такая сессия жрёт как сотня обычных диалогов.

  2. Думающие модели (Reasoning models). Они генерируют внутренний chain-of-thought. Вы его не видите, но токены сгорают. Ответ теперь требует в разы больше вычислений.

  3. Физический кризис вычислений. Все упирается в реальное железо и оперативная память (нужна для инференса) подорожала. Сетевое оборудование для соединения тысяч GPU в кластеры в дефиците. Энергии для дата-центров не хватает, их строят прямо с газовыми турбинами. Компании вынуждены делить дефицитные вычислительные мощности между тренировкой новых моделей (хочется же обогнать конкурентов) и инференсом (чтобы текущие клиенты не ушли).

GitHub сам открыто признал в своем анонсе, что агентные рабочие процессы фундаментально изменили потребности Copilot в вычислениях. Раньше у вас была структура тарифа под случайные чаты, а теперь под бесконечные сессии, которые кушают все ресурсы.

Почему Anthropic больнее, чем OpenAI?

Гипотеза автора видео состоит в том, что у OpenAI исторически больше обычных людей среди пользователей, которые задают 5 вопросов в день про рецепт пиццы. Их токен-потребление минимально. А у Anthropic больше корпоративных клиентов и разработчиков, тех самых, кто запускает тяжелые агентные сессии. Следовательно, средний расход токенов на одного платного пользователя у Anthropic может быть радикально выше, а значит, и убытки от субсидирования больше.


Что будет с ценами на токены

  1. Лимиты станут жестче. Ваш Claude Code будет чаще просить пополнить баланс или уходить в режим ожидания. Вы достигнете точки, когда подписка за $20 станет бесить.

  2. Подписки подорожают — сильно. Не на 20%, а в разы. Компании начнут сравнивать стоимость ИИ-агента со стоимостью джуна. Если подписка за $1000 в месяц заменяет часть работы младшего разработчика (который получает $3000+), это выгодно. Через год-полтора цены вырастут до этих уровней.

  3. Расслоение тарифов. Будут дешевые планы для болтовни с ChatGPT с жесткими лимитами на длину контекста и количество запросов. И будут отдельные, очень дорогие планы для агентной разработки.

OpenAI недавно привлекли $122 млрд оценки. По слухам, этих денег им хватит всего на 18 месяцев работы. Сжигать деньги на субсидиях еще пару лет они не смогут, поэтому нас ждет переход к стадии «ИИ как дорогой профессиональный инструмент». Готовимся оптимизировать токены вручную.

ссылка на оригинал статьи https://habr.com/ru/articles/1026816/