По мнению аналитиков Gartner, растущее использование программных агентов и моделей ценообразования на основе потребления может привести к беспрецедентному росту расходов разработчиков на ИИ в течение следующих двух лет. Вскоре предприятия будут платить за использование токенов для разработчиков столько же, сколько выделяют на зарплаты.
По данным Gartner, в течение следующих двух лет эти затраты сравняются или даже превысят среднюю месячную зарплату инженера-программиста.
Это связано не только с тем, что разработчики всё чаще внедряют генеративный ИИ и агентные инструменты, но и с тенденцией к моделям лицензирования на основе потребления, поскольку поставщики стремятся сбалансировать инвестиции в инфраструктуру с прибыльностью. Вместо прежней модели SaaS с фиксированной оплатой за рабочее место предприятия теперь платят и за использование токенов разработчиков.
Старший главный аналитик Gartner Нитиш Тьяги пояснил, что прогноз Gartner основан на среднем глобальном уровне заработной платы в $2000 в месяц. При этом в США годовая заработная плата может достигать шестизначных сумм и более. Однако, как подчеркнул Тьяги, и более крупные расходы не исключены: «Я слышал пугающие цифры, например: “Мой разработчик потратил $20 000 в прошлом месяце“ или “Бизнес-пользователь потратил $32 000“».
«Цель состоит в том, чтобы предупредить отрасль о влиянии стоимости токенов, если она не регулируется и не контролируется», — сказал он.
Предприятия быстро переходят от экспериментов к масштабируемому развёртыванию агентов ИИ-кодирования, но многие по-прежнему недооценивают стоимость токенов, отметил Тьяги. Это связано с тем, что структура затрат на разработку программного обеспечения «очень изменчива», указал он, и отсутствует достаточная прозрачность в том, как рассчитывается и выставляется счёт за потребление токенов.
По словам Тьяги, поставщики программного обеспечения для ИИ пока не предлагают «зрелых, встроенных возможностей оптимизации затрат», и цены, вероятно, будут только расти по мере того, как поставщики будут совершенствовать свои модели, одновременно стремясь оставаться прибыльными.
Таким образом, предприятиям сложно прогнозировать и контролировать затраты, и, поскольку ИИ развивается так быстро, многим организациям не хватает «зрелости и фреймворков» для определения рентабельности инвестиций, отметил он. Рабочие процессы, управляемые агентами, сложно контролировать, контекстные окна раздуваются, бюджеты исчерпываются раньше, чем ожидалось, а расходование токенов становится трудно обосновать.
Кроме того, пользователи с низкой активностью будут увеличивать использование токенов по мере того, как они будут лучше знакомиться с инструментами ИИ.
Тьяги сказал, что, хотя ИИ невероятно ценен, он не видит «прямой связи» между количеством токенов, потребляемых разработчиками, и повышением их производительности. Скорее, применение принципов контекстной инженерии для оптимизации или сокращения потребления токенов повышает качество.
Тем не менее, это никоим образом не означает, что организациям следует отказываться от вайб-кодинга, подчеркнул он. Оптимизация потребления токенов просто означает тратить только столько, сколько необходимо, не жертвуя качеством и ценностью, которые обеспечивает ИИ.
«Без управляемой модели работы инженерного отдела затраты могут расти быстрее, чем повышение производительности, которое должны обеспечивать эти инструменты», — сказал Тьяги.
Традиционный показатель производительности «количество написанных строк кода» больше не применим, когда ИИ может практически мгновенно создавать целые библиотеки Python. Вместо этого ценность следует измерять показателями качества, скорости и удовлетворенности клиентов, сказал Тьяги. Он предложил следующие метрики: насколько быстро разработчики могут выпускать важные функции? Насколько сокращается время между разработкой приложения и получением обратной связи от бизнес-подразделений, продуктовых команд и команд разработчиков?
Gartner также рекомендует внедрить строгие механизмы управления и контроля затрат. Например, ввести пороговые значения для токенов, автоматизировать мониторинг использования и разработать чёткие политики эскалации.
«Внедрение этих механизмов контроля в рабочие процессы инженеров обеспечивает согласованность и предотвращает неконтролируемый рост затрат», — отмечает компания.
Кроме того, предприятиям следует создать систему принятия решений, основанную на сценариях использования. Это означает чёткое определение того, когда следует использовать агентов ИИ для кодирования, и их соответствующих уровней автономности для определённых задач. Далее, следует классифицировать эти задачи на три модели выполнения: «под руководством разработчика», «разработчик с агентом» и «полностью под руководством агента».
Предприятиям также следует выбирать модели на основе сложности задачи и разбивать работу на более мелкие задачи, которые могут быть выполнены более мелкими моделями. Инженерные команды должны целенаправленно направлять рабочие процессы, передавая более простые, часто выполняемые задачи более мелким моделям и используя перспективный ИИ только для сложных и высокоценных задач.
Gartner утверждает, что разработчиков следует обучить оптимизации контекста, который они вводят в ИИ, включая только релевантную информацию, максимально её обобщая и исключая ненужные данные.
Кроме того, командам следует включить анализ использования токенов в циклы разработки. Регулярный анализ рабочих процессов с высоким потреблением токенов может помочь выявить неэффективность, усовершенствовать методы и поддержать сотрудничество, отмечают аналитики.
Тьяги говорит, что разработчики, как правило, оптимизируют скорость и удобство, а не экономическую эффективность, поэтому дисциплина в использовании токенов не может быть достигнута только за счёт их собственного выбора.
Его совет руководителям: не следует рассматривать растущие затраты на кодирование ИИ как причину для отказа от ИИ или перехода к открытым генеративным моделям для всего.
Эксперт даёт совет: начните с малого и сначала сосредоточьтесь на проектировании контекста, затем оцените текущий уровень зрелости разработки программного обеспечения и выберите соответствующую автономность агента. Разработка вспомогательных приложений на основе ИИ может обеспечить повышение производительности до 20%, «что является неплохим показателем».
Разработчикам он советует: «Ставьте контекстную инженерию одним из важнейших навыков. Это поможет не только работодателю, но и вашей карьере».
Ранее сообщалось, что внедряющие ИИ компании стали вводить новую метрику в виде токенов, которая отражает их расход при работе сотрудников. Некоторые из них уже отслеживают, сколько токенов тратит каждый сотрудник, чтобы ограничить неэффективное или нецелевое использование.
Между тем компании Кремниевой долины начали предлагать бонусы в виде компенсаций за доступ к ИИ-моделям своим инженерам. Некоторые кандидаты на вакансии уже начали спрашивать о том, какой бюджет на вычисления в ИИ им будет доступен, если они решат присоединиться к компании.
ссылка на оригинал статьи https://habr.com/ru/articles/1053114/