Разработчики больше не нужны? Новое исследование Anthropic на 400 000 сессий — и мой спор с ним

от автора

  • Anthropic выложила исследование на ~400 000 сессий Claude Code: успех с AI-агентами определяет не умение писать код, а понимание своего дела. Профессия почти не важна — у не-программистов 26% подтверждённого успеха против 30% у разработчиков.

  • Эксперт в предметной области запускает в 2.4× больше действий агента на одну команду (12 против 5) и вчетверо чаще вытаскивает зашедшую в тупик сессию (15% против 4% у новичка).

  • Половину этого я писал раньше: планируй, говори агенту «что», а не «как», и разбирайся в том, что делаешь. Приятно, когда данные сходятся с интуицией.

  • Где я не согласен: Anthropic меряет краткосрочный результат. Эксперт-одиночка соберёт работающий прототип быстрее инженера — но не покроет тестами, не заложит масштабирование и безопасность. Продукт развалится при первой нагрузке.

  • Рабочая связка одна: эксперт предметной области + инженер, который знает harness вокруг агентов. Не «или-или», а «и-и». Обратная крайность — «вы программисты, вам виднее» + комплекс Бога — ломает не меньше.

  • Практика, которую заберите с собой: делегируйте агенту «что» и оставляйте ему свободу в «как». Особенно в дизайне. Зажмёте в жёсткие рамки — получите галлюцинации.


Anthropic выложила исследование, которое мне очень хочется похвалить. Они прогнали около 400 000 реальных сессий Claude Code за полгода — октябрь 2025-го по апрель 2026-го, ~235 000 человек — и сделали вывод: с AI-агентами выигрывает не тот, кто умеет кодить, а тот, кто разбирается в своём деле. Понимаешь предметную область — точно ставишь задачу — получаешь результат. Код вторичен.

И вот с этим выводом я не согласен. Не с цифрами — цифры в порядке. А с тем, что из них вытащили. Собственно, ради этого и сел писать.

Сразу оговорюсь про источник. Anthropic — производитель Claude, интерес у них понятный: «покупайте, у вас всё получится, даже если вы не разработчик». Так что выводы я читал с прищуром. Но методология у них приличная и проверяемая, цифры говорящие, а в одном месте они, по-моему, недоговаривают — об этом ниже.

Что показали 400 000 сессий

Первое, что цепляет, — разделение труда. Человек принимает примерно 70% решений «что делать», агент — около 80% решений «как делать». То есть Claude Code не превратился в автопилот: стратегию задаёт человек, реализацию отдаёт модели. Это ровно та картина, к которой я сам пришёл на практике, только теперь под ней есть статистика.

Дальше — про экспертизу. Anthropic разложила пользователей по шкале от новичка до эксперта (не по должности, а по тому, как человек ведёт диалог: насколько точно ставит задачу, что просит проверить, как исправляет агента). И разница оказалась резкой:

Уровень

Подтверждённый успех

Вытащил зависшую сессию

Новичок

15%

4%

Эксперт

~30%

15%

Эксперт не просто чаще доводит дело до конца. Он ещё и запускает в 2.4 раза больше действий агента на одну инструкцию — 12 против 5 — и получает в ответ ~3200 слов против ~600 у новичка. Проще говоря, один и тот же Claude в руках эксперта делает в разы больше за тот же промпт. А когда агент заходит в тупик, новичок бросает сессию в 19% случаев, эксперт — в 5–7%. Эксперт чинит, новичок сдаётся.

И вишенка, ради которой статью, кажется, и писали: профессия значит меньше, чем все думали. У software-специалистов — 30% подтверждённого успеха на задачах с кодом, у не-разработчиков — 26%. Разница в 4 процентных пункта. Все десять крупнейших профессиональных групп уложились в коридор 7 пунктов от инженеров, а менеджмент инженеров даже слегка обогнал.

Отсюда вывод Anthropic: важно не уметь кодить, важно понимать свою задачу. Бухгалтер, который знает правила сверки, объяснит агенту, что нужно, не хуже программиста. А то и лучше.

Половину этого я уже писал — и рад, что данные сошлись

Про «что, а не как» я писал в разборе свежих гайдов по промптингу — там и Anthropic, и OpenAI прямым текстом советуют не расписывать модели пошаговый план, а давать цель и свободу в исполнении. Цитата, которую я тогда вынес: модель спланирует решение лучше, чем ваш рукописный пошаговый план. Исследование на 400 000 сессий это, по сути, подтвердило цифрами: 80% решений «как» уходят агенту, и чем меньше его в этом зажимают, тем лучше итог.

Про «разбирайся в том, что делаешь» — это вообще была главная мысль статьи «Не учись на программиста» — что бы я сказал своему ребёнку в 2026-м]. Я там доказывал, что AI заменяет набивание символов, а не понимание задачи. И что профессионал своего дела — будь то юрист, маркетолог или руководитель отдела продаж — становится не слабее, а сильнее: его работа теперь в том, чтобы научить агента работать правильно. В свежем SalesTest я это уже мерил на живых диалогах: «Когда нейросети заменят живых продавцов?» — и вывод был тот же. Живой продавец, который помогает команде собрать и проверить бота, стал ценнее, а не наоборот.

Так что сами наблюдения Anthropic я подписываю без споров — что есть, то есть. Приятно, когда чужие данные сходятся с твоей интуицией. Спор начинается там, где из этих наблюдений делают вывод.

А вот где я не согласен: они померили эйфорию первой недели

Главная претензия простая. Anthropic меряет успех сессии — довёл человек задачу до конца или нет. Это краткосрочная метрика. И на этой дистанции эксперт-одиночка действительно обгоняет инженера, тут спорить не с чем: он понимает, что нужно конечному клиенту, и потому собирает работающую штуку быстрее.

Проблема в том, что «работающая штука сегодня» и «продукт, который живёт год и держит нагрузку» — это две очень разные вещи.

Суперэксперт без инженера соберёт вау-прототип и поверит, что у него получился классный продукт. А при масштабировании начнутся проблемы — сразу и больно. Он не покроет это тестами. Не заложит масштабирование. Не учтёт нагрузку и безопасность. Выберет не те библиотеки. Не выстроит процесс разработки так, чтобы продукт можно было дальше развивать и обновлять. Не потому что глупый — потому что это не его область. Он эксперт в продажах или в бухгалтерии, а не в построении систем.

И вот тут мне кажется, что Anthropic немного лукавит. Их аналитика построена на сессиях, где простой, немасштабируемый, небезопасный продукт работает первое время — и это засчитывается как успех. А что будет с ним через три месяца под реальной нагрузкой, метрика не видит. Они сами это, к чести, признают в ограничениях: «не можем измерить, развёрнут ли код в реальности и приносит ли пользу». Только вынесено это в примечания, а в выводы пошёл оптимистичный заголовок.

Почему связка, а не «или–или»

Мой опыт говорит: хорошо получается только в связке «эксперт предметной области + инженер». Не «или-или», а «и-и».

Без эксперта инженер сделает технически чистую вещь, которая не нужна клиенту в таком виде. Если делаешь бота для продаж — садись вплотную с руководителем отдела продаж. Для бухгалтерии — с бухгалтером. Не работаешь в тесной связке с экспертом — хорошо не выйдет, каким бы крутым ни был инженер.

Без инженера эксперт сделает то, что я описал выше: быстрый вау-эффект, короткая эйфория, потом разочарование. Маленький классный продукт для себя — пожалуйста. Большой полноценный продукт без понимания, как всё устроено внутри, — очень сомневаюсь.

Кстати, обратите внимание: в самих цифрах Anthropic зашита нужда в инженере. Агент силён именно в коде — поэтому в кодинге он редко уходит не туда. А вот в масштабировании, безопасности, выборе архитектуры он спокойно срежет угол, и эксперт это не поймает, потому что это не его язык. Это поймает инженер.

Обратная крайность: комплекс Бога

Только давайте не свалимся в противоположную яму. История «вы программисты, вам виднее, как сделать» — такая же вредная.

И самое забавное: программисты часто и правда думают, что им виднее. Комплекс Бога вместе с AI на борту появляется очень быстро — я это видел не раз. Инженер с Claude Code за спиной за неделю начинает верить, что разбирается в чужой предметке лучше человека, который в ней двадцать лет. Не разбирается. Он быстро пишет код, это не то же самое.

Поэтому связка работает только когда обе стороны признают: эксперт не лезет в архитектуру, инженер не решает за эксперта, как устроены продажи или сверка. Каждый отвечает за своё.

Что Anthropic поняли точно: не указывайте агенту, как думать

Тут мы снова сходимся, и это важная практическая вещь.

Современным агентам нельзя диктовать, как думать. Да, формально это «просто предсказание следующего токена», не мышление — неважно. Важно, что если зажать модель в очень жёсткие рамки и расписать каждый шаг, получаешь больше галлюцинаций и результат хуже. Делегируй «что», оставляй свободу в «как».

Нагляднее всего это видно в дизайне. Дашь дизайн строго, загонишь в правила и пиксели — выйдет хуже, чем если скажешь, чего ты хочешь по сути, а как — пусть решает сам.

Плохо (зажали в рамки):

Сделай лендинг. Шапка 80px, логотип слева 160×40, кнопка #1A73E8,радиус 8px, отступ 24px, шрифт Inter 16px, герой по центру,три карточки в ряд по 320px, иконки сверху...

Хорошо (сказали «что», отдали «как»):

Сделай премиальный лендинг для B2B-сервиса с гарантией ответаза 24 часа. Тёмная тема, ощущение надёжности и скорости.Структуру выбери сам — но клиенту должно быть сразу понятно,что мы быстрые и серьёзные.

Второй промпт почти всегда даёт результат живее и аккуратнее. Первый — это попытка быть дизайнером через модель, и модель честно отрабатывает ровно то, что ей продиктовали, со всеми вашими случайными ошибками в пикселях.

Нет, точнее так: дело не в том, что детали запрещены. Детали-ограничения нужны там, где это бизнес-правило (гарантия 24 часа, требование безопасности, формат данных). А вот эстетику и реализацию лучше отдать. Anthropic, к их чести, в выводах именно к этому и подводит — 80% решений «как» не зря уходят агенту.

Личная боль: эксперт — это вы, а не мы

И раз уж зашла речь про связку, поделюсь тем, что реально болит.

Когда к нам приходит бизнес за продуктом, начинается странное. Заказчик говорит: «вы эксперты, вы всё сами сделаете». Но эксперты в их бизнесе — это они, а не мы. Мы инженеры. Мы знаем, как строить продукт. А как именно у них устроены продажи, какие у клиентов реальные возражения, где в их сверке подводные камни — это знают только они.

И вот этого многие не понимают. Чтобы у заказчика же получился классный продукт, приходится из заказчика же вытаскивать ответы. Самые тяжёлые проекты — не те, где сложная техника, а те, где эксперт самоустранился: «ну вы там сами разберётесь».

Не разберёмся. Точнее, разберёмся в инженерной части, а в вашей предметке — нет, и не должны. Связка «эксперт + инженер» работает, только когда эксперт в ней участвует, а не делегирует целиком.

Если читаете это и заказываете разработку — самое полезное, что вы можете сделать для своего же продукта, это давать обратную связь.

Где мы сейчас

Если коротко: Anthropic правы наполовину, и это хорошая половина. Понимание своего дела действительно стало важнее умения кодить — на коротком плече. Профессия действительно значит меньше, чем казалось. И делегировать агенту «что» вместо «как» действительно работает.

Но «эксперт вместо инженера» — это про прототип. «Эксперт вместе с инженером» — это про продукт, который живёт. Anthropic померила первое и почти выдала за второе.

Хорошая новость для всех: ни одна из ролей никуда не делась. Эксперт не заменяется агентом — у него меняется суть работы, он теперь учит агента работать правильно. Инженер не заменяется агентом — он теперь строит harness вокруг агента и отвечает за то, чтобы вау-прототип дорос до системы. Обоим стало интереснее. Просто теперь надо уметь работать в паре — и с человеком, и с моделью.


Пишу про AI-агентов, инженерные процессы вокруг них и про то, как это всё выглядит изнутри команды, которая делает на этом продукты. Канал — @maslennikovigor, написать лично — @maslennikovig. Про сам harness, которым мы оркеструем агентов, расскажу отдельно — сейчас обкатываем новую версию.

ссылка на оригинал статьи https://habr.com/ru/articles/1052348/