ИИ-агенты уже торгуются за нас, а мы даже не замечаем разницы: исследование Anthropic

Компания Anthropic провела необычный эксперимент под названием Project Deal – в декабре 2025 года 69 сотрудников офиса в Сан-Франциско на неделю стали участниками закрытой онлайн-барахолки (аналог Craigslist), но торговаться за них должны были ИИ-агенты на базе Claude. Каждый участник предварительно прошёл короткое интервью с нейросетью (меньше 10 минут), где рассказал, что хочет продать и купить, и указал свои условия. На основе этих ответов для каждого сгенерировали индивидуальный системный промпт, выдали агентам виртуальный бюджет по 100 $ и запустили их в корпоративном Slack – без права вмешательства живых людей.

Результат превзошёл ожидания: агенты самостоятельно размещали объявления, вели переговоры на естественном языке и заключили 186 сделок на общую сумму чуть более 4000 $. В ассортименте фигурировало больше 500 товаров: от сноуборда до пакета с шариками для пинг-понга. После завершения эксперимента сотрудники собрались в офисе и обменялись реальными физическими вещами – теми самыми, которые выторговали их цифровые двойники.

Но самое интересное скрывалось в параллельном, не афишируемом сценарии. Anthropic запустила четыре независимые версии рынка: одну “реальную” (по ней потом и состоялся обмен) и три дополнительные – для чистоты данных. В двух версиях все агенты работали на флагманской модели Claude Opus 4.5, а в двух других участники случайным образом получали либо Opus, либо менее мощную Claude Haiku 4.5. Исследователи хотели выяснить: даёт ли более сильная модель преимущество в торгах, и заметят ли это люди?

Экономисты уже выдвигают теории о мире, где большинство сделок от лица людей будут совершать ИИ-агенты. Project Deal показал: такой мир может наступить очень скоро. По большинству объективных показателей Opus превосходил Haiku. Например, если один и тот же товар (скажем, лабораторный рубин) продавал Opus, он уходил в среднем на 3,64 $ дороже. Сломанный складной велосипед Opus толкнул за 65 $, а Haiku – всего за 38 $. Анализ 161 товара, проданного хотя бы в двух забегах, показал: Opus-продавец выручает в среднем на 2,68 $ больше, а Opus-покупатель платит на 2,45 $ меньше.

Тем не менее в финальном опросе участники не заметили разницы. Справедливость сделок они оценили в среднем на 4 балла по шкале от 1 (перекос в пользу одной стороны) до 7 (перекос в другую) – причём для сделок, проведённых Opus, средний балл составил 4,05, а для Haiku – 4,06. Даже когда участникам показали результаты всех четырёх забегов и попросили ранжировать свои “луты” от лучшего к худшему, 17 из 28 человек, которых в одном забеге представлял Opus, а в другом Haiku, поставили Opus выше – но 11 человек поставили выше Haiku. Статистически значимого различия в восприятии нет.

Ещё один сюрприз: инструкции, которые участники дали своим агентам (“Торгуйся агрессивно”, “Ни в коем случае не оскорбляй коллег”), почти не повлияли на результат. Агрессивные продавцы устанавливали в интервью более высокие стартовые цены (в среднем на 26 $ выше), и если товар продавался, то дороже – но сама “агрессивность” как стратегия не давала статистически значимого преимущества. Зато модель оказалась критичной.

“Мы были поражены тем, насколько хорошо сработал Project Deal, – пишут авторы. – Но было и тревожное открытие: люди, которых представляла более слабая модель, просто не замечали своего проигрыша”.

После эксперимента Anthropic опросила участников, и 46% заявили, что готовы платить за подобного ИИ-посредника. Текст исследования доступен по ссылке.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

ссылка на оригинал статьи https://habr.com/ru/articles/1027798/