️ Anthropic уже пишет о рекурсивном самоулучшении, как о процессе, который постепенно становится реальностью

В свежем материале речь идёт об ИИ, который помогает проектировать и собирать следующую версию себя.

Длина задач, которые модель способна стабильно доводить до конца, удваивается примерно каждые четыре месяца. В марте 2024 года Opus 3 справлялся с задачами примерно на 5 минут. Через год Sonnet 3.7 уже держал около полутора часов. Ещё через год Opus 4.6 дошёл примерно до 12 часов. Внутренний препрев Anthropic показал минимум 16 часов, причём ограничением могла быть сама методика оценки.

К маю 2026 года Claude пишет больше 80% кода, который попадает в кодовую базу Anthropic. В одном кейсе модель выдала больше 800 фиксов и снизила целый класс API-ошибок в тысячу раз. По оценке инженера, человеку на такой объём работы понадобилось бы около четырёх лет.

В проекте по безопасности агенты закрыли 97% разрыва в производительности, тогда как два разраба за неделю закрыли 23%. В выборе следующего исследовательского шага модель уже показывает 64% попаданий против человеческого решения.

Решения людей пока держатся на: какие задачи выбирать, когда менять направление, когда признать тупик и не продолжать копать.

Авторы рассматривают три развилки. В первой рост упирается в плато, и этому варианту они дают меньше всего веса. Во второй эффективность продолжает накапливаться, люди задают направление, а небольшая команда делает объём работы, который раньше требовал тысяч специалистов. Этот сценарий выглядит для них наиболее вероятным. В третьей начинается полноценное рекурсивное самоулучшение, где темп всё сильнее определяется доступным компьютом. Именно по этому сценарию у Anthropic меньше всего уверенности в безопасности.

Люди пока сильнее в том, что не сводится к простому выполнению задачи: выбрать правильное направление, вовремя сменить подход, понять, что задача плохо поставлена, и остановиться, когда решение больше не окупает усилия.

Anthropic описывает три возможных сценария.

Первый — прогресс упирается в плато. Модели становятся лучше, но рост быстро замедляется. Авторы считают этот вариант наименее вероятным.

Второй — модели продолжают усиливать команды, но направление всё ещё задают люди. Небольшая группа специалистов с ИИ делает объём работы, который раньше требовал тысяч человек. Этот сценарий выглядит для Anthropic самым вероятным.

Третий — полноценное рекурсивное самоулучшение. ИИ всё активнее участвует в создании следующих поколений ИИ, а скорость прогресса начинает зависеть в первую очередь от доступных вычислений. По этому сценарию у Anthropic больше всего вопросов к безопасности.

https://www.anthropic.com/institute/recursive-self-improvement Пишу про ИИ и вайбкодинг, показываю примеры проектов, разбираю новости: https://t.me/machinelearning_interview/2789

ссылка на оригинал статьи https://habr.com/ru/articles/1043776/