Самообучающийся ИИ может появиться в конце 2028 года — сооснователь Anthropic

от автора

Джек Кларк, сооснователь Anthropic и автор рассылки Import AI, опубликовал эссе с прогнозом: вероятность того, что к концу 2028 года появится ИИ-система, способная автономно обучить своего преемника без участия человека, составляет 60%+. Для 2027 года Кларк оценивает ту же вероятность в 30%.

В эссе используется термин «no-human-involved AI R&D» — модель, достаточно мощная, чтобы самостоятельно создать следующую версию самой себя. Сам автор несколько нервничает по этому поводу: «Я не знаю, как уложить это в голове. Если это случится, мы пересечем Рубикон в почти невозможное для прогнозирования будущее». Кларк подчеркивает, что выводы основаны не на инсайдерской информации Anthropic, а на анализе публичных источников — arXiv, bioRxiv, NBER и продуктов фронтирных компаний.

Аргумент собран как мозаика из десятков бенчмарков — Кларк сознательно отказывается от ставки на одну метрику. SWE-Bench, популярный тест на решение реальных GitHub-задач, в 2023 году давал Claude 2 результат около 2%, а в 2026-м Claude Mythos Preview — 93,9%, фактически насыщая бенчмарк. Длительность задач, с которыми ИИ справляется автономно, по горизонту METR росла так: 30 секунд у GPT-3.5 в 2022, 4 минуты у GPT-4 в 2023, 40 минут у o1 в 2024, около 6 часов у GPT 5.2 (High) в 2025, около 12 часов у Opus 4.6 в 2026.

Главное в эссе — рост на бенчмарках, напрямую связанных с автоматизацией ИИ-исследований. CORE-Bench, тест на воспроизведение вычислительных результатов научных статей, прошел путь с 21,5% у GPT-4o с агентной обвязкой в сентябре 2024 до 95,5% у Opus 4.5 в декабре 2025 — один из авторов бенчмарка публично объявил его решенным. На MLE-Bench, где ИИ автономно участвует в 75 Kaggle-соревнованиях, результат вырос с 16,9% у o1 в октябре 2024 до 64,4% у Gemini 3 в феврале 2026. На PostTrainBench, проверяющем способность фронтирных моделей дообучать слабые модели с открытыми весами, топовые системы — Opus 4.6 и GPT 5.4 — выходят на 25–28% против эталонного результата людей в 51%. Особенно показателен внутренний бенчмарк Anthropic на оптимизацию обучения CPU-only LLM: Opus 4 в мае 2025 ускорял базовый код в 2,9 раза, через год Claude Mythos Preview — в 52 раза, тогда как человеку для ускорения в 4 раза, по оценке Anthropic, нужно 4–8 часов работы.

Главный логический ход эссе — Кларк оспаривает предположение, что для самообучения ИИ нужны творческие прорывы уровня изобретения трансформера. По его мнению, прогресс в области ИИ — это в основном неприглядная инженерная работа: методичное масштабирование, отладка, перебор параметров. И именно в этом ИИ уже силен. Кларк цитирует Эдисона: «Гений — это 1% вдохновения и 99% пота». Отдельно он отмечает редкие признаки творчества у моделей — задачи Эрдёша, решенные GPT-5.4 Pro и системой Aletheia на базе Gemini, и математические доказательства, написанные совместно с инструментами Google DeepMind, — но считает их пока недостаточными для трансформирующего эффекта.

Параллельно Кларк обращает внимание, что индустрия открыто декларирует автоматизацию ИИ-исследований как цель: OpenAI планирует «автономного ИИ-стажера» к сентябрю 2026, Anthropic публикует работы по автоматизированным исследователям выравнивания (alignment), стартап Recursive Superintelligence поднял $500 млн именно под эту задачу. Главный риск, который выделяет Кларк, — проблема накапливающихся ошибок в рекурсивном цикле: даже 99,9% точности выравнивания после 500 поколений превращаются в 60,5%. Если к концу 2028 года автономный ИИ-R&D так и не появится, по мнению Кларка, это будет означать фундаментальный дефект текущей технологии, и для движения вперед понадобятся прорывные идеи от людей.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть«, где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1031430/