GPT-5.4 и Opus 4.6 воспроизвели находки закрытой модели Mythos от Anthropic

от автора

Anthropic заявила, что их закрытая модель Mythos находит уязвимости, недоступные публичным инструментам. Исследователи из Vidoc проверили это.

В начале апреля Anthropic опубликовала результаты проекта Mythos: специализированная модель нашла баги в FreeBSD, OpenBSD, FFmpeg, Botan и wolfSSL — включая 27-летний баг в TCP-стеке OpenBSD. Вместе с анонсом Project Glasswing это подавалось как аргумент за то, что доступ к новой frontier-модели должен быть закрытым и подконтрольным.

Команда Vidoc Security взяла те же публично запатченные примеры и прогнала их через GPT-5.4 и Claude Opus 4.6 в opencode — опенсорсном агенте. Без внутреннего стека Anthropic, без доступа к «уникальной» модели.

FreeBSD (CVE-2026-4747) и Botan (CVE-2026-34580/34582) воспроизвелись точно у обеих моделей, 3/3. OpenBSD — только у Claude Opus 4.6 (GPT-5.4 не нашёл ни разу). FFmpeg и wolfSSL дали частичный результат: модели находили правильное место в коде, но неверно интерпретировали последствия.

Собственно, в этом и состоит результат: из пяти публично описанных категорий три воспроизводятся чисто, две — частично. Никаких специальных инструментов.

Anthropic в своём анонсе говорит о «тысячах» находок, 99% из которых под эмбарго до патча вендора. Эту часть проверить невозможно. Но публичные примеры — те, которые Anthropic сама выбрала как показательные, уже не выглядят такими эксклюзивными.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

ссылка на оригинал статьи https://habr.com/ru/articles/1024952/