Мощнее Mythos 5 и не запрещена: OpenAI выпустила GPT-5.5-Cyber для поиска уязвимостей

от автора

OpenAI расширила свою кибербез-программу Daybreak и выпустила полную версию модели GPT-5.5-Cyber. На бенчмарке CyberGym она набрала 85,6% — рекорд для одиночной модели. Но интрига в другом: на том же графике OpenAI второе место заняла Mythos 5 (83,8%) — та самая модель Anthropic, которую, вместе с публичной Fable 5, США неделей ранее экспортным запретом отрезали от всего мира.

Напомню фон. 12 июня Министерство торговли США выпустило экспортную директиву, запретившую Anthropic давать доступ к Fable 5 и Mythos 5 любым иностранцам — включая собственных сотрудников-неграждан. Компании пришлось отключить обе модели глобально. Причина — кибер-возможности: власти узнали о способе обойти защитные механизмы у Fable 5, которые как раз должны были закрывать доступ к потенциально опасным возможностям базовой Mythos.

Оговорюсь честно: «мощнее» здесь держится только на CyberGym и только на 1,8 пункта, а сам бенчмарк меряет воспроизведение уже известных уязвимостей. По автономному наступательному киберу Mythos, по заявлениям Anthropic, заметно сильнее. И GPT-5.5-Cyber тоже выдается не всем — только верифицированным защитникам. Разница в одном: ее никто не банил.

Стоит присмотреться и к самому «рекорду». CyberGym проверяет, может ли агент воспроизвести известную уязвимость в реальном окружении. Свой SOTA OpenAI считает относительно собственной же GPT-5.5 (81,8%) — а не относительно Mythos 5, которая по их графику стоит выше всех публичных моделей OpenAI и уступает только новой Cyber-версии. На двух других тестах разрыв с базовой GPT-5.5 нагляднее: 39,5% против 25,95% на ExploitGym (превращение уязвимости в рабочий эксплойт) и 69,8% против 63,1% на SEC-bench Pro.

В само расширение Daybreak вошло несколько частей. Главная новинка — Patch the Planet: инициатива с Trail of Bits и HackerOne, в рамках которой оплаченные исследователи с доступом к моделям OpenAI помогают мейнтейнерам опенсорса закрывать дыры. К программе подключились больше 30 проектов, включая cURL, Go, Python и Sigstore. Параллельно вышел апдейт плагина Codex Security (по данным OpenAI, он уже просканировал свыше 30 млн коммитов в более чем 30 тысячах репозиториев) и партнерская программа с десятками security-вендоров — от Cloudflare и CrowdStrike до Palo Alto Networks и Wiz.

И финальный штрих, который замыкает всю историю. OpenAI запускает новинку с явного благословения властей: компания упоминает диалог с американскими CAISI, ONCD и OSTP, а Trusted Access for Cyber уже расширили на ЕС (через ENISA), Британию, Японию, Корею и ряд других стран. Контраст с Anthropic получается жестким: одна лаборатория публично просила прозрачный регламент и получила тупой экспортный бан, другая выкатывает ту же категорию возможностей — и власти ей не мешают.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1050670/