Китайская ИИ-модель GLM-5.2 приблизилась к Claude Mythos в поиске уязвимостей. Что это меняет для ИБ

от автора

13 июня китайская компания Zhipu AI представила открытую языковую модель GLM-5.2. Вскоре после релиза результаты независимых тестов привлекли внимание специалистов по информационной безопасности: в одной из задач поиска программных уязвимостей модель показала результаты, сопоставимые с Claude Mythos от Anthropic.

Новость интересна не только очередным сравнением китайских и американских LLM. Она демонстрирует, насколько быстро открытые модели сокращают отставание от закрытых решений в прикладных задачах ИБ. На фоне недавней истории с временными экспортными ограничениями США на модели Anthropic это еще раз показывает: развитие специализированных ИИ-инструментов уже сложно сдерживать административными мерами.

Что произошло

GLM-5.2 распространяется под лицензией MIT и поставляется с открытыми весами (open-weight). Это позволяет разработчикам свободно скачать модель, запускать ее локально, модифицировать и использовать в том числе в коммерческих продуктах без привязки к облачным API поставщика.

Этим GLM-5.2 отличается от Claude Mythos, которая распространяется как закрытая модель с доступом через API Anthropic и не предусматривает локального развертывания. Именно способность подобных моделей автоматически анализировать программный код и помогать в поиске уязвимостей стала одной из причин недавнего внимания к ним со стороны американских регуляторов.

Хотя в универсальных тестах GLM-5.2 пока уступает ведущим моделям OpenAI и Anthropic, в специализированных задачах ситуация оказалась интереснее. По данным компании Semgrep, которая провела независимое тестирование, GLM-5.2 получила F1-score 39% при обнаружении уязвимостей класса IDOR (Insecure Direct Object Reference). Для сравнения, Claude Code в тех же условиях показал около 32–37%.

IDOR — это класс уязвимостей в ПО, связанных с проблемами контроля доступа. Упрощенно их можно описать как «вы получаете доступ к тому, что принадлежит другому пользователю». В терминах БДУ ФСТЭК такие уязвимости можно отнести к BDU:W02 (Уязвимости, связанные с недостатками управления доступом и защиты данных).

Еще одно отличие — стоимость использования модели. По оценке исследователей, обнаружение одной уязвимости обходилось примерно в $0,17, тогда как аналогичный рабочий процесс на базе Claude стоил около $1.

Метрика

GLM-5.2

Claude Mythos

F1 при поиске IDOR

39%

32–37%

Стоимость обнаружения одной уязвимости

~$0,17

~$1+

Доступность

Open-weight

Закрытая модель

Лицензия

Открытая

Проприетарная

Важно понимать, что речь идет не о выходе очередной «лучшей модели в мире» и даже не универсальной модели для обнаружения уязвимостей в ПО. Результаты относятся к конкретному набору тестов по обнаружению IDOR и не означают лидерства GLM-5.2 в остальных задачах программирования или анализа безопасности. 

При этом в списке OWASP Top 10 2025 IDOR относится к категории A01: Broken Access Control, которая является наиболее частой серьезной угрозой безопасности для веб-приложений. 

Security Center 

Рассказываем о лучших практиках и средствах ИБ, требованиях и изменениях в законодательстве.

Исследовать →

Почему это важно

История с GLM-5.2 разворачивается на фоне недавней дискуссии о регулировании передовых ИИ-моделей. Как уже упоминали ранее, в июне Министерство торговли США ввело экспортные ограничения на модели Claude Mythos 5 и Fable 5, объяснив это рисками их использования для поиска уязвимостей с дальнейшим проведением кибератак. Спустя несколько недель ограничения были сняты после договоренностей между Anthropic и регулятором.

Однако сама дискуссия не закончилась. Результаты GLM-5.2 показывают, что даже если доступ к отдельным коммерческим моделям можно временно ограничить, открытые альтернативы продолжают быстро развиваться и сокращать разрыв в производительности.

Фактически рынок получил еще одно подтверждение общей тенденции: преимущества закрытых моделей постепенно уменьшаются, а Open Source-модели ИИ начинают достигать сопоставимого уровня в специализированных задачах, включая анализ защищенности приложений. Для компаний это означает, что инструменты автоматизации AppSec становятся доступнее и их можно развернуть внутри собственного контура без зависимости от внешних сервисов.

Что это означает для специалистов по ИБ

Для специалистов по информационной безопасности эта новость имеет сразу несколько последствий.

Автоматизация AppSec становится доступнее

Open source-модели ИИ можно встроить в собственные пайплайны анализа кода, CI/CD и процессы DevSecOps без зависимости от зарубежных API, а также риска утечки данных и блокирования ключевых бизнес-процессов.

Это не значит, что сегодня LLM способны заменить AppSec-специалистов. Современные модели по-прежнему допускают большое количество ложных срабатываний, требуют проверки результатов и плохо справляются с комплексным анализом архитектуры приложений. Однако они уже становятся эффективным инструментом первичного поиска потенциальных проблем.

Развивается не только модель, но и экосистема

При этом развивается не только качество самих моделей, но и экосистема вокруг них. Появляются специализированные агенты, песочницы для автоматического тестирования, средства воспроизведения найденных сценариев и проверки эксплуатируемости уязвимостей. 

Все это постепенно повышает практическую ценность подобных решений и снижает количество ложноположительных результатов.

Инструменты становятся доступны и атакующей стороне

Если раньше поиск сложных уязвимостей требовал участия целых команд опытных исследователей, а в последнее время — доступа к дорогостоящим коммерческим сервисам, то теперь аналогичные возможности постепенно переходят в категорию массовых технологий, применение которых сложно ограничивать и контролировать. Это снижает порог входа для проведения атак и потенциально увеличивает как их количество, так и сложность.

Появление открытых моделей с возможностями профессионального хакера «раскручивает маховик» применения ИИ в вопросах атаки и защиты современной ИТ-инфраструктуры. Мы ожидаем, что это приведет к необходимости полной автоматизации процессов управления уязвимостями, росту потребности в мониторинге информационной безопасности и большей сегментации ИТ-инфраструктуры компаний.

Куда движется рынок ИБ и инфраструктуры

Рынок постепенно переходит от универсальных LLM к специализированным моделям, оптимизированным под конкретные инженерные задачи. Для ИБ это означает, что автоматизированный анализ кода, поиск уязвимостей и аудит инфраструктуры будут все чаще выполняться ИИ-моделями, которые можно запускать в полностью контролируемой среде, без передачи исходного кода внешним сервисам.

Это особенно актуально для компаний с повышенными требованиями к безопасности и хранению данных. Если организация уже экспериментирует с внедрением ИИ в процессы разработки или AppSec, имеет смысл заранее предусмотреть инфраструктуру для самостоятельного запуска подобных моделей — например, в облаке, на выделенных серверах с GPU или с полной изоляцией и контролем даже физического доступа провайдера к серверам с GPU в Enterprise-grade ЦОД Selectel.

Enterprise-grade ЦОД

Комплексное решение ваших ИТ-задач в инфраструктуре Selectel: серверы, сеть и хранение данных с архитектурой, готовой к проверкам службы безопасности, крупных клиентов и внешних аудиторов.

Исследовать →

Что дальше

GLM-5.2 пока нельзя назвать прямым конкурентом наиболее мощных моделей OpenAI или Anthropic. Однако результаты независимых тестов показывают более важную тенденцию: открытые модели начинают достигать уровня, достаточного для решения отдельных задач информационной безопасности.

Вероятно, в ближайшие годы главным вопросом станет уже не то, кто обладает подобными инструментами, а кто быстрее сможет встроить их в реальные процессы разработки и защиты приложений. Делитесь в комментариях прогнозами и мыслями по этому поводу, будет интересно обсудить!

ссылка на оригинал статьи https://habr.com/ru/articles/1054448/