OpenAI показала GPT‑5.6 Sol

от автора

Помните, мы обсуждали, что Белый дом попросил OpenAI отложить релиз GPT‑5.6? Так вот — они сделали ограниченный предварительный доступ.

OpenAI официально анонсировала GPT‑5.6 Sol — флагманскую модель нового поколения. Вместе с ней выходят Terra (сбалансированная для повседневных задач) и Luna (быстрая и доступная). Terra, кстати, держится на уровне GPT‑5.5, но в два раза дешевле.

Что умеет Sol

Это самая мощная модель OpenAI на сегодня. И вот почему:

  • Новый «максимальный» режим рассуждений — Sol может тратить больше времени на глубокое обдумывание.

  • Режим «ультра» — выходит за рамки одного агента, используя субагентов для ускорения сложной работы.

Цифры говорят сами за себя:

  • Terminal‑Bench 2.1 (командная строка, планирование, координация инструментов) — новый SOTA.

  • GeneBench v1 (геномика и количественная биология) — сильнее GPT‑5.5 при меньшем количестве токенов.

  • ExploitBench² — конкурентоспособна с Mythos Preview, используя всего ~1/3 выходных токенов.

  • ExploitGym (бенчмарк от UC Berkeley, OpenAI и других лабораторий) — все три модели (Sol, Terra, Luna) показали сильное улучшение кибервозможностей при увеличении глубины рассуждений.

Подробные графики:

Скрытый текст

Что с ограничениями

OpenAI не стала скрывать: они заранее обсудили планы с правительством США. И по его просьбе запуск начали с ограниченного превью для небольшой группы доверенных партнёров, одобренных властями.

Но компания дала понять: это не должно стать нормой. Этот вариант не даёт лучшие инструменты пользователям, разработчикам, предприятиям, защитникам кибербезопасности и глобальным партнёрам, которые в них нуждаются. OpenAI называет это краткосрочным шагом, чтобы в ближайшие недели получить более широкую доступность, пока они вместе с администрацией разрабатывают исполнительный указ по кибербезопасности и повторяемый процесс для будущих релизов.

Безопасность — не просто слово

GPT‑5.6 Sol поставляется с самым надёжным стеком безопасности на сегодня. Конфигурации безопасности подогнаны под каждую модель: чем мощнее модель — тем жёстче защита, но при этом сохраняется доступ к легитимной работе: ревью кода, исследование уязвимостей, разработка патчей, отладка, безопасность и защитное тестирование.

Итог: компромисс, который никто не хотел

OpenAI получила возможность показать модель. Правительство — контроль над доступом. Пользователи — тизер и обещание «в ближайшие недели».

Sol реально мощная. Terra — дёшево и сердито. Luna — для тех, кто считает каждый токен.

А главная интрига — как долго продлится этот «краткосрочный» режим и что будет с GPT‑5.7, когда она подойдёт к релизу.

ссылка на оригинал статьи https://habr.com/ru/articles/1052636/