
OpenAI выпустила GPT-5.5 — новый флагман, который, по заявлению компании, помог оптимизировать собственный инференс-стек.
По словам компании, GPT-5.5 в кодинг-агенте Codex оптимизировала производительность: в частности, Codex проанализировал недели продакшн-трафика и написал алгоритм балансировки запросов между вычислительными ядрами GPU. После этого скорость генерации токенов в продакшне выросла больше чем на 20%.
GPT-5.5 и GPT-5.5 Pro сегодня появляются в ChatGPT и Codex для Plus, Pro, Business и Enterprise подписок; в API OpenAI обещает поставить модель в ближайшее время.

Это продолжение тренда, который компания обозначила еще с GPT-5.3-Codex в феврале, — тогда ранние версии модели помогали команде дебажить собственное обучение и анализировать результаты оценки. С GPT-5.5 вышел шаг крупнее: раньше запрос на GPU делился на фиксированное число кусков, что было неоптимально для реальных паттернов нагрузки. Теперь же схема динамическая, и код для нее написала сама модель через Codex.
Побочный эффект этой работы — задержки не выросли. Крупные модели обычно обслуживаются медленнее, но по задержке на токен GPT-5.5 в продакшне совпадает с GPT-5.4 при заметно более высоком уровне интеллекта. На тех же задачах в Codex новая модель использует меньше токенов, чем предшественница.

OpenAI приводит несколько примеров, где GPT-5.5 сделала то, что раньше не удавалось моделям. Внутренняя версия с кастомной обвязкой нашла новое доказательство давно известной асимптотической оценки для недиагональных чисел Рамсея — одного из центральных объектов комбинаторики; результат был формально проверен в Lean. Другой сюжет связан с кибербезопасностью. GPT-5.5 получила уровень High по кибербезопасности и биологии/химии в Preparedness Framework — внутренней шкале OpenAI для оценки опасных возможностей модели (первой с High по кибербезу стала GPT-5.3-Codex еще в феврале). Параллельно OpenAI расширяет программу Trusted Access for Cyber: верифицированные защитники критической инфраструктуры получают доступ к более свободной версии модели с меньшим числом ограничений.
Сильные стороны модели в области программирования особенно ярко проявляются в Codex, где она может выполнять инженерную работу, начиная от реализации и рефакторинга и заканчивая отладкой, тестированием и проверкой. Предварительные тесты показывают, что GPT-5.5 лучше справляется с теми задачами, от которых зависит реальная инженерная работа, такими как поддержание контекста в больших системах, анализ неоднозначных ошибок, проверка предположений с помощью инструментов и внесение изменений в окружающий код.
GPT-5.5 в API будет стоить $5 за миллион входных токенов и $30 за миллион выходных, GPT-5.5 Pro — $30 и $180 соответственно. Это дороже GPT-5.4, но компания утверждает, что за счет токеновой эффективности итоговые счета в Codex для большинства сценариев выйдут меньше. Pro-версия в ChatGPT доступна для Pro, Business и Enterprise, базовая GPT-5.5 — также для Plus.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
ссылка на оригинал статьи https://habr.com/ru/articles/1027230/