OpenAI выпустила GPT-5.5 с кодовым именем «Spud» — первую с нуля переобученную базовую модель со времён GPT-4.5. Разбираем факты.

Память выросла в 8 раз
GPT-5.4 начинал путаться в фактах после 128 тысяч токенов. Новая версия держит контекст до 1 миллиона — это примерно 1500 страниц плотного текста. На тестах MRCR v2 при объёме 512K–1M токенов GPT-5.5 сохраняет точность 74%, тогда как прошлая версия падала до 36,6%, а Claude Opus 4.6 — до 32,2%.
Для сравнения: у Google Gemini 3.1 Pro заявлено окно в 2 миллиона токенов, но по точности извлечения конкретных фактов из больших документов GPT-5.5 пока выигрывает в тестах первых суток.
Кодинг: цифры из закрытых тестов
В Terminal-Bench 2.0 — тест на работу с командной строкой — GPT-5.5 набрал 82,7%. Claude Opus 4.7 на той же задаче: 69,4%, Gemini 3.1 Pro: 68,5%.
В закрытом тесте Expert-SWE (реальные задачи разработки) базовая модель дала 73,1%. OpenAI назвала это готовностью к Enterprise-разработке.
Математика
В блоке FrontierMath Tier 4 — это задачи олимпийского уровня — версия GPT-5.5 Pro набрала 39,6%. Для сравнения: Claude Opus 4.7 там показал 22,9%, Gemini 3.1 Pro — 16,7%.
Браузер
В тестах на веб-навигацию BrowseComp: базовая GPT-5.5 — 84,4%, Gemini 3.1 Pro — 85,9%, GPT-5.5 Pro — 90,1%.
Агент Codex
Встроенный агент пишет код, запускает его в изолированной среде, находит баги и возвращает готовый результат без участия человека. OpenAI тестировала Codex на собственной инфраструктуре: агент написал скрипт балансировки нагрузки на GPU с нуля, скорость инфраструктуры выросла на 20%.
Как запустить из России без подписки
Официальный доступ из РФ заблокирован: нужны иностранный IP, виртуальный номер и карта другой страны. Благо, разработчики SpeShu.AI одними из первых выпустили модель на русском языке. Она доступна без VPN и подписки OpenAI за 20$.

Сэкономьте время и нервы и начните пользоваться флагманской моделью ChatGPT-5.5 уже сейчас на СПЕШУ АИ.
ссылка на оригинал статьи https://habr.com/ru/articles/1027780/