OpenAI GPT-5.5 Pro и GPT-5.5 Thinking набрали по 130 баллов на закрытом IQ-тесте TrackingAI и разделили первое место среди текстовых моделей. На стандартной шкале IQ 130 — это примерно граница верхних 2% населения, именно по этому критерию Mensa приглашает кандидатов с одобренного теста.

TrackingAI ведет два теста: публичный Mensa Norway и закрытый Offline Test. Публичный тест доступен в интернете, поэтому его вопросы, ответы или разборы могли попасть в обучающие данные моделей. Offline Test, по словам авторов проекта, составил участник Mensa; эти вопросы не публиковались в сети и не должны были попасть в обучение ИИ. Поэтому закрытый тест интереснее как проверка способности решать новые задачи, а не узнавать уже виденные закономерности.
Еще одна важная деталь: TrackingAI отдельно прогоняет модели в текстовом режиме с включенным компьютерным зрением. Первым IQ-задачи описывают словами, а вторым показывают изображение задания. Поэтому результаты нельзя смешивать в одну общую таблицу: текстовая модель зависит от качества описания, а модель с компьютерным зрением тестируется еще и на способность самостоятельно прочитать визуальную задачу.
Именно из-за этих разделений GPT-5.5 нельзя просто объявить «самым умным ИИ». На закрытом Offline Test текстовые GPT-5.5 Pro и GPT-5.5 Thinking лидируют, но на публичном Mensa Norway среди текстовых моделей GPT-5.5 Thinking не первый: выше в таблице стоят Grok-4.20 Expert Mode, Gemini 3.1 Pro Preview и Claude-4.7 Opus Extended Thinking. Кроме того, этот формат проверяет прежде всего абстрактную логику, а не программирование, научную работу, надежность или работу в роли агента.
Аккуратный вывод такой: GPT-5.5 стал лидером важной части IQ-рейтинга TrackingAI, особенно на закрытом наборе задач. Это сильный результат для задач на абстрактное мышление, но не универсальное доказательство превосходства над всеми ИИ во всех возможных тестах.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть«, где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1028048/