Разрыв между открытыми и закрытыми ИИ растет — данные Epoch AI

от автора

Исследовательский институт Epoch AI подсчитал, насколько лучшие открытые модели отстают от закрытых флагманов. Если брать период с января по конец мая 2026 года, то самые способные открытые модели уступали закрытым лидерам в среднем на четыре месяца. В привычных баллах разрыв составил восемь пунктов — это примерно столько же, сколько отделяет GPT-5 от GPT-5.5.

Измеряли все по внутренней метрике Epoch под названием ECI (Epoch Capabilities Index) — это сводный индекс: он объединяет результаты модели сразу по множеству бенчмарков и выдает единое число. Методика подсчета отставания довольно дотошная: аналитики идут по дням внутри окна с 1 января по 28 мая, для каждого дня берут сильнейшую доступную открытую модель и ищут самую позднюю дату, когда закрытый лидер еще не был значимо лучше нее. Поскольку оценки ECI приходят с погрешностью, для сравнения используют метод повторных выборок (bootstrap), а открытая модель считается догнавшей закрытую, если превосходит ее хотя бы в пяти процентах случаев.

Наглядно динамику видно по самому графику. На стороне открытых моделей передний край в разное время держали Llama, потом китайские DeepSeek-V3 и DeepSeek-R1, затем Qwen3-235B-A22B, а к весне 2026 года верхнюю точку заняла модель Kimi K2.6 от Moonshot, вышедшая 20 апреля. На стороне закрытых линия проходит через o1, o3, GPT-5 Pro и упирается в GPT-5.5 Pro от OpenAI, представленную 23 апреля. Кривые идут почти параллельно, и розовая линия открытых стабильно держится правее и ниже бирюзовой.

Любопытно, что нынешний разрыв чуть больше, чем был осенью. В октябрьском исследовании 2025 года те же авторы насчитали среднее отставание в три месяца за период с января 2023 по октябрь 2025 года. То есть за полгода лаг подрос с трех месяцев до четырех — динамика пусть и небольшая, но направлена не в пользу моделей с открытыми весами.

Стоит держать в голове и то, как сама цифра зависит от критерия. Epoch отмечает, что если ужесточить требование и засчитывать момент, когда модель догнала, только если точечная оценка ECI открытой модели строго выше закрытой, то разрыв растягивается уже до шести месяцев. Так что итоговые четыре месяца — это довольно щадящая оценка, а не нижняя граница.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1041844/