MiniMax M3 обошла GPT-5.5 на SWE-Bench Pro и выйдет с открытыми весами

от автора

MiniMax M3 вышла сегодня — это мощная языковая модель, которая одновременно предлагает frontier-уровень в кодировании и агентных задачах, контекст до 1 миллиона токенов и нативную мультимодальность (изображения, видео + управление компьютером). По словам компании, среди моделей с открытыми весами она первая с таким полным набором возможностей.

Основные фичи и достижения

  • Архитектура: Главное нововведение — MSA (MiniMax Sparse Attention). Благодаря ей при контексте в 1 млн токенов модель тратит в 20 раз меньше вычислений на токен по сравнению с предыдущим поколением. Prefill ускорился примерно в 9 раз, decode — в 15 раз.

  • Бенчмарки по кодированию и агентам:

    • SWE-Bench Pro: 59,0% — выше, чем у GPT-5.5 и Gemini 3.1 Pro, чуть ниже Opus 4.7.

    • Terminal-Bench 2.1: 66,0%.

    • Claw-Eval (агентные задачи): первое место среди протестированных моделей.

  • Длинный контекст: M3 обогнала OpenAI o3 и Opus 4.7, уступив только Gemini 2.5 Pro (по заявлениям компании).

  • Мультимодальность: Модель обучали с нуля на мультимодальных данных (текст + изображения/видео). Объём обучающей выборки довели до 100 триллионов токенов. Это позволяет ей естественно работать с разными типами данных.

Через агентный продукт MiniMax Code модель поддерживает computer use — может управлять десктопным интерфейсом по текстовым командам (открывать программы, работать с файлами и т.д.).

  • Модель уже доступна через API с сегодняшнего дня (1 июня 2026).

  • Технический отчёт и открытые веса выйдут в течение 10 дней.

  • Подписка Plus за $20 в месяц даёт около 1,7 млрд токенов M3.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

ссылка на оригинал статьи https://habr.com/ru/articles/1041946/