На конференции Build 2026 подразделение Microsoft AI представило семейство из семи новых моделей под брендом MAI. Среди них — MAI-Thinking-1, первая собственная модель рассуждений компании. Глава направления Мустафа Сулейман подал релиз как часть более крупной истории: Microsoft строит собственную лабораторию суперинтеллекта — систему, которая, по его словам, должна постоянно улучшаться от цикла к циклу. Название для нее он выбрал образное — «машина восхождения».
Семь моделей закрывают сразу несколько модальностей. Вот они вкратце (детали):
-
MAI-Thinking-1 — флагманская модель рассуждений среднего размера, 35 млрд активных параметров и контекст на 128 тысяч токенов;
-
MAI-Code-1-Flash — компактная агентная модель для кодинга на 5 млрд параметров, встроенная в GitHub Copilot и VS Code;
-
MAI-Image-2.5 (плюс облегченный вариант Flash) — генерация и редактирование изображений, по заявлению Microsoft, выше Nano Banana Pro в рейтинге Arena;
-
MAI-Transcribe-1.5 — транскрипция речи на 43 языках, в пять раз быстрее конкурентов;
-
MAI-Voice-2 (и будущая MAI-Voice-2-Flash) — синтез речи на 15 языках с клонированием голоса по короткому образцу.
Главную ставку Microsoft делает не на сами модели, а на то, что с ними можно сделать. Компания представила механизм Frontier Tuning: клиент дообучает модель под собственные рабочие процессы прямо в своей среде, на своих данных, через так называемые среды обучения с подкреплением (RLE) — что-то вроде закрытых тренажерных залов для ИИ. По заявлению Microsoft, дообученная под Excel модель сравнялась с GPT-5.4 при эффективности до десяти раз выше, а на корпоративных стандартах McKinsey показала лучший процент побед среди протестированных моделей примерно при десятикратно меньшей цене.

Любопытнее всего то, как Microsoft подает MAI-Thinking-1. Компания заявляет, что в слепых сравнениях модель достигла паритета с Sonnet 4.6 от Anthropic по человеческим предпочтениям — но это про субъективную оценку ответов, а не про тесты. На опубликованных самой Microsoft бенчмарках картина сложнее. В олимпиадной математике модель действительно хороша: на AIME 2025 она набирает 97 баллов, обходя Sonnet 4.6 (95,6) и почти догоняя Opus 4.6 (99,8). Зато в агентном программировании MAI-Thinking-1 заметно уступает большинству флагманов: на Terminal Bench 2.0 (46,0) и SWE-Bench Verified (73,5) у нее одни из худших результатов в таблице, а на SWE-Bench Pro (52,8) она идет вровень разве что с Opus 4.6 (53,4) — который и сам там в аутсайдерах, проигрывая GPT-5.4, Kimi K2.6 и DeepSeek V4. При этом, многие модели в сравнении уже отстают на 1-2 поколения — сейчас доступны GPT-5.5 и Opus 4.8. Пока MAI-Thinking-1 доступна в закрытом превью на платформе Foundry.
Этот принцип — обучение с нуля и без дистилляции — Сулейман подает как ключевую черту всей лаборатории: только лицензированные и чистые данные, собственная архитектура и пайплайн, а также свой чип Maia 200, который уже дает прирост эффективности в 1,4 раза. В тот же день Microsoft анонсировала и совместную с клиникой Mayo разработку отдельной передовой модели для медицины — она будет обучаться на обезличенных клинических данных и останется в собственности клиники. Общую цель компания называет «гуманистическим суперинтеллектом»: ИИ должен оставаться инструментом под контролем человека.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1042914/