NVIDIA представила Nemotron 3 Ultra: открытая 550B-модель, до 5 раз быстрее в своем классе

от автора

На кейноуте в Тайбэе 1 июня Дженсен Хуанг представил Nemotron 3 Ultra — старшую модель в открытом семействе Nemotron 3. Это рассуждающая модель примерно на 550 млрд параметров (почти как прошлогодний DeepSeek R1), которую NVIDIA позиционирует как открытую альтернативу закрытым флагманам для построения ИИ-агентов. Сами веса обещают выложить 4 июня на Hugging Face, OpenRouter, ModelScope и build.nvidia.com.

Под капотом — гибрид Mamba-Transformer с latent MoE: из 550 млрд параметров на каждый токен активны около 55 млрд, а Mamba-слои дают линейную сложность и нативный контекст в 1 млн токенов. Обучали модель в 4-битном формате NVFP4 на архитектуре Blackwell. Производительность NVIDIA описывает так: до 5 раз быстрее и примерно на 30% дешевле открытых моделей своего класса — но это собственные оценки компании против выбранных ею же соперников и на конкретных задачах, так что относиться к ним стоит как к стартовой точке до независимых замеров.

На сравнительном слайде «»Frontier Smart»» Ultra поставили против GLM 5.1, Kimi K2.6 и Qwen3.5. Ultra выигрывает чисто только в двух строках — следование инструкциям (82%) и длинный контекст (95%), делит первое место в агентной продуктивности (91%, вровень с Kimi) и профессиональных задачах (56%), но проигрывает в долгосрочном планировании, кодинге и knowledge work.

Отдельная фишка — степень открытости. NVIDIA отдает не только веса, но и данные, на которых модель училась: вместе с семейством опубликованы около 3 трлн токенов датасетов для пред- и пост-обучения, а также open-source библиотеки NeMo Gym и NeMo RL со средами для обучения с подкреплением. Компания или университет могут не просто запустить Nemotron, но дообучить его на своих данных и проверить, что именно в него заложено.

Ultra закрывает линейку, которую NVIDIA разворачивала полгода: Nano в декабре, Super в марте, мультимодальная Nano Omni в апреле — и теперь старшая модель. Заточена она под агентов: пост-обучение проводили под фреймворки Hermes Agent, LangChain Deep Agents, OpenClaw, OpenHands и OpenCode, а Perplexity уже заявляет, что направляет часть задач на Nemotron 3 Ultra через свой агентный роутер. Следующее поколение, Nemotron 4, по словам компании, уже в разработке.

P.S. Поддержать меня можно подпиской на канал «»сбежавшая нейросеть»», где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1042104/