Представлен Qwen3.7-Plus — бесплатный ИИ с поддержкой изображений

от автора

Alibaba выпустила Qwen3.7-Plus — мультимодальную модель новой линейки, которая работает не только с текстом, но и с изображениями. В отличие от чисто текстового флагмана Qwen3.7-Max, Plus заточен под задачи, где надо понимать картинки, интерфейсы и экраны. Попробовать модель можно бесплатно в режиме превью в веб-чате на chat.qwen.ai.

В текстовых и агентных тестах Plus, по данным самой Alibaba, подбирается к уровню старшего Max, а местами обходит конкурентов. На Terminal-Bench 2.0 (агентный кодинг в терминале) модель набрала 70,3 балла — выше, чем у DeepSeek-V4-Pro, Kimi-K2.6 и Claude-Opus-4.6 в той же подборке. На MCP-Mark, где проверяют работу с внешними MCP-серверами, — 58,7, тоже первое место в наборе. Это вендорские цифры, независимых замеров пока нет.

Главное у Plus — мультимодальная часть, и тут виден резкий скачок относительно прошлого поколения. На тесте визуального понимания BabyVision — 64,7 балла против 37,4 у Qwen3.6-Plus, на мультимодальном MMBC — 46,3 против 18,3. На задачах понимания экрана и реальных визуальных вопросов (ScreenSpot Pro — 79,0, RealWorldQA — 86,9) Plus в подборке Alibaba опережает GPT-5.4, Gemini-3.1-Pro и Claude-Opus-4.6. Сама компания подает это не как набор отдельных улучшений, а как прокачку способностей мультимодального агента: понимать сложный визуальный ввод, рассуждать над ним, пользоваться инструментами и выполнять задачи в коде или GUI.

В подтверждение Alibaba показала несколько демо, где Plus работает именно как агент. В одном модель сама исследует структуру проекта и пишет под него техзадание, в другом — воссоздает интерфейс приложения, а в браузерном сценарии самостоятельно ходит по облачной консоли Alibaba Cloud, чтобы подобрать и заказать сервер. Связка с сильным «пониманием экрана» тут логична: чтобы кликать по интерфейсу, агенту надо его видеть.

Несколько оговорок. Сравнение в анонсе идет не с самыми свежими версиями конкурентов — в таблице стоят Claude-Opus-4.6 и GPT-5.4, тогда как актуальны уже Claude Opus 4.8 и GPT-5.5. Plus, как и Max, пока в статусе превью, веса закрыты, и потрогать модель можно только онлайн. В прошлых поколениях Alibaba публиковала веса Plus-версии модели — выложат ли их на этот раз, пока неизвестно.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1042398/