Единая цена, Auto-режим и оркестрация: как Veai выбирает модель за вас

от автора

🔥 До конца майских — Auto со скидкой 60% по минутам.

Почему все модели стоят одинаково

В Veai нет тарифной сетки по моделям. Основная идея: разработчик должен выбирать модель исходя из качества и скорости работы, а не из стоимости запроса. Ценовой барьер между моделями искажает выбор — человек берёт «подешевле», даже когда задача требует другого.

Исключение: режим Auto

Единственный случай, когда модель выбираем мы, а не пользователь — это режим Auto. При этом мы всегда явно сообщаем, какая модель работает в данный момент: никакой непрозрачности.

Сейчас все запросы в Auto переведены на GPT‑5.5 с максимальным уровнем reasoning (xHigh). Если по какой-то причине модель недоступна — автоматически подключается Opus 4.7.

Почему GPT‑5.5? Мы прогнали её через наш интерактивный агентный бенчмарк и сравнили с GPT‑5.4 на реальных сценариях в JetBrains IDE:

  • +20% закрытых задач по формальной проверке корректности результата

  • 100% success rate по всем инструментам: чтение и правка файлов, запуск конфигураций, поиск по имени

  • Агент реже говорит «всё готово» при упавшей сборке и реже ломает соседние модули

  • Закрывает задачи меньшим числом шагов и токенов — берёт точностью, а не количеством попыток

Подробный разбор с цифрами → читать на Хабре

Режим оркестрации

В последнем релизе появился режим оркестрации. Субагенты внутри одной задачи могут работать на более быстрых моделях или с меньшим бюджетом reasoning — если это суммарно выгоднее по соотношению времени и качества результата. Сейчас изучаем эффективность на бенчмарках — результатами поделимся отдельно.

Попробовать до конца майских

До конца майских праздников Auto-режим доступен со скидкой 60% по минутам.

→ Установить плагин Veai для JetBrains IDE и выбрать Auto в настройках агента.

ссылка на оригинал статьи https://habr.com/ru/articles/1028118/