DeepSeek V4 запустил ценовую войну в Китае: Xiaomi срезала цены на API до 99%

от автора

Xiaomi снизила цены на API своей серии моделей MiMo-V2.5 до 99% — это очередной ход в ценовой войне, которую в китайском ИИ запустил дешевый DeepSeek V4. Конкуренты вынуждены на лету переписывать прайсы, пишет South China Morning Post. Реакция рынка оказалась мгновенной — сразу после снижения MiMo-V2.5 взлетела на 6-е место мирового рейтинга моделей OpenRouter.

В конце мая DeepSeek сделала промо-скидку на флагман V4-Pro постоянной — цена опустилась до четверти от изначальной. DeepSeek фактически задал новый нижний уровень цены для агентных задач и длинного контекста, удержаться выше которого стало сложным: компаниям или приходится делать скидки следом, или убеждать пользователей, что их предложение заметно лучше.

Xiaomi выбрала первое — и максимально агрессивно. Помимо самой скидки компания убрала наценку за длину контекста: теперь цена за миллион токенов единая. В итоге за неделю MiMo-V2.5 обработала 1,7 трлн токенов — рост больше 999% к предыдущей неделе. Глава команды MiMo Фули Ло (в прошлом — один из ключевых разработчиков DeepSeek) уверяет, что на новых ценах продакшен-движок инференса работает почти на полную загрузку и компания выходит примерно в ноль — за счет оптимизации кэша. Для сохранения конкурентных позиций на рынке это отличный результат.

А вот MiniMax пошла в обратную сторону. 1 июня стартап выпустил флагман M3 (с открытыми весами, контекст 1M токенов, 59,0 на SWE-bench Pro — чуть выше GPT-5.5) и вместо прямой ценовой гонки добавил подписки с гибкими тарифными планами. Логика противоположная: гонка к нулю — тупик, и выживать надо за счет диверсификации выручки, а не самой низкой цены за токен. Так после V4 рынок раскололся на два лагеря — кто-то демпингует до себестоимости, кто-то строит подписочную модель как альтернативу.

Под перекрестным огнем оказались облачные провайдеры. Их бизнес во многом держится на перепродаже доступа к моделям, а когда сами лаборатории отдают API почти по себестоимости, наценивать становится не на что — маржа сжимается. Картина при этом шире одного китайского рынка: сверхдешевый китайский инференс превращается в глобальный ценовой ориентир, на который разработчики по всему миру будут давить, торгуясь с OpenAI и Anthropic.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1045206/