
Китайская DeepSeek сообщила, что финальная версия модели V4 выйдет в середине июля, а вместе с релизом поменяется и логика оплаты API: компания вводит раздельные тарифы для пиковых и непиковых часов. Ключевое следствие для разработчиков — в часы пик вызовы API будут стоить ровно вдвое дороже, чем в остальное время. Актуальные расценки DeepSeek публикует на странице цен своей документации.
Пиковыми объявлены рабочие часы по пекинскому времени, а вот как меняются цены (в скобках — пересчет в доллары по курсу около 6,8 ¥/$). Фактически речь идет об удвоении в пиковые часы:
-
Пиковые часы: 9:00–12:00 и 14:00–18:00 по Пекину, ежедневно — суммарно 6 часов в сутки.
-
V4-Pro: вход (cache miss) ¥3 → ¥6 (≈ $0,44 → $0,88), выход ¥6 → ¥12 (≈ $0,88 → $1,76).
-
V4-Flash: вход ¥1 → ¥2 (≈ $0,15 → $0,29), выход ¥2 → ¥4 (≈ $0,29 → $0,59).
-
Кэшированный вход: у V4-Pro ¥0,025 → ¥0,05, у V4-Flash ¥0,02 → ¥0,04 за миллион токенов.
Причина, судя по всему, в нехватке вычислительных мощностей. Пользователи давно жалуются на ошибки «Server Busy» в часы наибольшей нагрузки, а сам сервис работает на инфраструктуре в Китае — в том числе на чипах Huawei Ascend, под которые DeepSeek оптимизировала V4 в условиях экспортных ограничений США на ускорители Nvidia. Поднимая цену именно в рабочие часы Китая, компания фактически использует тариф как инструмент: чтобы развести нагрузку и подтолкнуть не терпящие задержек задачи на более свободное время.
Пользователям из России пиковое окно стоит пересчитать в местное время: Пекин опережает Москву на 5 часов, поэтому наценка действует с 04:00 до 07:00 и с 09:00 до 13:00 по Москве. Вторая волна приходится ровно на начало рабочего дня — так что утренние запросы к API из РФ как раз попадут в дорогой тариф. О каждом изменении цен DeepSeek обещает предупреждать по почте за 24 часа; продолжение работы после этого считается согласием с новыми условиями, а несогласным предлагают остановиться и запросить возврат средств.
Подробности финальных версий V4 компания раскрывать не стала. Но с учетом того, что preview-варианты вышли в конце апреля, можно ожидать роста в бенчмарках: три месяца — достаточное окно для доводки моделей.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1053438/