DeepSeek V4 уже доступен бесплатно в чат-приложении — 1М контекста и приличные бенчмарки

от автора

DeepSeek выпустила V4 Preview: веса выложены на Hugging Face, платный доступ организован через API, а в веб-чате и приложениях модель можно попробовать бесплатно. В линейку входят две модели на архитектуре «смесь экспертов»: DeepSeek-V4-Pro с 1,6 трлн параметров, из которых активируются 49 млрд, и DeepSeek-V4-Flash с 284 млрд параметров и 13 млрд активных. В чате это flash и expert соответственно. Обе версии работают в быстром режиме и режиме глубокого мышления и поддерживают веб-поиск.

Контекстное окно обеих моделей до 1 млн токенов, а в API у них заявлен максимальный вывод до 384K токенов, вызовы инструментов и JSON-вывод. В карточке на Hugging Face веса опубликованы под MIT-лицензией, так что корректнее говорить об открытых весах, а не о полностью открытом процессе обучения. Бенчмарки близки к моделям-лидерам прошлого поколения, вроде Opus 4.6 и GPT-5.4. А вот свежим Opus 4.7 и только что вышедшей GPT-5.5 новинка все-таки уступает:

Технически главный акцент V4 — экономия на длинном контексте. DeepSeek пишет, что при контексте в 1 млн токенов V4-Pro требует только 27% вычислений на новый токен и 10% KV-кеша по сравнению с DeepSeek-V3.2. KV-кеш — это память, где модель хранит промежуточные данные внимания; именно она быстро разрастается на длинных запросах. Поэтому здесь важен не только сам миллион токенов, но и попытка сделать такой режим дешевле в реальной эксплуатации.

Для разработчиков DeepSeek отдельно продвигает V4 как модель для кодинг-агентов. В документации есть инструкция для подключения к Claude Code через Anthropic-совместимый API: V4-Pro предлагается использовать как модель уровня Opus/Sonnet, а V4-Flash — как более быстрый и дешевый вариант уровня Haiku. Это не нативная поддержка Claude Code со стороны Anthropic, а совместимый endpoint, но направление видно: DeepSeek хочет попасть в инструмент, которым пользуются профессионалы по своему миру. А для массового пользователя предлагает бесплатный чат-вариант.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть«, где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1027324/