Kimi K2.7 Code стала в 6 раз быстрее — до 260 токенов в секунду

от автора

Китайская Moonshot AI представила Kimi K2.7 Code HighSpeed — скоростной режим своей открытой модели для программирования Kimi K2.7 Code. Это та же модель, но с ускоренным выводом: до 6 раз быстрее, около 180 токенов в секунду на типичных задачах кодинга и до 260 токенов в секунду на коротком контексте. Доступ раскатывают постепенно — компания объясняет это нехваткой мощностей.

Анонс закрывает обещание из релиза K2.7 Code от 12 июня, где скоростной режим значился как готовящийся к запуску. Сама модель открытая — веса лежат на Hugging Face под лицензией Modified MIT, в основе K2.6, контекст 256K токенов, упор на длинные агентные задачи. Важная деталь: режим рассуждений у нее включен всегда, модель сначала «думает», потом отвечает. Поэтому скорость вывода тут критична — на агентных прогонах из десятков шагов задержка копится на каждом вызове. Сама по себе K2.7 Code при этом тратит примерно на 30% меньше токенов на рассуждения, чем K2.6.

Скоростной режим раскатывают на участников бета-программы Kimi Code, разработчиков на Kimi API и бизнес-пользователей. Приглашение не требуется: попасть может любой, кто вступит в бету, — но из-за ограниченных мощностей доступ пока узкий, и скорость может плавать. Свою позицию Moonshot формулирует так: открытый интеллект должен быть «мгновенным, доступным и без границ».

Ставка на скорость для Kimi не нова: ранее Cerebras запускала предыдущую K2.6 на своих чипах под ~1000 токенов в секунду. Но там разгон давал сторонний провайдер на специализированном железе, а здесь это собственный режим Moonshot — попытка сделать тяжелую модель на триллион параметров отзывчивой для агентного кодинга, где задержка ощущается сильнее всего. Стоит держать в уме и оговорку: заявленные приросты K2.7 Code компания мерила в основном на своих бенчмарках, независимых сторонних результатов (SWE-bench и подобных) пока нет.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

ссылка на оригинал статьи https://habr.com/ru/articles/1047782/