GMKtec EVO-X2 — мини-ПК с AMD Ryzen AI Max+ 395, который запускает 235-миллиардные модели локально

от автора

На CES 2026 в Лас-Вегасе GMKtec EVO-X2 стоял на стенде AMD в центре экспозиции — на фоне выступления Лизы Су как пример того, каким она видит локальный ИИ на устройствах. Позже, 19 мая, на AMD AI Developer Day в Шанхае, Лиза Су лично подписала EVO-X2 на стенде GMKtec. Для небольшого китайского производителя мини-ПК — довольно неожиданный публичный жест от генерального директора крупного чипмейкера.

Я прочитал несколько независимых обзоров, бенчмарки сообщества и прошёлся по маркетинговым материалам AMD. Устройство реально интересное. Но вокруг него уже нарасло несколько преувеличений, которые стоит разобрать отдельно..

Что там у нас по архитектуре

Ключ ко всему — чип AMD Ryzen AI Max+ 395, кодовое имя Strix Halo. Первый x86-процессор с унифицированной памятью до 128 ГБ, которую CPU и GPU делят совместно. Архитектурно похоже на Apple Silicon — только под Windows и Linux.

В EVO-X2 установлено 128 ГБ LPDDR5X-8000. Под Linux через настройку GTT-пула GPU получает доступ до 110 ГБ. Под Windows — около 96 ГБ. Разница ощутимая, если планируете гонять большие модели.

Остальные характеристики — 16 ядер Zen 5 / 32 потока, тактовая частота до 5,1 ГГц, GPU Radeon 8060S с 40 вычислительными блоками RDNA 3.5, NPU с заявленными 50 TOPS. Два слота M.2 2280 PCIe 4.0, до 16 ТБ суммарно. Блок питания 240W, потребление под нагрузкой — до 140W.

Тут сразу важная оговорка про NPU. Заявленные 50 TOPS звучат внушительно, но под задачи LLM-инференса NPU по состоянию на середину 2026 года не используется. Ни Ollama, ни llama.cpp, ни LM Studio не умеют на него переключаться для языковых моделей — они гоняют всё через GPU. NPU ускоряет другие задачи — видеоапскейлинг, классификацию изображений, фиксированные ИИ-функции Windows. Выбирать конфигурацию по цифре TOPS ради LLM не стоит.

Реальные скорости на реальных моделях

Производитель заявляет 11 токенов/с на Qwen3-235B для версии с 128 ГБ. Независимые замеры сообщества на Ubuntu 24.04 с Ollama это подтверждают так что, скорее всего — цифра честная.

Но 235B — это маркетинговое число. Qwen3-235B-A22B является моделью типа Mixture-of-Experts, т.е. суммарно параметров 235 миллиардов, но при каждом вычислении активируется только около 22 миллиардов. Чип двигает активные веса, а не всю модель целиком. Скорость 11 т/с — это скорость работы с ~22B активными параметрами, а не с 235B.

Другие зафиксированные скорости (Ollama, Ubuntu, замеры сообщества):

  • gpt-oss-20B — ~24 токена/с

  • gpt-oss-120B — ~15 токенов/с

  • Qwen3-32B — ~9-10 токенов/с

  • Gemma3-1B — ~158 токенов/с

Для работы в режиме чата 11-15 токенов/с субъективно воспринимаются нормально — текст появляется быстрее, чем вы читаете. Для агентного кодинга на больших кодовых базах, где модель генерирует сотни токенов подряд — заметно медленнее облачных топовых моделей.

Тепло и шум

Три режима работы — Quiet, Balanced, Performance. В Quiet температуры 75-81°C, шум около 35 дБ — терпимо. В Balanced температуры уходят до 94°C с пиками до 98°C. В Performance — те же пики плюс зафиксированные ревьюерами случаи термотроттлинга и зависаний под нагрузкой.

Под длительным LLM-инференсом устройство работает в Balanced или выше. Шум нарастает до ~46 дБ — это уровень тихого разговора, заметно в тихой комнате. Первое поколение Strix Halo в миниатюрном корпусе — это и есть компромисс. GMKtec регулярно выпускает обновления прошивки, ранние проблемы со сном/пробуждением и ROCm-совместимостью постепенно закрываются.

Сколько стоит в РФ

В России GMKtec EVO-X2 уже встречается у отдельных продавцов и на маркетплейсах, но чаще это поставки под заказ или ограниченные партии. Базовая конфигурация 64 ГБ / 1 ТБ стоит ориентировочно от 180000 рублей, версия 128 ГБ / 2 ТБ — от 290000 рублей.

Для сравнения: собственная платформа AMD на том же Ryzen AI Halo вышла в пресейл по цене от $3999, то есть примерно от 320000 рублей без учета доставки, комиссий и возможных доплат при ввозе.

На этом фоне EVO-X2 выглядит заметно выгоднее. Он дает тот же класс процессора и большой объем унифицированной памяти, но стоит ближе к цене компактного мини-ПК, а не рабочей станции. Если нужно запускать локальные модели уровня 35B-70B, работать под Linux и не хочется платить 400000 руб за Mac Studio M4 Ultra или собирать башню с несколькими GPU, EVO-X2 попадает ровно в эту нишу. По соотношению объема унифицированной памяти, производительности и цены среди x86-решений у него сейчас почти нет прямых аналогов. 

ссылка на оригинал статьи https://habr.com/ru/articles/1049786/