
Стартап Liquid AI выпустил LFM2.5-8B-A1B — компактную модель, которая работает как ИИ-агент целиком на смартфоне или ноутбуке, без обращения к облаку. Главный акцент релиза — не энциклопедические знания, а надежный вызов инструментов и выполнение сложных многошаговых задач. По заявлению разработчиков, на агентных сценариях модель тягается с нейросетями вчетверо крупнее, при этом помещается даже в телефон. Веса открыты и уже выложены на Hugging Face.
Секрет компактности — в архитектуре Mixture-of-Experts: из 8,3 млрд параметров на каждый токен активны лишь около 1,5 млрд. При этом модель поддерживает reasoning-режим рассуждений, что и позволяет ей справляться со сложными агентскими сценариями. По производительности обещано 253 токена в секунду на Apple M5 Max, 146 токенов на Ryzen AI Max+ 395 при потреблении менее 6 ГБ памяти, и около 30 токенов в секунду на топовом смартфоне.
Агентность здесь — основной смысл выпуска. Модель выстраивает цепочки вызовов инструментов и следует сложным инструкциям; на бенчмарке Tau²-Telecom она набирает 88,07 балла, обгоняя многие более крупные модели. Витрина возможностей — открытое демо LocalCowork: один ноутбук, 67 инструментов через 13 MCP-серверов, без облака, без API-ключей, данные не покидают машину. При этом в Liquid признают: для тяжелого программирования и вопросов, требующих обширных знаний без подключения к базам, модель — не лучший выбор.
Отдельно стоит сказать про языки, в том числе русский. В новой версии вдвое расширили словарь токенизатора — с 65 до 128 тысяч токенов, и текст теперь дробится на меньшее число фрагментов, что напрямую ускоряет работу и удешевляет обработку. Сильнее всего выиграли неевропейские письменности — хинди, тайский, вьетнамский, индонезийский и арабский; для русского эффективность токенизации выросла примерно на 6,4%. Запустить модель можно сразу в нескольких средах — с первого дня поддерживаются llama.cpp, MLX, vLLM и SGLang.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1041394/