МТС выпустит нейросетевую модель с открытым кодом и возможностью донастройки под бизнес-задачи

от автора

MTS AI (дочерняя компания МТС в области искусственного интеллекта, ИИ) выпустит большую языковую B2B‑модель Cotype Nano, предназначенную для запуска непосредственно на персональных компьютерах и телефонах, рассказали «Ъ» в компании. Модель будет открытой: её веса (параметры, которые используются ей для принятия решений) можно изучать и настраивать под конкретные задачи. «Яндекс» и «Сбер», разрабатывающие свои языковые модели YandexGPT и GigaChat, не публиковали их кодов.

В Cotype Nano от MTS AI использованы наработки другой свободной модели, Qwen 2.5 китайской Alibaba Cloud, а сама модель обучена на наборах данных, включающих программный код, математику и синтетические данные. С её помощью можно генерировать тексты и переводы, а также разрабатывать собственные чат‑боты.

Крупные российские компании, разрабатывающие свои большие языковые модели для бизнеса, до сих пор выпускали на рынок лишь проприетарные продукты — то есть с закрытым кодом без возможности создавать производные проекты.

Обычно такие модели работают в облачной инфраструктуре компании‑разработчика, а доступ к ним предоставляется с помощью программного интерфейса (API), то есть посредством запросов к серверу.

При этом компании публикуют как свободное ПО другие инструменты, предназначенные для работы с нейросетями: например, «Яндекс» — библиотеку YaFSDP для ускорения их обучения. В ноябре источники Forbes сообщили о намерении VK опубликовать ИИ‑модели, в частности, для синтеза речи. «Мы также думаем над возможностью выложить открытый код нашей большой языковой модели YandexGPT», — сказали «Ъ» в «Яндексе». В «Сбере» отметили, что предоставляют открытый доступ к моделям линеек Kandinsky (используются для генерации изображений) и GigaAM (для обработки речи). В VK отказались от комментариев.

«„Сбер“ и „Яндекс“ разрабатывают свои модели, потому что в стране есть спрос и рынок на российские LLM из‑за импортозамещения и санкционных ограничений», — говорит директор по продуктам Just AI Глеб Обломский. Но пока им далеко не всегда получается «дотянуться по качеству» до зарубежных моделей: сказывается ограниченность ресурсов, отмечает он.


ссылка на оригинал статьи https://habr.com/ru/articles/861478/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *