Специалисты из Центра искусственного интеллекта Т-банка открыли доступ к новой языковой модели в весовой категории 7-8 миллиардов параметров. Согласно внутренним и индустриальным бенчмаркам, модель обходит все существующие в своем классе аналоги.
Модель T-lite была представлена в рамках первой конференции Т-Банка по машинному обучению Turbo ML Conf. T-lite — это инструмент разработки, с помощью которого компании смогут создавать LLM-приложения для собственного использования без передачи данных третьим лицам. В частности, это могут быть ассистенты поддержки для обработки запросов, ответов на вопросы и т.д. Пример работы LLM для голосового заказа.
На тестах данная модель уже обогнала по показателям зарубежные llama3-8b-instruct
и chat-gpt 3.5
. При этом T-lite создана с использованием всего 3% вычислительных ресурсов, которые обычно требуются для такого типа моделей.
Сравнение на продуктовых бенчмарках T-lite
является частью Gen-T — семейства языковых моделей, разработанных «Т-Банком». Они специализированы под задачи бизнеса. Ссылка на модель на HuggingFace.
Следите за крутыми AI новинками в моем телеграм канале — Data Feeling.
ссылка на оригинал статьи https://habr.com/ru/articles/830204/
Добавить комментарий