Как оценить LLM модель
—
от автора
—
от автора
ВведениеВ одном из прошлых блогов я представил концепцию тестирования крупных языковых моделей (LLM). Однако тестирование крупных языковых моделей (LLM) — достаточно сложная тема, которая требует дальнейшего изучения. Существует несколько соображений относительно тестирования моделей машинного обучения и, в частности, LLM, которые…
—
от автора
Привет, Хабр! Превращаем студенческие мечты в реальность и предлагаем оффер за решение лабы⬇️ЛАБА — технический чемпионат, на котором можно ассинхронно решить задание по одному из 5 треков и получить оффер после участия в очном демо-дне. Подробности и регистрация по ссылке.Треки этого…
—
от автора
Привет, Хабр! Меня зовут Настя Фальковская, я руководитель UX-редактуры в МТС. Я работаю с текстом и контентом много лет и знаю, как сложно бывает его оценить. Особенно в интерфейсе, где субъективные критерии типа «красиво написано» и «круто звучит» совершенно не…
—
от автора
О понятии Sentinel говорят мало, особенно в русскоязычном пространстве. Вместе с Юрием Вашинко, опытным тимлидом и спикером нашего курса «С++ разработчик» сегодня рассмотрим, что такое Sentinel и как его использовать: В каждом разработчике С++ (до 17 версии) прочно укоренилось понятие…
—
от автора
LinkedIn начала бесплатно верифицировать аккаунты. Галочки с проверкой данных в ноябре этого года получат 55 млн пользователей платформы, а ещё 100 млн клиентов соцсети проверят в 2025 году.Многие крупные социальные сети позволяют своим пользователям подтверждать, что их учётные записи контролируются…
—
от автора
В Австралии любят собак. У нас один из самых высоких показателей владения домашними животными в мире, а в каждой второй семье есть хотя бы одна собака.Но полезны ли они для нашего здоровья?Психическое здоровье — вторая по частоте причина завести собаку,…
—
от автора
Всем привет! Возвращаемся на Habr спустя 4 года в новом качестве и готовы делиться нашим опытом, полезными советами, лайфхаками, историями успеха и многим другим. Но сначала хотим познакомиться заново.Кто мы сейчас? Systeme Electric («Систэм Электрик») — российская компания с мировой…
—
от автора
Привет всем, кто заботится о данных и не собирается их терять. Сегодня мы рассмотрим тему бэкапа виртуальных машин (ВМ) на платформе виртуализации Basis.DynamiX (далее — DynamiX). Для этого будем использовать систему резервного копирования (СРК) RuBackup.В статье расскажу, как установить, настроить и использовать RuBackup…
—
от автора
Всем привет! Меня зовут Дмитрий Лёвочкин, я Flutter Team Lead в компании Friflex, а также автор блога «Дневник Flutter-разработчика».Разделим эту статью на четыре логические части:1. Кратко расскажу о своём пути до Junior и опишу своё видение, как бы я входил…
—
от автора
Байесовская статистика — это что-то вроде античного оракула в современном мире данных. Она не просто предсказывает будущее, она делает это с потрясающей уверенностью, опираясь на всё, что знает (или думает, что знает) о прошлом. Представьте себе модель машинного обучения, которая…