Второе место на Data Fusion Contest 2024

от автора

В начале апреля завершилось ежегодное соревнование по машинному обучению с призовым фондом в 2 миллиона рублей — Data Fusion Contest 2024. Основных задач было две, и команда наших аналитиков-исследователей из Лаборатории ИИ заняли второе место в решении задачи по моделям оттока.

Какие задачи были на Data Fusion Contest 2024:

  1. По геоаналитике. Участникам предоставили синтетические транзакционные данные пользователей. Нужно было предсказать, в каких локациях пользователь будет снимать наличные. Список локаций, в которых возможно снятие, известен. В качестве метрики использовалась бинарная кроссэнтропия.

  2. По моделям оттока. Перед участниками стояла задача Time‑to‑Event на основе синтетических транзакционных данных пользователя — серий ежемесячных отчётных дат, на каждую из которых известна информация об активности пользователя (факту оттока), а также дата его последней транзакции перед выходом в отток. В рамках каждой отчётной даты предоставлялся отдельный непересекающийся набор пользователей с их историей транзакций за предшествующие полгода. Метрика — concordance index (CI).

При решении значительную часть препроцессинга данных и часть моделей взяли из open-source библиотеки pytorch-lifestream. В ансамбле использовали:

  • Две модели из открытых решений (nazarovo и kdimon15) и добавление к ним tf‑idf по mcc.

  • CoLES — одна из главных моделей ансамбля, используемая для получения представлений событийных данных в виде эмбеддингов. Эмбеддинги пользователя получены при помощи контрастивного обучения.

  • WTTE‑RNN — модель для получения риск‑эмбеддингов клиента в последний месяц.

  • WTTE‑CoLES (новый подход в работе с последовательностями) — эмбеддинги пользователя, полученные методом CoLES на равномерной по времени сетке. Также использовалась агрегация по выходу энкодера транзакций.

  • Supervised NN, предобученная методом CoLES.

  • Предсказание time по эмбеддингам и агрегатным фичам для дальнейшего предсказания target.

Поздравляем Артёма Сахно, Ивана Сергеева, Омара Золоева, Амурхана Дзагкоева и Данилу Степанова с «серебряной медалью»!


ссылка на оригинал статьи https://habr.com/ru/articles/837824/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *