Как спрогнозировать вероятность увольнения сотрудника и получить ещё миллион инсайтов из одного графика

от автора

Привет, меня зовут Евгений Кириёк, я — наставник на курсе по HR-аналитике в Яндекс Практикуме, автор книги «HR-аналитика. Путеводитель по анализу персонала» и канала «Аналитика в HR».

Что, если я скажу вам, что существует метод HR-анализа, который способен спрогнозировать вероятность увольнения сотрудника на испытательном сроке? Мало того, этот метод позволит вам оценить качество разных источников кандидатов, а ещё выявит проблемные места в процессе адаптации, оценит эффективность подбора и даст много других выводов о жизненном цикле сотрудника в компании. И для его использования вам необязательно иметь степень по математике или разбираться в анализе данных. Он доступен всем и каждому. Заинтригованы и хотите узнать больше? 

В таком случае я рад представить вам его величество График выживаемости.

График выживаемости, или график Каплана-Мейера (Kaplan-Meier plot), пришёл к нам из медицинских исследований и был разработан для оценки выживаемости пациентов в процессе лечения. Да-да, всё серьезно, врачи хотели понять, как то или иное лечение (или его отсутствие) влияет на выживаемость пациентов с течением времени. Позже этот метод стали применять в исследованиях как довольно универсальный инструмент по анализу конечных состояний процессов и вероятности их наступления. 

Ниже мы научимся строить график выживаемости на базе Excel и интерпретировать результаты наблюдений. Мы сознательно не будем использовать R, Python и более сложные стат. расчеты, для того чтобы сделать инструмент доступным для практиков без знаний в анализе данных.

Так для чего он мне нужен?

Этот метод применяется для очень разных задач, вот несколько из них:

  1. Оценка вероятности увольнения сотрудника с течением времени

  2. Оценка эффективности процесса адаптации в компании

  3. Оценка эффективности работы функции подбора

  4. Оценка качества источников подбора

  5. Расчёт средних показателей жизненного цикла сотрудника в компании и многое другое

Ладно, давайте рассказывайте

Начнём с простого. Предположим, вы хотите оценить качество работы функции подбора и адаптации. Для этого вы собрали информацию о наймах в компании за период в 3 месяца из одного источника кандидатов. При этом неважно, сколько сотрудник проработал фактически — все три месяца или один день. Получившийся массив данных представим в виде таблицы:

Пока ничего сложного: есть дата, когда сотрудник начал работать в компании, дата, когда покинул её, и количество недель, которые он отработал. Если сотрудник продолжает работать, у него не будет даты увольнения и количества отработанных недель. 

Теперь начнём расчёты. Для этого рядом построим ещё одну таблицу, которая будет иметь следующие поля:

сотрудник — это имя сотрудника, который уволился в период времени t;

время (t) — это порядковый номер недели, в которую произошло увольнение;

кол-во сотрудников (n) — это количество сотрудников, которые участвуют в нашем эксперименте в момент времени t;

кол-во уволившихся (d) — это количество уволившихся сотрудников в момент времени t;

доля сотрудников, переживших момент t (ft) — это расчётная величина. Её формула: (n-d)/n;

выживаемость, S(t) — это тоже расчётная величина. Её формула: f*S(t-1).

Начнём заполнять таблицу:

В первой строке время (t) будет равно 0 — эксперимент начался, а выживаемость равна 1 (или 100%).

В первую неделю (строка 3) у нас увольняется один сотрудник. Время (t) — это порядковый номер недели, он первый. Кол-во сотрудников в этот момент (то есть на первой неделе), за которыми мы наблюдаем, — 10 человек. Уволился из них на первой неделе — 1 человек. Доля сотрудников, переживших первую неделю работы: (10 – 1)/10 = 0,9 (или 90%). Выживаемость по формуле: 0,9*1,0 = 0,9 (или 90%).

Переходим к следующему уволившемуся (Сотрудник 10) на второй неделе и заполняем по аналогии всю таблицу, то есть по всем сотрудникам, которые уволились. Те, кто не уволился и доработал до конца эксперимента — трёх месяцев наблюдений, остаются как есть, с ними мы ничего не делаем. 

Фух. Вы всё ещё с нами? Отлично, самая сложная часть позади.

Теперь построим график. Выберем точечную диаграмму с прямыми отрезками. В качестве значения по оси X укажем время (t), в качестве значения по оси Y — выживаемость, S(t). А на выходе получим график выживаемости:  

Как читать этот график?

Ось Y — это доля сотрудников, которые продолжают работать в компании к моменту времени t. Ось X — это время (недели). С течением времени доля сотрудников, работающих в компании, уменьшается. К седьмой неделе график обрывается — это последнее увольнение, до конца эксперимента других увольнений не было. Все оставшиеся сотрудники продолжают работу.

Как его интерпретировать?

Даже в своём исходном виде этот график дает нам несколько интересных выводов:

  1. Половина новых сотрудников компании увольняется в течение первых 4 недель работы. Проблемы с адаптацией? Стоит разобраться и сформулировать гипотезу.

  2. Вероятность прохождения испытательного срока составляет всего 30%. Ещё один важный вывод. А это уже повод задуматься о качестве подбора. 

  3. Доля увольнений на пятой неделе работы резко возрастает и соответствует почти половине всех доживших к этому моменту сотрудников. Видимо, на пятой неделе происходит какое-то событие, которое резко снижает вероятность прохождения срока испытания. Какое и почему? Стоит проанализировать.

Все эти инсайты позволяют корректировать работу функции подбора и адаптации и дают возможность прогнозировать вероятность увольнения сотрудника из компании на любом этапе его работы (sic!).

Это всё?

Нет, это только начало. Ведь у наших сотрудников есть огромное количество характеристик, которые их определяют (пол, возраст, источник найма, должность и пр.) Так, например, если мы распределим всех исследуемых сотрудников по источникам найма, то сможем оценить качество каждого из источников: 

Теперь мы видим, что текучесть по источнику 2 в рассматриваемом периоде меньше, чем по источнику 1, а значит, источник 2 на этом отрезке времени более эффективен, чем источник 1.

Представьте, какое пространство для анализа нам это открывает. Мы можем анализировать разные категории сотрудников, сотрудников по полу и возрасту, по структурному подразделению, по результативности и прочее. А если пойти ещё дальше, то можем определять влияние тех или иных характеристик на «дожитие» сотрудников (впрочем, это уже потребует известной сноровки и владения более сложными методами анализа типа регрессии Кокса).

Наконец, если взять в качестве исследуемого периода не три месяца, а, например, три года, и посмотреть на выживаемость персонала за этот период, то вы откроете для себя массу интересных инсайтов о жизненном цикле сотрудника в компании.

Безусловно, у этого метода, как и любого другого, есть свои ограничения и особенности, которые необходимо учитывать в работе с ним. Это и особенности анализа больших массивов данных, и интерпретация данных в конце наблюдений, и специфика регрессионных моделей при анализе дожития. Но, даже не погружаясь в эти детали, график Каплана-Мейера — это крайне полезный и легкодоступный инструмент, способный существенно расширить ваши возможности по анализу персонала компании. Ещё больше инструментов и методов доступно на курсе по HR-аналитике.


ссылка на оригинал статьи https://habr.com/ru/articles/850730/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *