К настоящему моменту накопилось досточно данных для выполнения заявленного анализа. Будут использованы данные за октябрь, ноябрь и декабрь 2021 года, поскольку эти месяцы как содержат российский эпид. сезон, так и являются однородными с точки зрения штамма вируса: в обеих странах в этот период был распространен Дельта- вариант. Данные для анализа взяты из официальных источников России и США.
Смертность и вакцинный статус
Во времена Дельта- штамма основной причиной избыточной смертности называли непривитое население: дескать, именно они заболевают Covid-19 и впоследствии умирают. Определим избыточную смертность как отношение умерших за месяц 2021 года к одноименному месяцу 2020 года. В таком случае если построить график избыточной смертности от доли непривитого населения, то мы должны получить растущую прямую, выходящую из точки (0, 0) и достигающую значения (1, 1).
Действительно, если все население привито, то избыточная смертность должна находиться в районе 0 (поскольку в таком случае практически никто не умирает), а при полностью непривитом населении смертность должна повторить значение предыдущего года. В этом разделе публикации мы построим эти графики для обеих стран и сравним с ранее выдвинутым теоретическим утверждением.
Может показаться, что задача очень проста: необходимо усредняя по стране для каждого месяца определить среднюю избыточную смертность (координата х) + долю невакцинированного населения (координата y) и нанести эти точки на график. Но в этом случае у нас будет неявная зависимость от времени, поскольку разные точки одного графика будут относиться к разным месяцам. А в разные месяцы большое количество факторов (погода, питание, спортивная активность, достаток, традиции, принятые ограничительные меры….) могут иметь разное значение, поэтому мы получим зависимость избыточной смертности от вакцинации и большого количества факторов, косвенно участвующих в виде времени.
Отдельно выделю фактор стадии эпид. процесса, который задает различное положение максимумов смертности в разных годах. Это приводит к тому, что есть как месяцы с завышенной избыточной смертностью (где был максимум в 2021 году), так и с заниженной (где был максимум в 2020 году). Например, для г.Москва максимальные значения заболеваемости отличаются от фоновых примерно в 3 раза, поэтому избыточная смертность будут колебаться в 9 раз! На фоне подобных «качелей» избыточной смертности оценки эффективности вакцинации будут содержать большие ошибки.
Казалось бы из- за действия сильных зашумляющих факторов задача превращается в нерешаемую. Но для подавления шумов мы задействуем тот же прием, который используется при анализе сильно зашумленного космического излучения.
Представьте, что у вас есть небольшой полезный сигнал в виде периодического маленького «тычка», на фоне 100- кратно превышающего его белого шума. Выдилеть полезный сигнал из этой совокупности практически нереально. Но если мы 100 раз сложим этот зашумленный сигнал сам с собой, то полезная составляющая усилится в 100 раз (поскольку «тычок» имеет постоянное значение), а шум ослабнет (поскольку он случаен, т.е. разнонаправлен и будет сам себя подавлять). Так можно получить полезный сигнал из сильно зашумленных данных.
Поэтому мы нанесем каждый регион на график отдельной точкой и несмотря на то, что на регионы действует большое количество факторов, мы в силу их рассогласованности при усреднении получим сильно ослабленное шумовое воздействие. Поэтому точки, представляющие отдельные регионы, не имеют самостоятельного смысла, а результатом анализа можно считать только наклон асимптотической прямой (отражающей усредненное значение).
Россия
В нашей стране есть два независимых источника данных по смертности от Covid- 19: сайт стопкоронавирус и официальные отчеты Росстата. Первый дает сильно заниженные данные как по заболеваемости, так и по умершим, поэтому летальность в различных регионах из- за подобных корректировок отличается в разы. Я считаю данные сайта стопкоронавирус ненадежными и буду использовать помесячные данные Росстата. При анализе я не учитывал регионы со смертность в 2020 году ниже 1000 человек / месяц, поскольку в этом случае случайные отклонения могут ощутимо исказить статистику.
Для получения данных по вакцинации использовался сайт gogov.ru, который детализирует данные по регионам и датам. На этом сайте представлено два числовых показателя: вакцинированно и полностью вакцинированно. При построении отчетов я приводил оба значения, но рекомендую опираться на первые, поскольку их больше и как следствие статистика получается более точная.
При соединении наборов данных получены графики, каждая точка на которых представляет отдельный регион. Данные по вакцинации брались за 5 дней до начала соотвествующего месяца. Это учитывало как временной лаг для протекания болезни (-10 дней), так и отставание опубликованных данных от реального положения в регионе (+5 дней).
Голубая область задает границы 95% уверенности нахождения апроксимирующей прямой. Уравнения приведены для искомой апроксимации.
По графикам видно, что для России ранее выдвинутое теоретическое утверждение (о том, что от Covid- 19 умирает в основном непривитое население) не соответствует действительности: в октябре и ноябре в популяции наличиствует обратная зависимость (чем больше в регионе непривитого населения, тем в нем ниже избыточная смертность), а декабрь показывает недостаточно сильную зависимость (мы ожидаем коэффициент наклона близкий к значению 1).
США
Данные по вакцинации взяты с сайта Центра по контролю и профилактике заболеваний США (его роль заключается в предоставлении информации для улучшения решений в области здравоохранения). На том же сайте в другом наборе данных представлена информация о смертности от всех причин.
Дополнительным бонусом данных из США оказалось разделение населения по возрастным группам как среди вакцинированных, так и среди умерших, что позволяет более детально проаналазировать воздействие вакцинации. Позже анализируя эту разницу мы получим интересные выводы.
Графики, построенные по тем же правилам, что и для России.
По США ранее выдвинутое теоретическое утвеждение также не подтвержается: асимптотическая прямая имеет обратную зависимость (т.е. чем больше в регионе непривитого населения, тем в нем ниже избыточная смертность).
Эффективность вакцинации
А теперь наконец перейдем к основной теме публикации. Мы уже косвенно оценили, что эффективность вакцинации далека от 1, поскольку для обеих стран не выполнилась исходная теория. Но все же хочется иметь какие- то более точные оценки.
Первый способ
Одну из оценок можно сделать на основании того, что рассматриваемые месяцы идут непрерывно. В этом случае если и произойдет сдвижка максимума смертности одного года относительно другого, то это в себе учтет следующий месяц. Т.е. эффективность вакцинации можно оценить как максимум разницы между 1 и средней избыточной смертности. Обращаясь к графикам США для тотально вакцинированной группы 65+, мы видим, что минимальное отклонение центра красной линии от 1 равно 0.2. Это и есть первая оценка эффективности вакцинации.
Второй способ
Ранее я говорил о большом количестве факторов, действующих в регионе. Но для отдельно взятого месяца это влияние должно быть одинаковым на обе возрастные группы (65+ и 65-). Таким образом, анализируя отличия избыточной смертности и долей для центра краной линии, можно заключить, что эффективность вакцинации в ноябре составляла примерно 0.3, а в декабре примерно 0.45. Отличия по двум месяцам скорее всего объясняются значительно долей популяции 65+, поставивших в декабре бустерную дозу вакцины (у которой пока еще сильное воздействие на организм).
Так как по США мы имеем более правдоподобные данные заболеваемости, то можно учесть то, что за промежуточный год по официальным данным переболело ~10% населения (на практике я думаю это значение примерно в 2-3 раза выше), часть из которого не пережило заболевание. Так популяция США «приспособилась» к новому вирусу и потому в 2021 году должна иметь на 10% меньшую смертность, чем в 2020.
Вывод: эффективность вакцинации от Дельта- штамма в России и США лежит в интервале от 15% до 30%.
p.s. Проект на Github.
ссылка на оригинал статьи https://habr.com/ru/post/648875/
Добавить комментарий