Пик продаж как стресс-тест для ИТ-инфраструктуры или почему интернет-магазины не выдерживают сезонную нагрузку

от автора

По данным исследования, 69% интернет-магазинов в периоды высокого трафика сталкиваются со снижением скорости работы сайта, 38% — со сбоями отдельных функций, а четверть — с полной остановкой сайта. В сезон под ударом вся инфраструктура.

Меня зовут Эдуард, я руковожу отделом DevOps и отвечаю за сопровождение проектов по SLA 24/7 в компании KISLOROD. Сегодня расскажу о том, как пиковая нагрузка системы влияет на интернет-магазины и как готовить бизнес к дню икс.

Что происходит с eCommerce во время сезонного пика 

В обычные дни многие проблемы инфраструктуры просто не видны. Интернет-магазин работает стабильно, система справляется с нагрузкой.

Но в сезонность нагрузка распределяется неравномерно по всему проекту. Чаще всего проседают самые чувствительные участки: корзина, оплата, синхронизация остатков, CRM и внешние сервисы доставки.

Например, пользователь добавляет товар в корзину, но платежный шлюз отвечает медленнее обычного. Очередь запросов растет. Часть клиентов повторно нажимает кнопку оплаты или обновляет страницу. В системе появляются дубли заказов. CRM начинает обрабатывать события с задержкой, а склад — получать некорректные остатки.

Дальше проблема начинает расходиться по цепочке уже сама. Поддержка получает поток обращений, менеджеры вручную проверяют заказы, разработчики экстренно ищут источник сбоя, а маркетинг в этот момент продолжает вести платный трафик на сайт.

Для российского eCommerce такие ситуации особенно чувствительны из-за высокой стоимости привлечения клиента. Бизнес уже заплатил за пользователя через рекламу, SEO, маркетплейсы или партнерские каналы. Если покупатель не смог оформить заказ в момент высокой нагрузки, вместе с продажей теряются и деньги на привлечение.

Отдельная история — мусорный трафик и DDoS. В конкурентных нишах всплески подозрительной активности часто приходятся именно на периоды сезонных продаж. На фоне рекламных кампаний и общего роста трафика такие проблемы сложнее заметить сразу, если у команды нет отдельного мониторинга, алертов и внешней защиты.

Так сезонные пики демонстрируют реальное состояние инфраструктуры лучше любого внутреннего теста. Пока нагрузка умеренная, многие слабые места незаметны. Но в период высокой активности видно, где система действительно готова к росту, а где работает на пределе.

Что бизнес обычно недооценивает перед сезоном

Перед активными продажами бизнес обычно вкладывается в рекламу, скидки и акции. Инфраструктурой начинают заниматься уже после первых сбоев. Обычно ошибки повторяются из года в год:

Ошибка

Что происходит в пик

Последствия

Ориентируются на среднюю нагрузку

Система не выдерживает резкий рост трафика

Медленная работа сайта и ошибки

Проверяют только витрину

Проблемы появляются в оплате, CRM и интеграциях

Потеря заказов

Нет круглосуточного мониторинга

Инциденты замечают слишком поздно

Длительные простои

Не назначены ответственные

Команда тратит время на согласования

Медленная реакция

Нет сценария эскалации

Подрядчики и внутренние команды ищут виноватых

Рост времени восстановления

Не подготовлена DDoS-защита

Лишний трафик перегружает систему

Деградация сайта во время пика

Получается, что формально сайт доступен, но у пользователя медленно открывается корзина, зависает оплата, не обновляются остатки и т.д. Для eCommerce это риск потерять заказы в самый прибыльный период. Разберем, как с такой нагрузкой готовился работать цветочный интернет-магазин перед Международным женским днем с помощью внешней DDoS-защиты, мониторинга и поддержки 24/7.

Кейс: как интернет-магазин цветов готовился к 8 марта

Заказчик — интернет-магазин доставки цветов с выраженной сезонностью продаж. Самая высокая нагрузка на проект приходится на конец февраля и первую неделю марта. В эти дни количество заказов, обращений и одновременных пользователей вырастает в разы.

Для цветочного eCommerce это главный период года. Любая проблема с сайтом в такие даты — потерянные деньги и перегруженная поддержка.

Задача

Перед 8 марта команда готовилась к типичному для сезона сценарию. Ожидали рост трафика, высокую нагрузка на корзину и оплату, всплеск обращений и нестабильную работу интеграций под нагрузкой.

Самыми чувствительными точками были:

  • корзина и оформление заказа;

  • платежные сервисы;

  • CRM и обновление статусов;

  • внешние интеграции.

Команда также готовилась к всплескам нецелевого трафика и DDoS. Для конкурентного eCommerce в праздники это обычная ситуация: вместе с реальными покупателями на сайт приходит и лишняя нагрузка. Задача — пройти пик трафика без долгих простоев и ручного тушения пожаров ночью.

Решение

Подготовку начали заранее, до запуска основной рекламной активности:

1. Внешняя DDoS-защита. 

На период сезонных продаж подключили внешнюю DDoS-защиту для двух публичных витрин проекта.

Параллельно зафиксировали: 

  • кто отвечает за коммуникацию с провайдером;

  • кто согласовывает изменения политик фильтрации;

  • как команда действует при большом количестве срабатываний.

Это сократило время реакции в период высокой нагрузки. Команда могла быстрее менять настройки и разбирать подозрительную активность без долгих согласований.

2. Мониторинг и алерты. 

Для проекта настроили отдельную панель мониторинга и систему оповещений. Команда в реальном времени отслеживала:

  • нагрузку на инфраструктуру;

  • доступность сервисов;

  • состояние интеграций;

  • ошибки и деградацию производительности.

Отдельный фокус сделали на критичных пользовательских сценариях: корзине, оплате и оформлении заказа.

3. Поддержка 24/7. 

На время высокого сезона проект перевели на сопровождение по SLA 24/7. В сезон интернет-магазин продолжает получать заказы и ночью, поэтому заранее распределили зоны ответственности, закрепили порядок эскалации и сценарии реагирования на инциденты. Все обращения и изменения фиксировались внутри процесса поддержки.

Результат

Период высокой нагрузки проект прошел без крупных инцидентов и длительных простоев.

По данным отчета за этот интервал:

  • защита сработала 367 раз;

  • были заблокированы 284 уникальных IP;

  • среди заметных источников трафика: Россия — 34,5%, Нидерланды — 14,8%, США — 10,9%.

Во время пика трафика команда контролировала состояние инфраструктуры в режиме 24/7, а внешняя DDoS-защита помогала снижать влияние подозрительной активности на работу сайта и оформление заказов.

Пример из истории срабатываний

Пример из истории срабатываний

Такая подготовка снизила риск сбоев в период пикового трафика и сохранила стабильную работу сайта в самые загруженные дни сезона. 

Чек-лист подготовки к высокой нагрузке

Чтобы не разбирать проблемы уже в разгар пикового трафика, предлагаю чек-лист для бизнеса с основными рисками:

Зона

Что проверить

Инфраструктура

Выдерживает ли проект пиковую нагрузку системы, а не средние показатели за обычную неделю.

Хватает ли запаса по CPU, RAM, дискам и базе данных. 

Проводилось ли нагрузочное тестирование перед запуском рекламы и акций.

Как быстро команда может масштабировать ресурсы при росте трафика.

Мониторинг и оповещения

Настроены ли алерты по критичным метрикам. 

Получает ли команда уведомления круглосуточно. 

Есть ли единая панель мониторинга для сайта, базы данных и интеграций. 

Понятно ли, кто первым подключается к инциденту.

Корзина и оплата

Как система ведет себя при большом количестве одновременных заказов.

Возникают ли дубли заказов при повторной отправке формы.

Что происходит при медленном ответе платежного шлюза.

Проверялись ли сценарии с обрывом оплаты или повторным списанием.

Интеграции

Выдерживают ли нагрузку CRM, склад, доставка и внешние API.

Как быстро обновляются остатки и статусы заказов.

Есть ли резервный сценарий, если один из сервисов начинает отвечать с задержкой.

DDoS-защита и безопасность

Подключена ли внешняя защита на период сезонности продаж.

Кто взаимодействует с провайдером DDoS-защиты.

Согласован ли порядок изменения политик фильтрации.

Понимает ли команда, как отличить рост реальных покупателей от мусорного трафика.

Поддержка и процессы

Есть ли SLA и понятный порядок эскалации; закреплены ли ответственные со стороны бизнеса и подрядчиков.

Ведется ли дежурство в период пикового трафика.

Понимают ли сотрудники поддержки, что делать при сбоях.

Вывод

По опыту наших DevOps-инженеров, подготовку к сезонному пику лучше начинать минимум за месяц. За это время команда успевает провести нагрузочное тестирование, проверить интеграции, настроить мониторинг, договориться о дежурствах и заранее определить порядок действий при инцидентах.

Отдельное внимание стоит уделить всем сервисам, а не только сайту: CRM, оплате, складу, доставке и внешним сервисам. В период высокой нагрузки проблемы чаще появляются именно на стыке систем.

Еще один важный момент — заранее договориться о процессах внутри команды. Кто реагирует первым, кто связывается с подрядчиками, кто принимает решения по инфраструктуре и эскалации. Во время пикового трафика заранее выстроенные процессы работают эффективнее, чем попытки срочно расширять инфраструктуру уже после первых проблем.

ссылка на оригинал статьи https://habr.com/ru/articles/1045798/