Клиент — производственная компания с 5 филиалами и несколькими складскими комплексами в разных регионах России.
В инфраструктуре использовались:
— 1С ERP,
— SQL Server,
— терминальные серверы,
— файловый обмен между подразделениями,
— интеграции с производственными и складскими системами.
Общий объем базы 1С превышал 2.7 ТБ.
Одновременно в системе работали более 180 пользователей:
— бухгалтерия,
— склад,
— производство,
— закупки,
— финансовый отдел,
— логистика.
Работа 1С была критична для ежедневных операций компании:простои напрямую влияли на производство, отгрузки и проведение складских операций.

Инфраструктура постепенно перестала справляться с ростом нагрузки.
Основные симптомы:
— проведение документов занимало до 4–6 минут,
— пользователи регулярно сталкивались с зависаниями терминальных сессий,
— в часы пик фиксировались массовые блокировки SQL,
— backup-процедуры выполнялись нестабильно,
— увеличилось количество аварийных перезапусков сервисов,
— фоновые задания 1С создавали дополнительную нагрузку на рабочий контур.
Среднее время недоступности критичных сервисов достигало 8–10 часов в месяц.
Дополнительно возникли серьезные риски:
— остановки работы склада,
— срыва отгрузок,
— потери данных,
— длительного восстановления после сбоев оборудования.
Ситуация осложнялась тем, что часть серверов работала на устаревшем оборудовании без полноценного резервирования и отказоустойчивости.
Что показал аудит
После диагностики инфраструктуры команда выявила несколько критичных проблем.
Основные из них:
— SQL Server испытывал постоянный дефицит ресурсов,
— дисковая подсистема не справлялась с нагрузкой базы объемом более 2.7 ТБ,
— backup выполнялся в часы пиковой активности,
— отсутствовала полноценная схема резервирования,
— серверы 1С выполняли одновременно несколько ролей, создавая конкуренцию за ресурсы,
— фоновые задания 1С влияли на производительность пользовательских операций,
— отсутствовал централизованный мониторинг и оперативное оповещение о деградации сервисов.
Дополнительно аудит показал высокий риск полной остановки работы при отказе одного из ключевых серверов.
Как проходила миграция
Основная задача проекта заключалась в переносе инфраструктуры без остановки бизнес-процессов компании.
Проект длился 6 недель. За это время команда:
— развернула новую серверную площадку,
— подготовила кластер виртуализации,
— мигрировала 14 серверов,
— перенесла SQL-инфраструктуру,
— настроила резервное копирование,
— внедрила систему мониторинга,
— протестировала отказоустойчивость критичных сервисов.
Архитектура серверов 1С была переработана и разделена по ролям:
— отдельные серверы приложений 1С,
— отдельный сервер публикации 1С,
— отдельный сервер лицензирования 1С.
Серверы приложений были объединены в кластер, что позволило:
— распределять нагрузку между узлами,
— повысить отказоустойчивость,
— масштабировать систему без полной перестройки инфраструктуры.
Дополнительно был поднят отдельный контур 1С для выполнения фоновых заданий, благодаря чему регламентные процессы перестали влиять на скорость работы пользователей.
Для контроля инфраструктуры была внедрена система мониторинга на базе Zabbix:
— контроль загрузки серверов,
— мониторинг SQL,
— отслеживание доступности сервисов,
— контроль резервного копирования,
— мониторинг производительности 1С.
Критичные оповещения автоматически отправлялись в Яндекс Мессенджер, что позволило оперативно реагировать на инциденты.
Для глубокого анализа производительности был настроен технологический журнал 1С:
— контроль длительных операций,
— поиск блокирующих процессов,
— анализ проблемных запросов.
Данные журналов визуализировались через Grafana, что позволило команде быстрее выявлять узкие места и анализировать деградацию производительности.
Отдельно была переработана система резервного копирования.
Команда внедрила многоуровневую схему backup с использованием S3-хранилища:
— резервные копии автоматически сохранялись в несколько независимых хранилищ,
— была настроена глубина хранения до 3 месяцев,
— появилась возможность восстановить данные практически на любую дату за предыдущий период.
Чтобы минимизировать риски:
— миграцию проводили поэтапно,
— критичные переключения выполнялись ночью и в выходные,
— часть сервисов переносилась параллельно,
— перед финальным переключением проводилось нагрузочное тестирование.
Во время проекта удалось избежать полной остановки работы пользователей.
Максимальный downtime при финальном переключении составил менее 45 минут.

Результат
После миграции клиент получил:
— стабильную работу 1С без критичных зависаний,
— ускорение проведения документов в среднем на 52%,
— сокращение нагрузки на SQL Server более чем на 40%,
— стабильное выполнение backup,
— резервирование ключевых сервисов,
— возможность дальнейшего масштабирования инфраструктуры.
Дополнительно:
— количество обращений пользователей снизилось более чем в 2 раза,
— исчезли регулярные аварийные перезапуски,
— время недоступности сервисов сократилось с 8–10 часов до менее 1 часа в месяц,
— инфраструктура стала выдерживать пиковую нагрузку без деградации производительности,
— появилась прозрачная система мониторинга и анализа производительности 1С.
После завершения проекта клиент смог продолжить масштабирование ERP-системы без критичных ограничений со стороны инфраструктуры.
Что важно в подобных проектах
Проблемы инфраструктуры редко возникают резко.
Обычно система постепенно деградирует:
— растет база,
— увеличивается количество пользователей,
— появляются новые интеграции,
— нагрузка начинает превышать возможности серверов.
Если вовремя не проводить аудит и модернизацию инфраструктуры, это приводит к:
— нестабильной работе 1С,
— потерям времени сотрудников,
— рискам остановки критичных бизнес-процессов,
— росту финансовых потерь из-за downtime.

Поэтому миграцию и масштабирование серверной инфраструктуры лучше выполнять до появления серьезных инцидентов.
Для диагностирования и аудита вашей инфраструктуры пишите нам.
-
Телефон +7 (499) 444-54-91
-
E-mail info@programs93.ru
ссылка на оригинал статьи https://habr.com/ru/articles/1045662/