Инструкция по выживанию для штатного системного администратора 2

Наводим порядок в ИТ-инфраструктуре

Предыдущая инструкция по выживанию системного администратора относилась преимущественно к взаимодействию системного администратора и руководства компании, но, как верно заметили читатели, уровень стресса у системного администратора зависит еще и от уровня хаоса в ИТ-инфраструктуре. При этом, хаос в ИТ-инфраструктуре, как правило, является историческим наследием компании, который создали предыдущие сисадмины-временщики сторонники определенных (иногда экстремистских) технологий. Системный администратор, приходя в компанию с такой ИТ-инфраструктурой, ставится перед тяжелым выбором: либо менять работу (и тем самым снижать свою привлекательность в глазах работодателей), либо собрать всю волю в кулак и пытаться привести ИТ-инфраструктуру в «нормальное» состояние.

Шесть лет назад, когда я открывал свою ИТ-аутсорсинговую компанию, выбирать клиентов не приходилось, и путь у нас был только вперед. Но именно сложные клиенты на старте позволили нам выработать единый подход, позволяющий привести ИТ-инфраструктуру любой компании из состояния «как есть», в состояние «как надо» и даже сейчас не бояться браться за тяжелые проекты. Но прежде чем говорить об этом подходе, начнем с одного, но достаточно важного термина:

Что такое «нормально функционирующая ИТ-инфраструктура»?

Каждый вкладывает в это определение свой смысл: для кого-то это сисадмин, который не бегает как угорелый, для кого-то – это фирменное оборудование и красиво разложенные провода, но мы для себя считаем, что нормально функционирующая ИТ-инфраструктура – это ИТ-инфраструктура, решающая задачи бизнеса и полностью соответствующая его требованиям. Т.е. нормально – это не когда у вас новое брендовое оборудование и красиво сделанный монтаж, а когда ИТ-инфраструктура не является, и, что не менее важно, не будет являться в перспективе хотя бы года ограничивающим фактором в работе компании. Так, если у вас ИТ-инфраструктура состоит из постоянных даунтаймов, но при этом неделя без Интернета (сервера/компьютера) никак не влияет на работу компании – у вас нормальная ИТ-инфраструктура. А в случае, если у вас современная ИТ-инфраструктура в которой все работает, но на складе компании (на котором одновременно грузится 50 фур), стоит один единственный принтер – у вас не нормальная ИТ-инфраструктура, т.к. когда (не если, а именно «когда») этот принтер сломается, бизнес в компании встанет до момента его замены.

Соответственно, «норма» в работе ИТ-инфраструктуры определяется для каждой компании индивидуально, и прежде чем приводить ИТ-инфраструктуру в «нормальное состояние» необходимо эту самую норму определить, а для этого:

Проводите опрос пользователей ИТ-инфраструктуры и выясняйте их потребности

Их субъективная оценка как нельзя точно даст объективную информацию о качестве работы ИТ-инфраструктуры применительно к бизнесу компании. Опрос пользователей надо проводить на предмет как их общей удовлетворенности, так и на предмет обозначения конкретных проблем в работе ИТ-систем: рабочий компьютер, почта, телефон, система управления предприятием и т.д. При составлении опросного листа обязательно предложите выбор из типовых проблем, которые могут возникать в работе той или иной системы (зависает, долго загружается, почта иногда не доходит и т.д.) – так людям будет проще заполнять его, но при этом обязательно оставьте поле для фантазии – там часто бывает важная информация.

Да, я знаю, что вы и так уже наслышаны от пользователей «о всех проблемах» и сами «все прекрасно знаете», но во-первых, люди сообщают вам только о самых важных проблемах в работе ИТ, оставляя все неважные на потом, а во-вторых, документальное массовое подтверждение реальной ситуации в ИТ вам поможем в дальнейшем при общении с руководством. Но об общении с руководством позже, а пока собираем заполненные опросные листы, обрабатываем данные, понимаем для себя, что пользователям не хватает для «нормального функционирования ИТ» и:

Документируйте всю ИТ-инфраструктуру

Что именно документировать, спросите вы? Ответ – все. Начните с инвентаризации всего железа и ПО в компании: что стоит на рабочих местах, что есть на складах, какое ПО используется, какие версии ПО, как это все настроено? Опишите структуру информационных сервисов: какие сервера, как настроены, как работают. Проведите анализ обоснованности операционных расходов: каналы Интернет, картриджи, сервисные контракты. После этого переходите к основному:

Выявляйте проблемы в работе ИТ-инфраструктуры

Инцидент – это отклонение от «нормального функционирования», проблема – ключевая причина повторяющихся инцидентов. Медленно работающая база данных – инцидент, нехватка процессора для «нормальной» работы баз данных – проблема. Поломка принтера – инцидент, принтер, на котором в «нормальном режиме» печатают документов больше, чем он тянет – проблема. Компьютер заразился вирусом – инцидент, отсутствие антивирусного ПО на рабочих местах – проблема. Пользователь сломал Windows на компьютере – инцидент, наличие прав у пользователя больших, чем достаточно для выполнения рабочих обязанностей – проблема. Компьютер сломался – инцидент, компьютеры, которые работают в компании более 5 лет — проблема и т.д.

Какие-то проблемы вы можете решить самостоятельно, для решения других необходимы инвестиции в оборудование и ПО, а для устранения третьих необходимо принятие управленческих решений. Не надо бросаться за решение первой же выявленной проблемы, для начала вы должны сделать основное – постараться собрать информацию о всех проблемных местах в работе ИТ. В этом вам поможет как проведенный ранее опрос пользователей, так и ваша экспертная оценка состояния ИТ по результатам анализа вашей же документации. После того, как вы выявили все проблемы в ИТ, которые являются причинами постоянных жалоб пользователей, а также выявили проблемы, которые могут повлечь повторяющиеся инциденты в дальнейшем, не забудьте сделать еще один важный шаг:

Проведите анализ эксплуатационных рисков еще раз

В отличие от выявления проблем в ИТ-инфраструктуре, позволяющих уменьшить количество инцидентов, анализ эксплуатационных рисков – это возможность заранее спланировать действия на случай их возникновения и уменьшить негативные последствия. Максимально допустимое время простоя ИТ – это также один из параметром «нормального функционирования ИТ-инфраструктуры», но его уже согласовывают не с пользователями, а непосредственно с руководством. О том, как проводить анализ эксплуатационных рисков я много писал в прошлой статье – не будем сейчас останавливаться на этом, а сразу перейдем к следующему этапу:

Выбирайте технологии и стратегическое направление развития ИТ

Традиционно в компаниях, в которых до вашего прихода не было понятия «системное администрирование» (сисадмины были — системных администраторов не было), наблюдается зоопарк из технологий: какие-то из них уже отжили свой срок и им давно пора на покой, а в какие-то, по понятным только предыдущему сисадмину причинам, компания вложилась (и серьезно вложилась) только-только перед вашим приходом. Отсутствие долгие годы единой стратегии развития ИТ создает бардак в построении ИТ-инфраструктуры неимоверного масштаба. В сложившейся ситуации вам необходимо выбрать технологии и разработать единую стратегию развития ИТ-инфраструктуры, которых компания будет придерживаться в ближайшие несколько лет. Также важно разработать план модернизации, учитывая сроки полезного использования существующих решений, которые вы так или иначе унаследовали и от которых не можете пока отказаться. Составляя план модернизации, не забудьте про один важный момент:

Соотносите ИТ-стратегию с планами развития компании

Возможно, руководство планирует через полгода сменить офис, или открыть региональные представительства. Возможно, они вообще планируют закрыть то направление, база данных в котором съела сейчас все ресурсы сервера. Что бы не думало руководство компании, ИТ подразделение всегда должно опережать любые изменения бизнеса и ваша стратегия развития ИТ должна это отражать.

После того, как вы поняли (и задокументировали) существующую ИТ-инфраструктуру, список требований к ней, существующие проблемы и эксплуатационные риски, а также выбрали долгосрочное направление развития (и план действий), приступайте к формированию основного документа:

Составляйте годовой бюджет на ИТ

После перечисленных действий вы четко знаете, что необходимо сделать/поменять для «нормального» функционирования ИТ-инфраструктуры, какие сейчас есть проблемы и какие действия/решения/закупки необходимы для их устранения, у вас есть четкое понимание в какую сторону целесообразно развивать ИТ и план действий. Все это вам позволяет с легкостью посчитать количество средств, которые необходимы для приведения ИТ-инфраструктуры в «нормальное» состояние. Самое главное, что это количество средств будет необходимым и достаточным объемом инвестиций в ИТ на ближайший год и избавит руководство от вечных «ситуационных» закупок и финансовых неожиданностей.

В принципе, после проведения обозначенных выше действий сформировать бюджет на ИТ не составляет особых проблем, основная сложность – это сделать так, чтобы результаты ваших изысканий смогло изучить и понять руководство. Но даже если с оформлением и донесением мысли посредством бумаги у вас не все всегда хорошо, есть еще один (и не менее важный) этап в процессе приведения ИТ-инфраструктуры в «нормальное» состояние:

Обосновывайте бюджет на ИТ перед руководством

Компьютерные технологии (в отличие от бухучета) не являются чисто статьей расходов – это статья инвестиций. Компании инвестируют в технологии, чтобы работать проще, быстрее, удобнее. Нормально функционирующая ИТ-инфраструктура (в нашем понимании) нужна не системному администратору, а бизнесу. Приходя к руководству с сформированным годовым ИТ-бюджетом, вы не предлагаете им «потратить еще денег на ИТ», а предлагаете им инвестировать в:

Скорость работы их сотрудников,
Удобство работы сотрудников,
Дополнительные инструменты информационного обмена,
Технологическую непрерывность бизнес-процессов,
Снижение операционных расходов.

Соответственно, ваша аргументация по каждому пункту выглядит примерно так: «Если вы вложите в покупку оборудования годовую зарплату одного сотрудника, то остальные 30 будут работать с ИТ-системами в 3-4 раза быстрее», «а также, если мы приобретем дополнительный сервер, в случае аварии восстановление систем займет не несколько дней, а 3-4 часа», «приобретение мощных принтеров окупится в течение года за счет экономии на расходных материалах и при этом можно будет использовать оригинальные расходные материалы».

После того, как руководство признало, что сформированный вами бюджет на ИТ является обоснованным, остается всего лишь один формальный момент:

Согласовывайте график выделения средств и план действий

Как правило, если вы только-только прививаете традицию бюджетирования в ИТ, в первый год в полном объеме денег вам не выделяют сразу (зато в последующие годы этот бюджет будут уже с нетерпением ждать – всем интересно, что еще можно улучшить в ИТ, чтобы компания работала эффективнее). По этой причине, согласовывайте планы выделения средств и ваши планы действий исходя из реальных возможностей вашей компании. Ограничивая размер выделяемых средств, не забывайте также утверждать с руководством список проблем, которые пока не удастся решить по причине их нехватки (опять же письменно). Ну и после этого:

Действуйте!

Нельзя сказать, что вы пинали балду до этого времени, но сейчас, когда у вас есть понятный план выделения средств, вы можете, не дожидаясь первых закупок, подготавливать ИТ-инфраструктуру, ее часть или даже просто пользователей (к примеру, проводя обучение) к планируемым изменениям.

В реальности же, учитывая урывочное выделение средств, года на наведение порядка в ИТ-инфраструктуре, хаос в которой до вас на протяжении 5 лет разводила куча предыдущих сисадминов, может и не хватит. По этой причине, чем раньше вы начнете действовать, тем раньше закончите и тем меньше ваша ИТ-инфраструктура будет находиться в «ненормальном» состоянии, при котором все от вас что-то постоянно хотят и не дают спокойно заниматься своей системной работой по администрированию ИТ-систем. В любом случае вне зависимости от того, успеете вы за год провести все запланированные изменения или нет:

Через год повторяйте данный цикл снова

Да, как и в прошлой статье все завязано на постоянном повторении жизненного цикла обслуживания ИТ-инфраструктуры. Для меня это циклы непрерывного совершенствования (погуглите эту фразу), проходя с каждым годом через которые я испытываю гордость за свою работу, видя как ИТ-инфраструктуры наших клиентов с каждый годом становятся все надежнее и надежнее, избавляя их от ненужных простоев в работе, а нас от суеты и бесконечных звонков.

Успехов!

ссылка на оригинал статьи http://habrahabr.ru/post/193186/