Представьте, что вам приходится всюду носить с собой центр обработки данных. Даниэль Мартлэнд так и делает, это его работа. Он — ИТ-инженер гоночной команды Формулы 1 Scuderia Toro Rosso и вместе с ней ежегодно посещает более 20 стран мира. По его словам, это непросто, но после каждой гонки он испытывает потрясающее чувство удовлетворения от ощущения хорошо проделанной работы.
Мы встретились на международном автодроме Сепанг во время проведения Гран-При Формулы 1 в Малайзии. Мы сидели у боксов Scuderia Toro Rosso, в невероятной жаре и высокой влажности, и Даниэль рассказывал, каким образом ведется обработка огромного объема данных в самом технологичном виде спорта на земле и что требуется для обеспечения работы такой системы…
Даниэль Мартлэнд, ИТ-инженер гоночной команды Формулы 1 Scuderia Toro Rosso, рассказывает, что нужно для обеспечения работы ИТ-систем гоночной инфраструктуры.
Даниэль, спасибо, что выкроили время. Мимо нас пролетают болиды Формулы 1 и вы, очевидно, совершенно уверены, что сеть Scuderia Toro Rosso в полном порядке. Можете немного рассказать о том, как создается ИТ-инфраструктура Формулы 1?
Работы очень много. Основная гонка Формулы 1 проходит в воскресенье, но мы находимся здесь уже целую неделю. После того, как мы прибываем на автодром, нам требуется два дня для обустройства всей команды: офисы, ограждение, отделяющее пит-лейн от гоночной трассы, гараж — и все это нужно связать между собой локальной сетью. Как и остальные команды, мы привозим с собой свой автономный портативный центр обработки данных для создания сети. Его нужно распаковать, подключить и протестировать. С того момента, когда его последний раз включали, могла пройти неделя, так что мы должны убедиться, что все работает идеально — так, как нам требуется. Портативный центр обработки данных всегда остается в транспортном отделении, чтобы можно было легко погрузить его в самолет и доставить туда, куда мы собираемся. Здесь все серверное оборудование, которое может потребоваться во время гоночного уик-энда.
Даниэль Мартлэнд в транспортном отделении.
А что случится, если портативный центр обработки данных не попадет на гонку?
Такого никогда раньше не случалось, но, если центр не попадет на трек, у нас в резерве на базе в Фаэнце есть кое-какое дополнительное оборудование. Теоретически, его можно доставить туда, куда нужно.
И после каждой гонки вы отправляете портативный центр обработки данных обратно в Фаэнцу?
Да. Если гонки проходят не одна за другой, и у нас есть перерыв, мы отправляем оборудование в Фаэнцу на техобслуживание. Соответственно, вне сезона, центр обработки данных находится там же — для технического обслуживания и модернизации оборудования.
Случались ли у вас какие-то неполадки с центром обработки данных, и если да, то как вы с ними справлялись?
Было несколько случаев, но небольших, ничего особенного. Обычно это связано с работой источников бесперебойного питания или сокращенно ИБП. Они доставляют нам немало неприятностей, потому что плохо переносят жару и влажность, а в Малайзии, где мы сейчас находимся, в точности такие условия. Другая проблема, уникальная именно для Формулы 1 — это карбоновая пыль. По какой-то причине она плохо влияет на электронное оборудование. Жара, влажность и карбоновая пыль — это плохое сочетание условий для серверного оборудования.
Серверные стойки в портативном центре обработки данных Scuderia Toro Rosso.
И что бывает, когда ломается ИБП?
У нас было несколько случаев, когда ИБП ломались, но это больше неудобство, чем реальная проблема. У нас, конечно же, не один ИБП. У нас есть «холодный» и «горячий» резерв. Если что-то ломается во время гонки, происходит автоматическое подключение питания и все продолжает работать.
Как я понимаю, ИБП нужен не только в случае перебоев с питанием, но и для стабилизации питания?
Да. На некоторых автодромах Формулы 1 мощность и напряжение бывают нестабильными. Для нашей сети нужны стабильные 50 Гц.
Какие серверы у вас тут есть?
У нас есть восемь физических серверов плюс обычное сетевое оборудование. Из этих восьми шесть принадлежат нам и два — Ferrari, нашему поставщику двигателей.
На наших серверах установлены VMware и Windows, и у каждого свои задачи. Для VMware мы используем серверы HP, связанные через сеть хранения данных с массивом хранения данных HP. У нас два массива хранения данных для балансирования нагрузки и обеспечения резерва. Хранение этих данных осуществляется на твердотельных накопителях. У них не только лучшие показатели работы, но они также меньше подвержены воздействию вибраций.
Инженеры команды Scuderia Toro Rosso анализируют телеметрические данные.
Как я понимаю, на одном из этих VMware находится виртуальный сервер базы данных системы «Atlas»?
Да, у нас несколько серверов системы «Atlas». Это все серверы на виртуальных машинах. Серверы «Atlas» критически важны для нашей гонки, так как они обрабатывают данные телеметрии, мы обеспечиваем устойчивость к отказам VMware на каждой машине. Так что, если один из ваших VM-ов упадет, когда машина на треке, телеметрические данные все равно продолжат поступать.
Когда начинается телеметрия?
Сразу в момент старта. Сервер «Atlas» сразу начинает записывать данные. Инженеры производят несколько телеметрических проверок в течение дня, и несколько раз запускают машину, чтобы убедиться, что все датчики работают.
Даниэль Мартлэнд демонстрирует график расположения машин на треке.
Есть какие-то датчики, с которыми особенно сложно?
Еще бы! Когда у вас больше 200 физических датчиков и тысячи замеров, можно ожидать, что какой-то из них сломается! К счастью, наша система работает превосходно.
А что вы делаете, когда вам кажется, что что-то выглядит неправильно?
[Смеется] Мы просто нажимаем клавишу на экране и идем дальше! Серьезно, наши инженеры всегда знают точно, в чем проблема.
Кстати, о датчиках, у нас немало и виртуальных датчиков. Данные от машины идут в электронный блок управления. Вся доступная информация по телеметрии автомобиля поступает в виртуальный блок управления, где производятся все необходимые расчеты. Как вы понимаете, в автомобиле есть места, куда не получится поставить физическое устройство, так что нам приходится прогнозировать, что там может происходить на самом деле. Существуют тысячи виртуальных датчиков, которые обрабатывают данные именно таким образом.
На графике показано расположение машин на треке.
Теперь расскажите, пожалуйста, о ваших компьютерах с системой Windows, для чего они?
Один из них — это сервер для резервного копирования. Поскольку мы работаем в партнерстве с Acronis, вы много об этом услышите! Он имеет хранилище информации объемом более 60 терабайт на жестких дисках, поскольку такое хранилище нужно для нашей работы. Для обеспечения надежности и защиты от сбоев оборудования мы используем RAID-массив.
Это ваш единственный сервер для резервного копирования?
Да, это единственный сервер, который мы возим с собой.
Копируете ли вы данные, когда находитесь не на месте?
Возвращаясь домой, мы архивируем и переносим резервные копии с резервного сервера в портативном дата-центре на наши резервные серверы на базе. К сожалению, поскольку мы генерируем огромный объем данных, у нас нет возможности перемещать резервные копии через Интернет, пока мы далеко от базы.
Однако телеметрические данные передаются в режиме реального времени на базу во время каждой гонки. У нас есть канал с протоколом MPLS на 30 Мбит/с, соединяющий гоночный трек и базу Scuderia Toro Rosso в Фаэнце.
Кто обеспечивает вас пропускной способностью?
Для всех гонок у нас один провайдер — Riedel Communications. Они работают с местными телекоммуникационными компаниями, чтобы обеспечить связь очень высокого качества в каждой стране. Они также присутствуют здесь физически, поэтому если что-то идет не так, мы можем пойти и задать им взбучку! [Смеется]
Очень хорошо, что на гоночном треке присутствуют их люди. Только подумайте: если вы потеряете свой канал с протоколом MPLS, вы потеряете связь. Вы также не сможете направить запрос в техподдержку по электронной почте, поскольку электронной почты не будет!
Часть серверной стойки команды Scuderia Toro Rosso
Какими еще услугами вы пользуетесь?
Только стандартным набором. FIA предоставляет данные GPS и информацию о погоде. Также мы пользуемся услугами менеджмента Формулы 1: получение информации о времени, телевидение и т.д.
Вы рассказали об организации системы. Теперь поделитесь, пожалуйста: вот Вы просыпаетесь утром в выходные, когда проходят гонки. Что в это время занимает Ваши мысли?
Ну, самое первое, что я делаю, встав с постели, — это проверка телефона. Я смотрю не «лайки» на своей странице в Facebook, а проверяю, нет ли каких-либо проблем с нашими системами. Мне приходит множество писем о состоянии и СМС-сообщений с разных серверов. Некоторые предупреждения носят информационный характер, такие как статус резервного копирования, но другие могут быть более серьезными. Итак, я встаю, проверяю почту и далее волнуюсь всю дорогу, пока еду на работу! [Смеется]
В воскресенье, когда проходят основные гонки, тратится очень много нервов! Я всегда очень нервничаю, когда прибываю на гоночный трек.
Остается меньше тех часов до гонки чемпионата Формулы 1 — Гран-при Малайзии. Финальные приготовления
Итак, вы входите, медленно включаете мониторы и надеетесь, что все хорошо?
Нет, система на самом деле очень надежная. Прибывая на место, я изучаю ежедневный контрольный лист. Проверяю, все ли работает. И потом — то же самое заново! [Улыбается]
Чем вы пользуетесь для мониторинга?
В основном Cacti с множеством различных плагинов. Мне нравится эта программа, поскольку ее можно адаптировать под свои нужды. Мы экспериментировали и с разными другими программами для мониторинга, но пока не нашли то, что нам нравится.
А вы пробовали Acronis Monitoring?
Еще нет. Но мне нравится то, что я видел на данный момент. Мне нравится идея полной защиты данных, когда резервное копирование данных, синхронизация файлов и мониторинг предоставляются одним поставщиком. Acronis — это лидер в резервном копировании данных, и скоро мы узнаем, является ли он «самым-самым» и в серверном мониторинге!
Итак, Вы приходите на работу, проверяете графики, чтобы удостовериться, что все в порядке и графики зеленые?
Не совсем. У нас всегда красные графики, но это потому, что некоторые системы не используются либо отключены. Например, наша ИТ-конфигурация в Европе несколько отличается. Некоторые технические средства мы используем только для европейских этапов гонок Формулы 1 и нигде больше. В Европе мы не все доставляем самолетом: для перевозки мы используем грузовики, а это немного иное.
По Вашему мнению, каким образом Acronis облегчит Вашу работу?
Для ИТ-инженера вроде меня скорость резервного копирования — это все. Описание новых продуктов Acronis звучит захватывающе. Технологии вроде Acronis Instant Restore, то есть технология, обеспечивающая возможность очень быстрого восстановления, — это именно то, что мы ищем. Когда что-то реально не ладится, уже само знание о том, что ваши данные защищены — это самое лучшее чувство, которое может испытать сисадмин.
Большое спасибо, что уделили нам время, и успехов Вашей команде!
Спасибо Вам!
ссылка на оригинал статьи https://habrahabr.ru/post/313708/
Добавить комментарий