Массивы хранения данных Dell Powervault MD3

от автора

Рано или поздно многие компании сталкиваются с необходимостью хранения все возрастающего объема рабочей информации. Так, согласно исследованиям, в 2011 году общий объем созданных данных достиг отметки в 1,8 триллионов ГБ, а по прогнозам Gartner, общий рост данных к 2016 году составит 850%. Причем практически повсеместно помимо хранения подобных данных требуется возможность оперативного обращения к ним и/или их изменения. Средний рост данных за год может превышать отметку в 100% и поэтому требования к СХД растут быстрее, чем к вычислительным мощностям серверов. Помимо этого, увеличение емкости дисков приводит подчас к неудовлетворительным результатам применения традиционных схем RAID.

В портфеле компании Dell для подобных случаев имеется универсальное решение: системы хранения данных высокой плотности PowerVault MD3.

Продуктовую линейку PowerVault MD3 условно можно разделить на группы по форм-фактору используемых дисков (2,5” или 3,5”), их типу подключения к существующей инфраструктуре (SAS, iSCSI, FC) и возможностям расширения. За счет масштабируемости решения суммарное количество используемых системой дисков может достигать 180 единиц в варианте исполнения дисковых полок высокой плотности (4U), либо 192 — в конфигурациях с дисковыми полками обычной плотности (2U).

Все ключевые узлы системы (контроллеры, блоки питания, диски, вентиляторы) задублированы и могут заменяться в режиме горячей замены, а контроллеры имеют резервное питание от конденсаторов высокой емкости для возможности записи содержимого кэш-памяти на энергонезависимую память в случае отключения внешнего питания. В числе несомненных плюсов такого решения — возможность сохранять данные кэш-памяти консистентными любое длительное время, гораздо больший срок работы конденсаторов, по сравнению с аккумуляторами и отсутствие необходимости их профилактической замены в среднем каждые три года. В массивах высокой плотности (4U или модели MD3x60) предусмотрены отдельные независимые полки, с помощью которых можно произвести замену или добавление дисков без остановки работы ввода-вывода приложений.

Помимо стандартных для подобного рода СХД поддержки RAID-групп уровней 0, 1, 10, 5, 6, семейство массивов MD3 предлагает пользователю отдельный вариант управления дисками — динамические пулы или Dynamic Disk Pools (DDP). Пул DDP динамически распределяет данные, свободную емкость и информацию о защите (четность) в пуле дисков. Размер пулов может составлять минимально от 11 дисков до всех доступных дисков в системе хранения данных PowerVault MD3, включая дисковые полки расширения. Помимо создания одного или нескольких динамических пулов, администраторы систем хранения данных могут создавать традиционные дисковые RAID группы совместно с динамическими пулами, что обеспечивает высочайший уровень гибкости.

Пулы DDP значительно упрощает администрирование систем хранения данных, так как не нужно управлять простаивающими ресурсами или многими отдельными RAID-группами.

Пулы Dynamic Disk Pools состоят из нескольких элементов низкого уровня. Первый из них называют D-Piece. Он состоит из непрерывного раздела объемом 512 МБ на физическом диске, содержащем 4096 сегментов по 128 КБ. Из выбранных дисков в пуле выбираются 10 компонентов D-Piece с помощью интеллектуального алгоритма оптимизации. 10 связанных элементов D-Piece образуют D-Stripe размером 4 ГБ. Содержимое компонента D-Stripe похоже на раздел RAID 6 в конфигурации 8+2, где 8 базовых сегментов могут содержать пользовательские данные, 1 сегмент содержит сведения о четности (P), полученные на основе пользовательских сегментов данных, а последний сегмент содержит значение Q согласно RAID 6.
Виртуальные логические диски или LUN (Logical Unit Number) создаются, по сути, путем объединения нескольких элементов D-Stripe размером 4 ГБ для получения заданного размера виртуального диска в пределах максимально допустимого объема в пуле Dynamic Disk Pool.

Когда администратор системы хранения данных завершил определение пула Dynamic Disk Pool, которое по большей части состоит из задания необходимого числа дисков в пуле, создаются структуры D-Piece и D-Stripe, аналогично традиционным блокам RAID при создании виртуального диска. После определения Dynamic Disk Pool в пуле можно создать виртуальный диск. Этот диск будет состоять из нескольких элементов D-Stripe, размещенных по всем дискам в пуле, общим объемом до заданного значения емкости виртуального диска, например число D-Stripe = выбранная емкость/4 ГБ. В пуле Dynamic Disk Pool можно определить множество виртуальных дисков, и в самой СХД можно создать несколько пулов.

Администратор системы хранения данных также может создать традиционные дисковые RAID группы вместе с пулами Dynamic Disk Pools или любую их комбинацию. Как и традиционные дисковые группы RAID, пулы Dynamic Disk Pools можно расширить за счет добавления дисков в пул в процессе динамического расширения емкости (Dynamic Capacity Expansion, DCE). Одновременно в пул можно добавить до 12 дисков. Когда инициируется операция DCE, часть существующих элементов D-Piece формирующих логические тома фактически переносится на новые диски, тем самым увеличивая количество физических дисков, на которых размещается логический том и повышая производительность.

Еще одним важным преимуществом Dynamic Disk Pool является то, что вместо использования выделенных изолированных компонентов для горячей замены сбойных дисков, сам пул содержит встроенную резервную емкость, на каждом диске входящем в пул, на случай возможных сбоев. Это упрощает управление, так как больше не нужно планировать или контролировать отдельные выделенные диски для горячей замены. При этом время восстановления значительно сокращается (в два – три раза при использовании дисков большого объема), а производительность логических томов во время восстановления практически не падает по сравнению с традиционными выделенными дисками горячей замены.

Кроме того, если учесть, что виртуальные диски в пулах Dynamic Disk Pools могут содержать очень большое число дисков по сравнению с традиционными дисковыми группами RAID 5 или RAID 6 где максимально до 30 дисков в группе, то в средах со смешанными или непараллельными нагрузками можно добиться преимуществ с точки зрения производительности, поскольку все ресурсы пула доступны сразу все логическим томам.

Помимо использования DDP, за счет возможности сочетания в одном решении твердотельных накопителей и традиционных жестких дисков стало возможным реализовать кэширование на твердотельных накопителях. Кэширование на SSD позволяет массиву PowerVault MD3 использовать твердотельные накопители как расширенный кэш для чтения, тем самым повышая производительность приложений с большим числом произвольных операций считывания, например для файловых серверов, веб-серверов, баз данных и т. п.

Кэш на твердотельном накопителе является дополнительным и используется вместе с основным для улучшения производительности. При создании кэша на SSD он разбивается на два внутренних виртуальных диска RAID 0 (один диск на контроллер). Этот том кэша недоступен для обычного хранения данных.

В дуплексном режиме каждый контроллер использует отдельный виртуальный диск, получая доступ только к половине пространства твердотельного накопителя даже в случае сбоя контроллера или его перехода в режим обслуживания. В симплексном режиме один контроллер управляет всем пространством SSD и использует оба виртуальных диска. Максимально допустимый размер кэша на твердотельном накопителе в массивах PowerVault MD3 составляет 4 ТБ.

Кэширование на твердотельных накопителях обеспечивает преимущества для рабочих нагрузок со следующими характеристиками:

  • Производительность чтения ограничена скоростью операций ввода-вывода для жестких дисков.
  • Высокий процент операций чтения относительно операций записи.
  • Размер рабочего набора данных меньше объема кэша на твердотельном накопителе.

SSD cash рекомендуется в тех случаях, когда требуется сбалансированный экономичный подход, использующий комбинацию жестких дисков и кэша на твердотельном накопителе, а стоимость выделенных SSD-накопителей для отдельных логических томов непомерно высока.

Еще одной особенностью системы хранения данных PowerVault MD3 является синхронная и асинхронная удаленная репликация. Она позволяет эффективно реплицировать данные, обеспечивая защиту информации от сбоев системы и отказов питания. Эта функция дублирует данные между системами хранения данных PowerVault MD3, чтобы обеспечить их доступность в случае сбоев, а также для других целей, связанных с миграцией бизнес-данных.

В синхронной модели один массив хранит первичный виртуальный диск, а второй, удаленный — вторичный виртуальный диск пары репликации. После установления связи между первичным и вторичным массивами первичный массив обрабатывает инициируемые сервером операции записи на вторичном виртуальном диске, передавая запросы на запись вторичному массиву, одновременно с этим выполняя эти операции на локальном массиве. Первичный массив возвращает серверной системе успешный результат только после того, как оба массива завершили выполнение операции записи.

Синхронная модель имеет несколько преимуществ, главное из которых — это возможность восстановления данных приложения со вторичного массива, в том числе самых последних обновлений. Если на первичном массиве возникнет критический сбой, то данные приложений можно будет восстановить со вторичного массива, тогда пропадут только запросы на запись, которые выполнялись во время сбоя. Поскольку приложение на стороне первичного массива ожидает положительный ответ о завершении текущих запросов, их потеря не вызовет расхождения в данных в случае сбоя или перезагрузки сервера во время их выполнения. Приложения, обладающие даже самыми базовыми возможностями восстановления, в таких случаях способны восстанавливать целостность данных самостоятельно. Следовательно, использование модели синхронной удаленной репликации позволяет приложениям реализовать отказоустойчивость. К недостаткам синхронной репликации можно отнести высокие требования к каналам связи.

Асинхронная удаленная репликация — отличный выбор для тех, кому необходима защита от сбоев, но у которых нет средств для реализации синхронных моделей репликации. Предполагается, что таким потребителям не нужен план абсолютно надежного восстановления до момента сбоя, их больше интересует экономическая эффективность решения. Иными словами, асинхронная репликация позволяет потребителю использовать более медленные и менее дорогие коммуникационные каналы между первичным и вторичным массивами, если допускаются определенные задержки, которых нет при использовании синхронной модели репликации. Модель асинхронной репликации позволять регулировать длительность задержек в зависимости от потребностей клиента в соответствии с возможностями и характеристиками канала связи. Одно из основных преимуществ асинхронной удаленной репликации заключается в том, что производительность приложения в основном массиве не будет связана с каналом связи. Конечно, производительность канала будет влиять на продолжительность задержек, но не будет напрямую затрагивать производительность приложения.

Асинхронная удаленная репликация предназначена для работы с относительно медленными и низко-скоростными каналами связи (например, каналами TCP/IP для iSCSI). Главный режим ее работы включает настраиваемые периоды расхождения, в течение которых не производится никаких попыток передачи данных с первичного массива на вторичный. Вместо этого использование грязной карты позволяет массиву отслеживать изменившиеся участки первичного виртуального диска для их последующей выборочной передачи на вторичный массив. После истечения заданного в настройках периода времени первичный массив начинает перенос соответствующих данных на вторичный массив. Такой подход дает несколько преимуществ, каждое из которых особенно важно при использовании медленных, глобальных каналов связи.

  • Производительность. В течение интервала расхождения не предпринимается попыток передачи изменений через канал связи. Соответственно, производительность на первичном массиве не зависит от характеристик канала связи. Единственная причина, влияющая на производительность, — относительно малые задержки, связанные с отслеживанием изменившихся блоков. Это делается за счет обновления грязной карты на первичном массиве. Во время выполнения синхронизации с использованием образа на определенный момент времени позволяет выполнять репликацию без значительной зависимости скорости ввода-вывода на первичном виртуальном диске от скорости и задержек канала связи.
  • Эффективность. Поскольку во время накопления изменений в течение периода расхождения может возникнуть множество обновлений в одних и тех же блоках, асинхронная удаленная репликация позволяет избежать передачи промежуточных результатов. Фактически через канал связи передается только содержимое блока, существующее на момент синхронизации.
  • Надежность. Большое внимание уделено обеспечению допустимости содержимого блока на первичном виртуальном диске и возможности его восстановления перед началом синхронизации со вторичным массивом. В частности, асинхронная удаленная репликация проверяет содержимое блока, выбранного на первичном виртуальном диске для синхронизации, на предмет соответствия порядка записи в первичном массиве. В результате пользователь может быть уверен в том, что образы данных на вторичном массиве будут пригодны для восстановления, если понадобится сделать вторичный виртуальный диск активным.
  • Простота. Если вторичный виртуальный диск становится активным из-за отказа первичного, возникают ситуации, когда работоспособность первичного массива впоследствии можно восстановить. Это может произойти, если проблема или сбой на первичной стороне были вызваны отказом питания или канала связи, но в дальнейшем эту проблему удалось исправить. В таких случаях асинхронная удаленная репликация поддерживает оптимизированную обратную синхронизацию с передачей на первоначальную первичную сторону только различий в данных. Иными словами, на первичный виртуальный диск будут передаваться только те блоки, которые изменились с момента перевода вторичного виртуального диска в активное состояние. Поэтому возможно восстановление исходного первичного массива в своей роли без ресурсоемкой полной синхронизации.
  • Расстояние. Асинхронная удаленная репликация поддерживает сети FC и iSCSI. Интерфейс iSCSI использует стандартные IP-сети для репликации данных на значительно более дальние расстояния, чем типичные FC. Кроме того, асинхронная удаленная репликация не требует выделенного серверного порта для выполнения операций ввода-вывода репликации, они выполняются через те же iSCSI-порты, что и ввод-вывод сервера.

Асинхронная удаленная репликация для систем хранения данных Dell PowerVault MD3 представляет ценное решение для тех клиентов, которым требуется обеспечить отказоустойчивость для защиты критических бизнес-данных без серьезных денежных вложений, которых требует применение механизмов синхронной удаленной репликации. Асинхронная удаленная репликация может использоваться на относительно медленных каналах связи, позволяя пользователю обеспечить разумный компромисс между RPO (Return Point Objective) и стоимостью линий связи. Следовательно, асинхронная удаленная репликация позволяет передавать данные на дальние расстояния через сети TCP/IP, обеспечивая защиту от катастроф, но не оказывая значительного влияния на производительность работы приложений на первичном узле.

Кроме того, использование эффективного ПО MD Storage Manager предоставляет простые и удобные в использовании средства для настройки и мониторинга на основе задач. Прибавьте к этому интерфейсы API VMware vStorage для интеграции массива (поддержка VAAI, VASA), поддержку операционных систем WS2008, Windows 2012, RHEL 5.8, 6.2, SLES 10.4, 11.2, Citrix XenServer, VMware ESXi 5.0, 5.1, MS Hyper-V 2008, работы с тонкими томами и вы получаете надежную систему для использования самых современных и наиболее ресурсоемких приложений. Исходя из требований, предъявляемых к системе, можно задействовать 90-дневную пробную лицензию для использования следующего функционала:

  • работы со снэпшотами и снэпклонами;
  • производительные конфигурации (High Performance Tier) — использование SSD-кэша на дисках;
  • использование синхронной/асинхронной репликации (между двумя массивами).

Активация производится через графический интерфейс (MD Storage Manager) и автоматически выключается через 90 дней использования. При этом рабочие данные не теряются, а становятся недоступными до момента покупки лицензии.

Таким образом, системы хранения данных PowerVault MD3 могут найти свое применение в широком спектре задач. От задач общего класса (консолидация бизнес-приложений, проекты виртуализации, системы архивного хранения и пр.), до приложений высокопроизводительных вычислений (вычислительные кластера, видеонаблюдение, раздача цифрового контента).

За дополнительной информацией по конфигурации, возможностям или условиям заказа систем хранения данных семейства PowerVault MD3 вы можете обращаться к Марату Ракаеву, в московский офис Dell.

ссылка на оригинал статьи http://habrahabr.ru/company/dell/blog/206180/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *