Основные проблемы защиты данных
Современные реалии в случае возникновения какого-либо непредвиденного сбоя (аварии) требуют минимизации двух основных параметров: объема потерянных данных и времени восстановления. При этом объем потерянных данных фактически напрямую зависит от времени, прошедшего с момента сохранения последнего состояния системы до момента аварии. Тем самым, для минимизации данного параметра необходимо как можно чаще выполнять резервное копирование, в свою очередь увеличивая и без того растущий объем хранимых данных. Именно организация бэкапа, на текущий момент, становится основной задачей системного администратора.
Помимо лавинообразного роста данных, окна для выполнения их резервного копирования сжимаются, это происходит из-за увеличения времени работы предприятий, открытия филиалов в других часовых поясах, увеличения нагрузки на серверы и других аналогичных процессов. Все это приводит к росту требований к пропускной способности сети и производительности устройств хранения, а также к увеличению количества процессов резервного копирования выполняемых параллельно.
Резервное копирование на ленты в таких условиях уже не справляются с возросшими требованиями, и перестает быть решением проблемы. В тоже время резервное копирование на жесткие диски, несмотря на увеличение их объема и уменьшения стоимости 1МБ все еще остается слишком дорогим удовольствием. В такой ситуации, пожалуй, единственными устройствами способными решить проблему резервного копирования, являются устройства дедупликации.
Дедупликация
Устройства дедупликации сохраняют только уникальные данные, исключая их дублирование. Их эффективность определяется тем, что значительная (или даже большая) часть данных постоянно дублируется. Давайте рассмотрим на простых примерах.
Так, делая ежедневную копию образа, какого-либо сервера или виртуальной машины, вы вынуждены постоянно сохранять один и тот же набор файлов плюс некоторые произошедшие за сутки изменения. В большинстве случаев, объем отличающихся данных будет незначителен, в то время как копии образов будут занимать практически одинаковое место в файловом хранилище. Потенциально дедупликация сохраняет исходный образ, а затем вместо следующего – только отличия от исходного. Потенциал экономии места для хранения бэкапов в данном случае существенно увеличивается, если вы имеете множество однотипных серверов или виртуальных машин.
Высокоэффективной дедупликация оказывается и при резервном копировании баз данных. Тут речь идет не только об измененных данных, но и о наличии в самой базе данных множества одинаковых записей.
Вообще говоря, даже невысокий коэффициент дедупликации позволяет сохранить огромное количество дискового пространства. Это прекрасно видно из приведенного ниже графика. На практике, в задачах резервного копирования, он редко бывает ниже, чем 10:1, а это означает 90% экономию места под резервные копии.
Дедупликация в решениях Fujitsu
В решениях Fujitsu применяется разбиение данных на блоки переменной длины, после чего каждый блок получает уникальную сигнатуру (контрольную сумму). При этом блоки находятся в том числе и внутри файлов, что помогает находить данные в том числе и в файлах Microsoft Exchange и базах данных. Далее составляется лист сигнатур, содержащий сами сигнатуры и место блоков с такой сигнатурой в изначальной последовательности данных. В завершении процесса дедупликации непосредственно на жесткие диски сохраняются только уникальные блоки и лист сигнатур. Т.е. если новый блок данных соответствует какому-то из ранее записанных, то он записан не будет, вместо этого просто добавляется соответствующий указатель к существующему блоку. После этого производится автоматическая компрессия уникальных блоков данных, т.е. их сжатие с использованием стандартных алгоритмов архивации, что в свою очередь может еще больше сократить требуемое для бэкапа место.
Описанный процесс в настоящий момент протекает в режиме онлайн. Т.е. все эти этапы производятся на лету, невидимо для пользователя, что позволяет сразу определять остающееся свободным место, т.к. на диски пишутся уже дедуплицированные данные. Отказ от офф-лайн дедупликации стал возможным благодаря росту производительности современных процессоров и подсистемы памяти применяемых в готовых решениях серверов.
Система резервного копирования данных ETERNUS CS800
Одним из лучших решений проблемы дедупликации является Fujitsu ETERNUS CS800. Оно представляет собой программно-аппаратный комплекс, т.е. это полностью законченное решение, не требующее покупки дополнительных лицензий, комплектующих или ПО. Система ETERNUS CS800 ориентирована на применение организациями малого и среднего бизнеса (SMB), а также на установку в региональных офисах крупных компаний. Возможности данного решения позволяют использовать его как вместо ленточных библиотек, так и вместе с ними.
ETERNUS CS800 представлен двумя моделями: Entry и Scale. Entry имеет две модификации отличающиеся объемом хранимых данных 4,8 ТБ или 9,6 ТБ. При этом, обращу ваше внимание на то, что в данном случае речь идет о реально доступном пользователю объеме данных – накладные расходы RAID в данном случае уже учтены. Указанной стратегии с доступным пользователю объемом Fujitsu придерживается для всей линейки ETERNUS CS. Модель же Scale представляет собой расширяемое решение (за счет подключения дополнительных дисковых систем хранения). При этом в зависимости от используемых жестких дисков доступны варианты: 8-80 ТБ (при использовании однотерабайтных дисков), 16-160 ТБ (с двухтерабайтными) и 24-240 ТБ (с трехтерабайтными дисками). Аппаратно ETERNUS CS800 состоит из стоечного двухюнитового сервера Fujitsu PRIMERGY, а модели Scale дополнительно имеют еще систему хранения данных Fujitsu ETERNUS DX 80 с подключенными дисковыми полками. Количество полок может составлять от 1 до 10 и динамически наращиваться в процессе эксплуатации системы. Системы хранения используют RAID 6, гарантирующий сохранность данных при выходе из строя до 2-ух дисков из каждой (дисковой группы) массива.
Доступ к ETERNUS CS800 можно получить по интерфейсам CIFS/NFS через Ethernet, VTL через Fibre Channel или Symantec OST. Таким образом настройка и интеграция в существующаю среду предприятия не должны вызывать проблем.
Другой особенностью ETERNUS CS800 является поддержка функции Path To Tape (PTT), благодаря которой к нему возможно подключить физические ленточные библиотеки и сбрасывать на них данные, предназначенные для долгосрочного хранения, но не предполагающие их оперативного использования, например, ежегодные или ежемесячные копии. При этом данные на ленту будут скидываться недедуплицированные данные, что позволит считывать их минуя устройство дедупликации.
Система резервного копирования данных ETERNUS CS High End
Несмотря на свои достоинства, ETERNUS CS800 обладает и некоторыми ограничениями. Так, его масштабируемость ограничена только увеличением дискового пространства системы хранения (в моделе Scale), в то время как масштабируемость процессоров дедупликации здесь просто невозможна. Для предприятий и организаций, где производительности одного процессорного модуля мало, Fujitsu предлагает устройство дедупликации ETERNUS CS High End.
Данное готовое решение может гибко расти вместе с вашим предприятием до 10 процессорных модулей управляющими входящими потоками данных, 16 внутренних RAID систем (3,6 ПБ данных). Такая система способна обрабатывать до 400 ТБ данных в день. Кроме этого данная система поддерживает до 10 устройств, на которые могут быть сброшены данные, например физические ленточные библиотеки, интегрируя тем самым ленточные библиотеки в общую систему резервного копирования и архивирования данных. Такая система будет представлять собой решение обладающее высокой отказоустойчивостью, т.к. в нем отсутсвует единая точка отказа, работоспособность системы будет сохраняться до тех пор, пока хотя бы один из процессоров дедупликации будет в рабочем состоянии.
При этом не обязательно, что система ETERNUS CS High End будет стоить очень дорого. Стоимость конфигурации с одним вычислительным узлом, не намного превышает стоимость систем более низкого класса, зато в ваших руках будет практически неограниченные возможность дальнейшего расширения системы в зависимости от потребности бизнеса.
ссылка на оригинал статьи http://habrahabr.ru/company/fujitsu/blog/181318/
Добавить комментарий