Cистемы облачной платформы Huawei FusionSphere OpenStack

от автора


RUVDS в недавнем времени стала официальным партнером компании Huawei и сейчас мы занимаемся внедрением новой для нас системы виртуализации для того, чтобы предоставить нашим клиентам доступ к самым современным облачным технологиям, обеспечить гибкость в выборе облачного решения соответствующего задаче клиента, высокую надежность и защищенность. Этот опыт для нас новый и интересный и мы решили поделиться им с читателями нашего блога. Перед вами первая из серии статей про Huawei FusionSphere OpenStack.

Платформа виртуализации FusionSphere
Архитектура облачной платформы Huawei FusionSphere OpenStack представлена на Рис. 1-1.
Рис. 1-1 Архитектура облачной платформы Huawei

Huawei FusionSphere OpenStack – это платформа OpenStack корпоративного уровня на основе исходной OpenStack, переработанная и улучшенная компанией Huawei. В решении FusionSphere для облачных центров обработки данных в состав OpenStack включен компонент FusionCompute для поддержки разнообразных служб OpenStack, таких как Keystone, Nova, Cinder, Neutron, Glance, Ceilometer, Heat и Ironic, а также обеспечения комплексных функций O&M.

  • Базовые возможности служб: в системе FusionSphere OpenStack поддерживаются базовые возможности по установке, развертыванию и O&M, в том числе управление журналами, управление временем (time management), резервное копирование и восстановление, обновление и внесение исправлений (patching).
  • Возможности OpenStack: взяв за основу исходную OpenStack, компания Huawei расширила ее возможности с применением вычислительных плагинов, сетевых плагинов и плагинов хранения, а также реализовала виртуализацию вычислений, хранения и сети. FusionSphere OpenStack централизованно планирует и администрирует виртуальные ресурсы через унифицированные интерфейсы, благодаря чему снижаются эксплуатационные расходы (OPEX) и обеспечивается высокая защищенность и надежность системы. Это также существенно облегчает для операторов связи и иных предприятий строительство защищенных экологичных и энергоэкономичных облачных центров обработки данных.

Облачная платформа Huawei содержит следующие узлы управления.

  • Узел управления OpenStack: поддерживает вычислительные плагины, сетевые плагины и плагины хранения, виртуализирует вычислительные, сетевые ресурсы и ресурсы хранения, а также предоставляет унифицированные интерфейсы.
  • Узел FusionManager: обеспечивает доступ к ресурсам и функции конфигурирования, контроля и технического обслуживания.
  • Узел управления FusionCompute: обеспечивает основные функции виртуализации.

Он виртуализирует серверы, устройства хранения и сетевые устройства, а также предоставляет интерфейсы для взаимодействия с FusionSphere OpenStack. Каждая система FusionCompute управляется парой узлов управления виртуальными ресурсами (VRM; Virtual Resource Management), работающих в режиме «активный / резервный». Одна система FusionCompute управляет физическим кластером (называемым также объектом или площадкой). Несколько физических серверов физического кластера могут быть объединены в кластер ресурсов (также называемый пулом ресурсов с функцией HA). В одном пуле вычислительных ресурсов действуют единые политики планирования ресурсов. Для обеспечения работы политик планирования, связанных с динамической миграцией, необходимо, чтобы ЦП физических серверов в пуле ресурсов принадлежали к одному и тому же поколению. В пул вычислительных ресурсов не входят сетевые ресурсы и ресурсы хранения. В одном физическом кластере может содержаться несколько кластеров ресурсов.
Службы и узлы решения FusionSphere OpenStack представлены на Рис. 1-2.
Рис. 1-2 Службы и узлы решения FusionSphere OpenStack

На этом рисунке показаны следующие службы и узлы:

  • Glance: хранит и восстанавливает образы дисков VM. Служба Glance используется в FusionSphere OpenStack для формирования экземпляров.
  • Cinder: обеспечивает надежное блоковое хранилище для работающих экземпляров. Создание блокового хранилища и управление им облегчаются за счет наличия сменных накопителей.
  • Nova: управляет жизненным циклом вычислительных экземпляров в среде OpenStack, например, созданием пакетов экземпляров, а также планированием или остановкой экземпляров по требованию.
  • Neutron: обеспечивает интерфейсы API для сетевых соединений и адресации.
  • Узел VRM: управляет пулами виртуальных ресурсов.
  • Агент вычислительного узла (CNA; Computing Node Agent): управляет вычислительными ресурсами

.
Драйвер Nova-compute обеспечивает работу FusionSphere OpenStack с функциями, предоставляемыми FusionCompute, включая динамическую миграцию, НА, планирование распределенных ресурсов (DRS) и QoS для ЦП.
Драйвер Cinder-volume обеспечивает взаимодействие FusionSphere OpenStack с любыми устройствами хранения, сертифицированными на совместимость с FusionCompute, а также управление FusionStorage посредством FusionCompute, обеспечивая экономически эффективное решение для хранения, применимое для крупных облачных центров обработки данных.
FusionCompute подключается к Ceilometer и передает в Ceilometer информацию о контроле VM. Благодаря этому арендаторы могут пользоваться функциями контроля и выдачи аварийных сигналов Ceilometer, а также функцией гибкого масштабирования Heat.
Компонент FusionCompute, включающий в себя агента Open vSwitch (OVS), подключается к Neutron, благодаря чему он может использовать экосистему Neutron для бесшовной интеграции с сетевыми службами сторонних производителей.
Благодаря наличию драйверов Nova и Cinder, а также механизма обхода Glance, FusionSphere OpenStack поддерживает хранение образов в сторонних системах NFS или S3, за счет чего обеспечивается высокая параллельность и производительность служб образов, а также устраняются узкие места службы Glance. Помимо этого, FusionCompute поддерживает взаимодействие с собственной Glance с целью обслуживания образов.
Служба формирования облака (CPS; Cloud Provisioning Service) обеспечивает такие базовые функции, как установка аппаратных устройств без операционной системы и развертывание ПО OpenStack. Предусмотрен также графический интерфейс пользователя (GUI), упрощающий развертывание и конфигурирование OpenStack.

Администрирование и контроль ресурсов FusionManager
Ресурсами центров обработки данных управляет разработанная в Huawei система управления FusionManager, входящая в состав решения FusionSphere. FusionManager обеспечивает разнообразные функции управления пулом ресурсов с помощью предоставляемых OpenStack «северных» API, а также обеспечивает функции управления аппаратными средствами с помощью встроенных субмодулей управления аппаратными средствами.
Место FusionManager в решении FusionSphere показано на Рис. 1-3.
Рис. 1-3 Место FusionManager в решении

FusionManager обеспечивает следующие функции.

  • Управление внешними сетями

Позволяет пользователям создавать, просматривать и удалять внешние сети, подключенные к OpenStack.

  • Управление хостами

Позволяет пользователям запрашивать информацию о хостах и контролировать их, получать информацию о работе хоста в течение заданного периода времени (задаваемого в днях или неделях).

  • Управление характеристиками VM

Пользователь может конфигурировать, запрашивать и удалять спецификации VM, а также указывать режим запуска VM.

  • Управление образами

Пользователь может создавать, загружать, удалять, изменять и экспортировать образы.
FusionManager поддерживает различные форматы образов, включая ISO, RAW, QCOW2, VMDK, VHD и AMI.

  • Управление аварийными сигналами

  1. Выводит все аварийные сигналы системы. После устранения неисправности аварийный сигнал автоматически сбрасывается.
  2. Пользователь может сбрасывать аварийные сигналы вручную и экспортировать информацию о них.
  3. Пользователь может устанавливать серьезность аварийных сигналов, включая уровни «critical», «major» и «minor».
  4. Пользователь может маскировать аварийные сигналы. Маскированные аварийные сигналы не выдаются.
  5. Обеспечивает выдачу аварийных сигналов в сторонние системы по электронной почте, в коротких сообщениях или по простому протоколу управления сетью (SNMP; Simple Network Management Protocol).
  6. Предоставляет пользователям возможность сбора различной статистической информации об аварийных сигналах, включая сведения об объекте, времени и серьезности. Статистика по аварийным сигналам позволяет анализировать аварийные сигналы, тенденции и отказы, а также предотвращать отказы.

  • Контроль рабочих характеристик

− Контролирует рабочие характеристики хостов и VM.
− Контролирует уровень загрузки ЦП, памяти и хранилищ для хостов и VM.

  • Отчетность

− Предоставляет отчеты по контролю хостов и VM, как архивные, так и в реальном времени.
− Позволяет пользователям запрашивать отчеты, сформированные за определенные периоды времени, например, за сутки, неделю или месяц.
Информация о контроле сервера содержит следующие сведения:
− Статистика по аварийным сигналам
− Коэффициент загрузки ЦП
− Использование памяти
− Величина входящего и исходящего сетевого трафика
− Нагрузка на дисковый ввод / вывод и использование диска
Информация о контроле устройств хранения содержит следующие сведения:
− Статистика по аварийным сигналам
− Состояние монтирования
− Суммарный объем
− Выделенный объем и доступный объем
Информация о контроле сети содержит следующие сведения:
− Величина входящего и исходящего сетевого трафика
− Состояние портов
− Трафик через порты
Информация о контроле VM содержит следующие сведения:
− Состояние VM
− Коэффициент загрузки ЦП
− Использование памяти
− Величина входящего и исходящего сетевого трафика
− Нагрузка на дисковый ввод / вывод и использование диска

  • Открытые API

FusionSphere предоставляет открытые API для передачи данных об аварийных сигналах во внешние системы.
− Интерфейсы запроса аварийных сигналов (HTTP REST):

  • Запрос списка и состояния аварийных сигналов
  • Запрос ресурсов, имеющих аварийные сигналы

− Интерфейсы подписки на получение аварийных сигналов (HTTP REST)
− Интерфейсы передачи аварийных сигналов (SNMP)

Основные функции FusionSphere
Виртуализация вычислений
В системе FusionSphere для виртуализации вычислительных ресурсов сервера используется архитектура типа bare-metal (без ОС). Один сервер может быть виртуализирован как несколько отдельных виртуальных серверов, что позволяет улучшить использование ресурсов сервера и упростить управление системой.
Система FusionSphere поддерживает учет сродства VM (VM affinity), позволяющий размещать различные VM на различных серверах согласно заданным правилам с целью реализации режима взаимной поддержки VM или конфигурирования активных и резервных VM, что повышает экономическую эффективность решения.

  • Сродство по взаимному размещению (Location Affinity)

− «Совместное размещение» (Keep VMs together): подпадающие под это правило VM должны работать на одном и том же хосте. Любая VM может быть приписана только к одному правилу Keep VMs together.
− «Взаимное исключение» (Mutually exclusive): подпадающие под это правило VM должны работать на разных хостах. Любая VM может быть приписана только к одному правилу Mutually exclusive.
− «VM по хостам» (VMs to hosts): Это правило привязывает группу VM к группе хостов, то есть VM из группы VM могут развертываться только на хостах данной группы и мигрировать между хостами только в пределах этой группы.

  • Сродство по возможностям (Capability Affinity): на физических серверах с целью повышения эффективности доступа ЦП к памяти организуются узлы неоднородного доступа к памяти (NUMA; Non-Uniform Memory Access). ЦП и используемые VM (гостевыми) ресурсы памяти группируются в узлы NUMA в зависимости от эффективности доступа ЦП к памяти. Максимальная эффективность доступа ЦП к памяти достигается в случае доступа к памяти в пределах его собственного узла NUMA. При создании VM FusionSphere предпочтительно выделяет ЦП и ресурсы памяти, необходимые для этой VM, на одном узле NUMA, снижая таким образом задержки при доступе к памяти и повышая производительность памяти.

Управление ресурсами VM
Пользователи могут создавать VM с помощью шаблона VM или «с чистого листа» и управлять кластеризованными ресурсами, включая автоматическое планирование ресурсов, управление VM (создание, удаление, запуск, останов, перезапуск VM, перевод VM в спящий режим и вывод из него), управлять ресурсами хранения (обычными и совместно используемыми дисками), а также управлять обеспечением безопасности VM.
Система FusionSphere также поддерживает динамическую миграцию VM и VM с высокой доступностью (HA).
С помощью FusionSphere пользователи могут задавать количество виртуальных ЦП (vCPU), размер памяти, сетевые платы (NIC), а также состояние подключения и отключения томов.
Виртуализация сети
Система FusionSphere поддерживает следующие функции виртуализации сети:

  • Контроль пропускной способности сети с обеспечением QoS
  • Распределенные виртуальные коммутаторы (DVS; Distributed Virtual Switch)
  • Поддержка интерфейса SR-IOV (Single-Root I/O Virtualization), повышающего производительность сетевой обработки
  • Соединение с сетью OpenStack Neutron

Виртуализация хранилища
Система FusionSphere поддерживает ПО распределенного хранения Huawei FusionStorage, а также дисковые массивы, такие как сеть хранения fibre channel (FC SAN) и хранилище IP SAN.
Управление виртуальным центром обработки данных
Для упрощения конфигурирования услуг в системе FusionSphere предусмотрены различные шаблоны и спецификации.
Частное облако полностью изолировано от всех VM, не размещенным в этом частном облаке. Предприятие может запрашивать VPC на платформе публичного облака и использовать в этом VPC независимые IP-адреса и подсети. Кроме того, с целью разделения подсетей в VPC и отделения подсетей от внешних сетей предприятие может использовать правила списка управления доступом (ACL) физических межсетевых экранов.
Пользователи могут запросить создание группы безопасности на основании требований VM к безопасности и установить для этой группы безопасности правила доступа. После добавления VM в группу безопасности эта VM подпадает под действие установленных правил. Группы безопасности позволяют надежно изолировать VM и управлять доступом к ним, что повышает защищенность VM.
Эластичный IP-адрес позволяет пользователям использовать фиксированный общедоступный IP-адрес для доступа к той VM, которой этот общедоступный IP-адрес соответствует.
Управление несколькими центрами обработки данных
Если у предприятия или оператора связи имеется несколько центров обработки данных, размещенных в разных регионах, то технология каскадирования OpenStack помогает организовать централизованное управление несколькими центрами обработки данных и их техническое обслуживание.

Надежность FusionSphere OpenStack
Решение по виртуализации центра обработки данных обеспечивает надежность и непрерывность обслуживания различных компонентов системы, в том числе серверов, хранилища, сети и виртуализации.
Высокая доступность (НА) OpenStack
Надежность OpenStack определяется надежностью предоставляемых OpenStack услуг, а именно:

  • Надежностью услуги REST (Representational State Transfer; «передача состояния представления») API, обеспечивающей для пользователей непрерывное предоставление услуг API.
  • Надежностью службы базы данных, гарантирующей целостность данных пользовательской конфигурации и непрерывность обслуживания.
  • Надежностью службы соединений, обеспечивающей непрерывную связь между компонентами.

Надежность виртуализации
Виртуализация является основным механизмом обеспечения работы центра обработки данных. После виртуализации с помощью FusionSphere центр обработки данных поддерживает функции динамической миграции VM и VM HA, обеспечивающие непрерывность работы услуг, а также поддерживает создание мгновенных снимков VM и томов с целью быстрого восстановления системы при возникновении неисправности.
Надежность управления
Все модули управления FusionSphere развертываются для работы в режиме «активный / резервный» или режиме балансировки нагрузки, что обеспечивает высокую надежность системы.
FusionSphere поддерживает контроль физических серверов, программного обеспечения и ресурсов, а также обеспечивает разнообразные возможности обнаружения и устранения неисправностей. FusionSphere собирает информацию об основных показателях работы серверов, таких как коэффициент загрузки ЦП, основной сетевой трафик и данные о памяти. Таким образом он проверяет состояние системы и при обнаружении таких неисправностей, как исключения процессора, отказ каналов управления и хранения, отказ узла или перегрузка ресурсов системы, выдает аварийные сигналы. Эти аварийные сигналы могут сбрасываться системой автоматически или должны своевременно обрабатываться администратором.
Во всех физических серверах системы FusionSphere используется технология «черного ящика», расширяющая возможности устранения отказов. В случае возникновения системных исключений она автоматически сохраняет журналы ядра, мгновенные снимки системы, информацию о диагностике ядра и последние сообщения в энергонезависимом устройстве хранения, таком как вычислительный узел, или выгружает эту информацию в сетевой сервер, например, сервер журналов. Благодаря этой технологии пользователи могут оперативно анализировать журналы «черного ящика», находить причины неисправностей и устранять их.
Все службы OpenStack для обеспечения резервирования развертываются в режиме «активный-активный» или «активный-резервный».
Надежность серверов
В системе FusionSphere надежность серверов обеспечивается следующими мерами:

  • Контроль температуры в реальном времени основных тепловыделяющих и теплоотводящих компонентов, таких как ЦП, память, вентиляторы, источники питания и жесткие диски. При возникновении отказа выдается аварийный сигнал.

  • Интеллектуальный контроль скорости вращения вентиляторов и управление ею.

  • Возможность горячей замены жестких дисков, применение массивов RAID и обнаружение отказов работающих жестких дисков с выдачей предупреждений.

  • Резервирование источников питания по схеме 1+1 и возможность их горячей замены.

Надежность хранения
При виртуализации центров обработки данных обычно применяются централизованные совместно используемые устройства хранения SAN. Huawei FusionSphere поддерживает автономную миграцию хранилища (cold migration) и динамический планировщик ресурсов (DRS; Dynamic Resource Scheduler) на основе операций ввода / вывода хранилища.
FusionSphere также поддерживает для хранилища функцию передачи по нескольким маршрутам (multipathing). Между каждым вычислительным узлом и кластером хранения формируются как минимум два полностью резервированных тракта. Как правило, между VM и устройством хранения устанавливается восемь трактов, что существенно повышает надежность сети хранения.
Кроме этого, для обеспечения надежности физических соединений в устройствах хранения SAN используется не менее двух контроллеров, а для резервного копирования и восстановления данных применяются диски с горячим резервированием.
В системе FusionStorage данные хранятся в виде нескольких одинаковых копий на различных серверах или дисках. Поэтому отказ одного аппаратного устройства не приводит к прерыванию обслуживания. Кроме того, в системе FusionStorage используется высоконадежная технология копирования, обеспечивающая идентичность копий данных.
Надежность сети
Сеть облачного центра обработки данных формируется с физическим резервированием всех сетевых линков. Коммутаторы доступа могут быть объединены в стек для создания резервированных соединений между физическими серверами, агрегирующими коммутаторами и уровнем виртуальной сети. На уровне виртуальной сети не менее двух NIC одного сервера объединяются в логическую NIC, за счет чего предотвращаются прерывания обслуживания по причине отказа одной NIC.
На каждой из плоскостей взаимодействия (услуги, хранение и управление) имеется по две NIC, объединенных в одну логическую NIC и работающих в связанном режиме. Такая структура позволяет разделить трафик доступа между серверами и обеспечивает надежную работу NIC.

В следующей статье мы рассмотрим планирование вычислительных ресурсов, необходимое количество серверов и ресурсов хранения.

ссылка на оригинал статьи https://habrahabr.ru/post/280900/