Отказоустойчивость на уровне инфраструктуры

В инструкции рассматривается как повысить отказоустойчивость клиентского сервиса на физическом уровне.

Отказоустойчивость — свойство сервиса сохранять работоспособность и продолжать выполнение бизнес-задач даже в случае выхода из строя отдельных компонентов IT-инфраструктуры.

Степень отказоустойчивости сервиса зависит от типа выполняемых задач. Необходимость повышения отказоустойчивости появляется, когда ущерб от простоя превышает затраты на обеспечение бесперебойной работы. Например, с помощью сервиса предоставляется непрерывный доступ к важной информации, или сама работа компании напрямую зависит от бесперебойной работы IT-инфраструктуры.

Что обеспечивает Selectel

Selectel обеспечивает отказоустойчивость клиентского сервиса на уровне серверного зала, в котором стоят стойки с серверами. Для этого:

  • в серверный зал поступают вводы электропитания, зарезервированные на более высоких уровнях (трансформаторные подстанции Selectel; промышленные ИБП включающие АКБ; аварийный источник электроснабжения — ДГУ), далее, к каждой стойке подводится два независимых ввода питания:

    • для серверов с одним блоком питания в стойки устанавливаются АВР (устройства автоматического ввода резерва), к которым подведены два независимых ввода питания, при отключении одного ввода электричество продолжит поступать по второму;

    • для серверов с двумя блоками питания их подключение выполняется в два независимых блока розеток;

  • резервируется доступ к локальной и интернет-сети на уровне коммутатора агрегации (и выше), а также:

    • для серверов готовой конфигурации в каждой стойке устанавливаются коммутаторы доступа для локальной сети и интернет-коммутаторы;

    • для серверов линейки Chipcore подключение к локальной сети отсутствует, в каждой стойке устанавливаются только интернет-коммутаторы;

    • для серверов произвольной конфигурации резервирование подключения к нужной сети (локальной или интернет) определяется клиентом;

  • если есть техническая возможность, при заказе двух и более серверов они располагаются в разных стойках. Примечание: Просмотреть текущее расположение серверов и отправить запрос на перенос сервера в другую стойку можно в панели управления, раздел Серверы и оборудование ⟶ Серверы, вкладка Расположение серверов. Подробнее в инструкции Расположение по стойкам.

Повышение отказоустойчивости сервиса

Повысить отказоустойчивость клиентского сервиса на физическом уровне можно снижением количества вероятных точек отказа. При построении IT-инфраструктуры вероятными точками отказа могут стать:

  • сам сервер и его комплектующие (диски, блоки питания, сетевые интерфейсы и пр.);
  • АВР (устройства автоматического ввода резерва);
  • коммутатор доступа в интернет и коммутация (медное и оптическое соединение, трансиверы, патч-корды и пр.);
  • коммутатор доступа в локальную сеть и коммутация.

Отказоустойчивость на уровне стойки

Для снижения количества вероятных точек отказа на уровне стойки можно:

  • выбирать серверы произвольных и готовых конфигураций с серверными процессорами. В таких серверах все комплектующие оптимизированы под высокую нагрузку и бесперебойную работу и с меньшей степенью вероятности могут выйти из строя;
  • использовать конфигурацию сервера с двумя и более блоками питания. Такой способ резервирования питания является более надежным, так как не имеет единой точки отказа. Выход из строя одного из блоков питания или АВР не приведет к отключению сервера;
  • для серверов произвольной конфигурации резервировать подключение к коммутаторам доступа нужной сети (локальной или интернет) через MC-LAG;

Отказоустойчивость клиентского сервиса, состоящего из нескольких серверов

Для снижения количества вероятных точек отказа клиентского сервиса, размещенного на нескольких серверах, можно: