Лучшие примеры аварийного восстановления ЦОД

Updated on июн 8, 2022 by
1.3k

Хотя предприятия разрабатывают свои планы аварийного восстановления (DR), но надеюсь, им никогда не придется их использовать, бедствия, как правило, бывают внезапными и сильными и приводят к крупномасштабному разрушению. Глобальный опрос центров обработки данных, проведенный Uptime Institute в 2021 году (через Facility Executive), показывает, что перебои в работе, не столь широко распространены, как в предыдущие годы, но стали намного более дорогими. Более 60% респондентов заявили, что потери при перебоях превысили 100,000 долл.

Это делает процесс аварийного восстановления одним из наиболее наукоёмких и финансово важных аспектов для предприятий. Ниже мы перечислили некоторые лучшие планы восстановления перед и после бедствий.

Предшествующее бедствие

Что касается наилучших планов аварийного восстановления, то ничто не может заменить практику обеспечения безопасности данных и работы при прогнозировании бедствий. Хотя у предприятий есть несколько способов восстановить нормальную жизнь в случае катастрофы, лучший метод - это предупреждение. Вот различные способы предотвращения значительного ущерба в случае бедствия.

pre-disaster considerations

Аренда DRaaS

Одной из лучших мер безопасности для предприятий является приобретение ''Аварийное восстановление как услуга''.

Аутсорсинг планов аварийного восстановления представляет собой экономически выгодную и безрисковую альтернативу для предприятий, не имеющих собственного опыта в области ИТ. Несколько компаний, занимающихся облачными вычислениями, предлагают предприятиям услуги DRaaS, которые обеспечивают защиту ваших приложений и данных после бедствия.

Эти компании создают виртуальную копию вашей системы, которая будет активирована, когда ваша локальная система вступит в режим простоя. Это очень важно для ключевых систем, которые не могут позволить себе сбой. Хотя ваша внутренняя инфраструктура может управлять операциями в обычное время, но в случае сбоя она будет заменена вспомогательной виртуальной копией.

Поскольку операции виртуальной копии выполняются в облаке, функция вашего предприятия работает 24*7 круглосуточно, даже если ваша внутренняя архитектура нарушена.

Большинство услуг DRaaS гибко в своих конфигурациях, предлагаемых на нескольких платформах. Прежде чем нанимать лучшую DRaaS для вашего бизнеса, необходимо провести надлежащее исследование.

Автоматизация резервного копирования и развертывание расширенной защиты данных

Недавно появилось несколько передовых мер защиты данных. Наиболее распространенным из них является метод, основанный на программном обеспечении, который включает в себя географическую избыточную облачную копию. Эти копии позволяют вашим бизнесам нормально работать через автоматизацию резервного копирования. В любом случае, ваши данные и операции доступны. Ваши данные и операции остаются доступными независимо от того, какая катастрофа случится.

Резервное программное обеспечение хранит копий документов в нескольких удаленных местах, известных как DR ЦОД, гарантируя, что они изолированы и находятся вдали от места катастрофы. Отличные поставщики услуг по автоматизации резервных копий используют новейшие технологии и обеспечивают, что база данных была расширена до больших размеров, чтобы операции работают в случае необходимости.

Помните, что качество резервного оборудования компании может варьироваться в зависимости от функции. Перед выбором вам необходимо тщательно изучить аппаратные средства и программное обеспечение, связанные с решениями поставщиков.

Разработка подробного плана аварийного восстановления

Предприниматель знает, что секунда простоя может нанести огромный ущерб. Крупная сумма потеряется в каждую секунду простоя.

Лучший способ избежать таких простоев - это профилактика. После бедствия план в голове не может привести к эффективному исполнению. После создания подробного плана аварийного восстановления предприятия должны задокументировать его и отправить копию лицу, ответственному за восстановление работы системы.

Кроме того, в плане должны быть указаны шаги, необходимые для восстановления системы в типичных условиях работы. Было бы полезно, если бы вы не слишком долго зависели от функций резервного копирования в стороннем облаке.

После бедствия

Хотя профилактика - лучший способ лечения, после катастрофы ваша система никогда не будет остаться на 100 % неповрежденной. Вот что вы должны сделать после того, как сбой произошел.

Выявление причины бедствия

После катастрофы сначала нужно выяснить причину. Обычно существует пять общих причин бедствия или сбоя системы:

identifying the disaster cause

Аппаратный сбой

Отказ оборудования является одной из наиболее распространенных причин простоя системы. Яркими примерами являются отказы оборудования хранения данных ЦОД, такого как жесткие диски. Все аппаратные средства в какой-то момент могут выходит из строя. Вот почему компании должны иметь в запасе хорошую резервную копию.

Отключения электричества

Отключение электричества - еще одна возможная причина сбоя системы. Некоторые остановы в конечном счете повредят вашу компьютерную систему, что делает замены неизбежными. В таких случаях предприятия, не имеющие плана аварийного восстановления, могут понести значительные потери.

Стихийные бедствия

Предприятия могут также пострадать от разрыва непрерывности из-за стихийных бедствий, таких, как землетрясения, наводнения и т.д. Хотя остановить землетрясение невозможно, предприятия, имеющие надежные планы аварийного восстановления, могут свести к минимуму потери.

Человеческая ошибка

Человеческие ошибки и неправильная подготовка могут привести к значительным потерям. Простые происшествия, такие как удаление важного документа или невозможность сохранить правильную версию файла, могут привести к ужасным последствиям. Сотрудники должны пройти полную подготовку, с тем чтобы избежать таких ошибок по возможности.

Вредоносное программное обеспечение и вирусы

Убедитесь, что ваши системы полностью зашифрованы и защищены от злоумышленных нападений. Зараженная система может в конечном итоге заразить всю сеть. Компании должны иметь надлежащие контрмеры для защиты себя от вирусов и программ-вымогателей.

Приоритизация идентификации и восстановления критически важных систем

Критически важные системы приводят к наиболее значительным повреждениям во время простоя.

Во избежание паники вы должны заранее подготовить список важнейших систем и восстановить их приоритет. Это поможет подготовить перечень операций, которые могут осуществляться в установленном порядке.

Ваша команда аварийного восстановления должна понимать важность этих задач и приоритеты. Системы должны быть восстановлены в порядке, который приводит к минимальному ущербу и потере дохода.

Расчёт стоимости простоя

Катастрофы неизбежны, и как только они произойдет, вы должны принять перерыв на некоторое время и экономический ущерб, хотя степень серьезности может варьироваться в зависимости от того, насколько хорошо вы подготовлены. Перечень последствий катастрофы, времени простоя и связанных с этим убытков поможет вам ускорить восстановление и принять надлежащие меры по восстановлению системы. Как только узная о степени прерывания, ваши меры по исправлению положения могут быть более сфокусированы на минимизации ущерба.

Тестирование и переоценка систем DR

После локализации системы DR вы должны периодически проводить тесты и системную оценку во избежание каких-либо неожиданных инцидентов в случае следующей катастрофы.

Помните, что проверка вашего плана аварийного восстановления должна быть не только для того, чтобы ваша команда отсканировала документ и отметила его ''правильно''. Ваш план аварийного восстановления может содержать мелкие ошибки, которые не заметят неопытные глаза. Самым определенном действием будет запуск сценариев для проверки эффективности планов восстановления путем введения новых задач. Было бы лучше, если бы вы смогли осуществить процесс восстановления и удостовериться в том, что они не будут разочаровывать.

Вас также может заинтересовать

знаний
знаний
See profile for Sheldon.
Sheldon
TCP/IP vs OSI модель: в чём разница?
май 12, 2022
161.9k
знаний
знаний
See profile for Sheldon.
Sheldon
LACP и PAGP: в чём разница?
фев 22, 2022
11.3k
знаний
See profile for Vincent.
Vincent
Обзор модулей WDM BIDI
май 13, 2021
7.5k
знаний
See profile for Sheldon.
Sheldon
RIP vs OSPF: в чём разница?
июн 7, 2022
22.2k
Подпишитесь, чтобы получать последние новости
Видео
Что клиенты говорят о FS?
01:02
июн 7, 2022
43
Что клиенты говорят о FS?