Три ключа к достижению высокой доступности в вашем локальном центре обработки данных

Для организаций с локальными центрами обработки данных постоянные инвестиции в обеспечение высокой доступности являются ключом к обеспечению надёжной работы служб.
Хотя тенденция к использованию облачной инфраструктуры и гипермасштабных центров обработки данных означает, что предприятия становятся все более зависимыми от третьих лиц в своих ИТ-операциях, недавнее исследование Uptime Institute показало, что 48% североамериканских организаций по-прежнему полагаются на локальные центры обработки данных.
Для этих организаций крайне важно инвестировать в обеспечение высокой доступности и поддерживать её, чтобы гарантировать, что критически важные системы и службы работают должным образом.
Как бизнес-императив, высокая доступность жизненно важна для поддержания непрерывности бизнеса, максимального удовлетворения клиентов и минимизации финансовых потерь. Независимо от того, начинаете ли вы с нуля или отвечаете за существующие системы и критическую инфраструктуру, для достижения высокой доступности необходимо освоить три ключевых шага:
-
Защита физического объекта
-
Создание устойчивой инфраструктуры
-
Выбор правильных операционных инструментов
Физическая безопасность центра обработки данных
Устранение уязвимостей в помещении , где располагается центр обработки данных организации, часто является упускаемым из виду аспектом высокой доступности.
Независимо от того, является ли центр обработки данных отдельной структурой или выделенным пространством в пределах более крупного кампуса, инвестиции в устойчивую ИТ-архитектуру, отличные операционные инструменты и продуманную стратегию реагирования не имеют смысла, если ваша ИТ-инфраструктура подвержена таким проблемам, как злонамеренное вмешательство человека, экологические сбои, отключения электроэнергии или другие катастрофы.
Для предотвращения и минимизации риска подобных предотвратимых некиберинцидентов необходимы меры физической безопасности, в том числе:
-
Камеры видеонаблюдения для мониторинга в реальном времени
-
Строгий контроль доступа для ограничения доступа только уполномоченными лицами
-
Надёжная энергетическая инфраструктура, включая генератор и источник бесперебойного питания (ИБП)
-
Системы газового пожаротушения, такие как FM-200
-
Мониторинг окружающей среды с контролем температуры и влажности
Устойчивая ИТ-архитектура
Краеугольным камнем высокой доступности является избыточность ИТ-инфраструктуры. Выявляя потенциально критические отдельные точки отказа и, где это возможно, обеспечивая возможность переключения на вторичный ресурс, вы можете снизить риск простоя в случае инцидента. Избыточность должна распространяться как на аппаратный, так и на программный уровень.
Реализация отказоустойчивых кластеров, устойчивых сетевых путей, избыточности хранилища с использованием RAID и репликации данных вне площадки для аварийного восстановления являются проверенными стратегиями. Принятие гибридного или многооблачного подхода также может снизить зависимость от любого отдельного поставщика услуг.
Если вы используете внешний центр обработки данных, убедитесь, что он не зависит от того же источника питания, что и ваш основной кампус. Обязательно имейте план аварийного восстановления и обеспечения непрерывности бизнеса, который включает локальное и внешнее резервное хранилище.
Инструменты для обеспечения высокой доступности
Вы защитили свой центр обработки данных и создали устойчивую ИТ-инфраструктуру. Теперь пришло время убедиться, что все работает так, как вам нужно. Это означает выбор инструментов, которые позволят вам реагировать на инциденты и выполнять планы реагирования, как и предполагалось, использовать автоматизацию, где это возможно, и принимать правильные решения в условиях давления, когда что-то пошло не так.
Поскольку для принятия правильных решений требуются правильные данные, первым шагом является инвестирование в инструменты управления ИТ-операциями, которые отлично справляются с обнаружением сетевых активов, сбором их данных и обновлением базы данных управления конфигурацией (CMDB).
Инструменты мониторинга производительности приложений (APM), созданные на основе точных данных, являются хорошим выбором для получения точного понимания состояния работоспособности систем, входящих в сеть. APM и платформы мониторинга сети предоставляют ИТ-менеджерам информацию для принятия своевременных решений по эксплуатационным вопросам, таким как обслуживание, балансировка нагрузки и реагирование на инциденты. Это важно для поддержания высокой доступности (HA), поскольку неправильные решения увеличивают риск сбоев в обслуживании в результате предотвратимого сбоя системы.
Независимо от того, является ли ваша инфраструктура локальной, облачной или гибридной, другим ключевым компонентом для достижения высокой доступности является создание отказоустойчивых кластеров для упрощения — и даже автоматизации — перемещения сервисов и рабочих нагрузок на вторичный ресурс. Независимо от того, аппаратные (на основе SAN) или программные (без SAN), кластеры поддерживают плавное отказоустойчивое переключение сервисов для резервного копирования ресурсов и обеспечения непрерывности в случае серьёзного снижения производительности или инцидента сбоя.
Предприятия сегодня склонны отдавать предпочтение кластерам SANless с высокой доступностью из-за их гибкости при работе в ИТ-средах, которые в большей степени зависят от облачных систем и сервисов, виртуальных машин и программного обеспечения. Кластеры SANless предлагают ту же функциональность, что и устаревшие кластеры SAN, но с большей гибкостью и меньшей стоимостью. Более того, кластеры SANless поддерживают локальную , облачную или гибридную инфраструктуру и могут поддерживать географически распределенные центры обработки данных, что является ключевым фактором в обеспечении устойчивости сети и планировании действий на случай стихийных бедствий.
Поддержание услуг в режиме онлайн
Благодаря таким тенденциям, как гипермасштабные центры обработки данных, репатриация облачных рабочих нагрузок и цифровая трансформация, для современных менеджеров по ИТ-операциям многое меняется.
Однако одним из постоянных требований является сохранение доступности услуг для пользователей и предотвращение простоев. Планирование, включающее физическую безопасность, устойчивую архитектуру и высокую доступность, позволит вам поддерживать удовлетворенность пользователей и клиентов.
Автор Константин Романов
Контакты, администрация и авторы