Проектирование и внедрение центра обработки данных для критически важной инфраструктуры
Клиент
Крупный оператор транспортной инфраструктуры Российской Федерации
(железнодорожные и автомобильные грузоперевозки).
Исходная задача
На этапе стартапа клиенту требовалась ИТ-инфраструктура для обработки данных от тысяч телематических устройств — датчиков, сенсоров и систем контроля — с возможностью быстрого масштабирования и высоким уровнем отказоустойчивости для критически важных сервисов.
Необходимо было создать современный центр обработки данных, который способен:
- в реальном времени обрабатывать огромные массивы данных;
- гарантировать бесперебойную работу сервисов;
- соответствовать строгим требованиям регуляторов по информационной безопасности.
Ключевые цели проекта
В рамках проекта были определены следующие цели:
- Обеспечение бесперебойности (99,98% доступности)
- Минимизация простоев критических систем управления и мониторинга.
- Масштабируемость
- Возможность бесшовного наращивания мощностей для подключения новых устройств в будущем.
- Обработка данных в реальном времени
- Создание платформы для приема и обработки данных с более чем 30 000 телематических устройств одновременно.
- Повышение безопасности
- Соответствие требованиям ФСТЭК, ФСБ и других регуляторов для критической информационной инфраструктуры (КИИ).
- Ускорение разработки
- Создание изолированных сред для тестирования и разработки без влияния на продуктивный контур.
Реализованное решение: архитектура ЦОД
Командой «Вектор Инжиниринг» была спроектирована и внедрена высокодоступная кластерная архитектура ЦОД, состоящая из трёх логически и физически разделённых контуров.
Продуктивный контур (Production)
Контур предназначен для работы критически важных приложений и обработки данных в реальном времени.
Реализация:
- отказоустойчивый кластер серверов и систем хранения данных (СХД);
- автоматическое переключение (failover) в случае сбоя;
- горизонтальная масштабируемость;
- использование высокопроизводительных брокеров сообщений.
Контур обеспечивает одновременную обработку данных с более чем 30 000 устройств.
Контур тестирования (Testing / Staging)
Контур представляет собой полную аппаратную и логическую копию продуктивного контура (в меньшем масштабе).
Назначение:
- проведение нагрузочного тестирования;
- интеграционное тестирование новых версий ПО и обновлений;
- исключение рисков для основной инфраструктуры.
Контур разработки (Development)
Изолированная среда для:
- создания новых сервисов;
- отладки алгоритмов;
- быстрого развертывания виртуальных сред.
Контур не влияет на работу продуктивных сервисов и позволяет вести параллельную разработку.
Отличительные особенности и реализованные технологии
Кластерная модель высокой доступности
- Все ключевые компоненты (серверы, СХД, сетевое оборудование) задублированы и объединены в кластеры.
- Исключены единые точки отказа.
- Обеспечено выполнение SLA на уровне 99,99%.
Система мониторинга собственной разработки
Вместо готовых решений была разработана специализированная система мониторинга, адаптированная под задачи клиента.
Преимущества решения:
- адаптация под уникальные метрики клиента (специфичные протоколы телематики, параметры устройств);
- высокая производительность сбора данных в реальном времени;
- глубокая кастомизация оповещений;
- возможность прогнозирования сбоев.
Многоуровневая система защиты
Физический уровень
- контроль доступа в дата-центр.
Сетевой уровень
- сегментация сети (VLAN, микросегментация);
- межсетевые экраны нового поколения (NGFW);
- системы обнаружения и предотвращения вторжений (IDS/IPS).
Программный уровень
- защита от DDoS-атак;
- строгий контроль доступа на основе ролей (RBAC);
- шифрование данных на лету и в состоянии покоя.
Результаты и достигнутые эффекты
Повышение отказоустойчивости
Достигнута доступность ключевых сервисов на уровне 99,99%, что соответствует мировым стандартам для критической инфраструктуры.
Обработка Big Data
ЦОД стабильно обрабатывает данные с 30 000+ устройств с минимальной задержкой, обеспечивая руководство актуальной аналитикой для принятия управленческих решений.
Масштабируемость
Инфраструктура позволяет:
- увеличивать вычислительные мощности;
- подключать новые устройства
- без кардинального изменения архитектуры.
Ускорение вывода новых сервисов
Разделение контуров позволило сократить время выхода обновлений на 40%, так как разработка и тестирование стали параллельными и независимыми процессами.
Соответствие требованиям
Решение полностью соответствует строгим стандартам безопасности для объектов КИИ Российской Федерации.