Проектирование и внедрение центра обработки данных для критически важной инфраструктуры
Клиент
Крупный оператор транспортной инфраструктуры Российской Федерации
(железнодорожные и автомобильные грузоперевозки).
Исходная задача
На этапе стартапа клиенту требовалась ИТ-инфраструктура для обработки данных от тысяч телематических устройств — датчиков, сенсоров и систем контроля — с возможностью быстрого масштабирования и высоким уровнем отказоустойчивости для критически важных сервисов.
Необходимо было создать современный центр обработки данных, который способен:
в реальном времени обрабатывать огромные массивы данных;
гарантировать бесперебойную работу сервисов;
соответствовать строгим требованиям регуляторов по информационной безопасности.
Ключевые цели проекта
В рамках проекта были определены следующие цели:
Обеспечение бесперебойности (99,98% доступности)
Минимизация простоев критических систем управления и мониторинга.
Масштабируемость
Возможность бесшовного наращивания мощностей для подключения новых устройств в будущем.
Обработка данных в реальном времени
Создание платформы для приема и обработки данных с более чем 30 000 телематических устройств одновременно.
Повышение безопасности
Соответствие требованиям ФСТЭК, ФСБ и других регуляторов для критической информационной инфраструктуры (КИИ).
Ускорение разработки
Создание изолированных сред для тестирования и разработки без влияния на продуктивный контур.
Реализованное решение: архитектура ЦОД
Командой «Вектор Инжиниринг» была спроектирована и внедрена высокодоступная кластерная архитектура ЦОД, состоящая из трёх логически и физически разделённых контуров.
Продуктивный контур (Production)
Контур предназначен для работы критически важных приложений и обработки данных в реальном времени.
Реализация:
отказоустойчивый кластер серверов и систем хранения данных (СХД);
автоматическое переключение (failover) в случае сбоя;
горизонтальная масштабируемость;
использование высокопроизводительных брокеров сообщений.
Контур обеспечивает одновременную обработку данных с более чем 30 000 устройств.
Контур тестирования (Testing / Staging)
Контур представляет собой полную аппаратную и логическую копию продуктивного контура (в меньшем масштабе).
Назначение:
проведение нагрузочного тестирования;
интеграционное тестирование новых версий ПО и обновлений;
исключение рисков для основной инфраструктуры.
Контур разработки (Development)
Изолированная среда для:
создания новых сервисов;
отладки алгоритмов;
быстрого развертывания виртуальных сред.
Контур не влияет на работу продуктивных сервисов и позволяет вести параллельную разработку.
Отличительные особенности и реализованные технологии
Кластерная модель высокой доступности
Все ключевые компоненты (серверы, СХД, сетевое оборудование) задублированы и объединены в кластеры.
Исключены единые точки отказа.
Обеспечено выполнение SLA на уровне 99,99%.
Система мониторинга собственной разработки
Вместо готовых решений была разработана специализированная система мониторинга, адаптированная под задачи клиента.
Преимущества решения:
адаптация под уникальные метрики клиента (специфичные протоколы телематики, параметры устройств);
высокая производительность сбора данных в реальном времени;
глубокая кастомизация оповещений;
возможность прогнозирования сбоев.
Многоуровневая система защиты
Физический уровень
контроль доступа в дата-центр.
Сетевой уровень
сегментация сети (VLAN, микросегментация);
межсетевые экраны нового поколения (NGFW);
системы обнаружения и предотвращения вторжений (IDS/IPS).
Программный уровень
защита от DDoS-атак;
строгий контроль доступа на основе ролей (RBAC);
шифрование данных на лету и в состоянии покоя.
Результаты и достигнутые эффекты
Повышение отказоустойчивости
Достигнута доступность ключевых сервисов на уровне 99,99%, что соответствует мировым стандартам для критической инфраструктуры.
Обработка Big Data
ЦОД стабильно обрабатывает данные с 30 000+ устройств с минимальной задержкой, обеспечивая руководство актуальной аналитикой для принятия управленческих решений.
Масштабируемость
Инфраструктура позволяет:
увеличивать вычислительные мощности;
подключать новые устройства
без кардинального изменения архитектуры.
Ускорение вывода новых сервисов
Разделение контуров позволило сократить время выхода обновлений на 40%, так как разработка и тестирование стали параллельными и независимыми процессами.
Соответствие требованиям
Решение полностью соответствует строгим стандартам безопасности для объектов КИИ Российской Федерации.