Вектор проекты

Построение отказоустойчивого ЦОД для оператора транспортной инфраструктуры РФ

Проектирование и построение ИТ-инфраструктуры
Проектирование и внедрение центра обработки данных для критически важной инфраструктуры

Клиент

Крупный оператор транспортной инфраструктуры Российской Федерации
(железнодорожные и автомобильные грузоперевозки).

Исходная задача

На этапе стартапа клиенту требовалась ИТ-инфраструктура для обработки данных от тысяч телематических устройств — датчиков, сенсоров и систем контроля — с возможностью быстрого масштабирования и высоким уровнем отказоустойчивости для критически важных сервисов.
Необходимо было создать современный центр обработки данных, который способен:
  • в реальном времени обрабатывать огромные массивы данных;
  • гарантировать бесперебойную работу сервисов;
  • соответствовать строгим требованиям регуляторов по информационной безопасности.

Ключевые цели проекта

В рамках проекта были определены следующие цели:
  • Обеспечение бесперебойности (99,98% доступности)
  • Минимизация простоев критических систем управления и мониторинга.
  • Масштабируемость
  • Возможность бесшовного наращивания мощностей для подключения новых устройств в будущем.
  • Обработка данных в реальном времени
  • Создание платформы для приема и обработки данных с более чем 30 000 телематических устройств одновременно.
  • Повышение безопасности
  • Соответствие требованиям ФСТЭК, ФСБ и других регуляторов для критической информационной инфраструктуры (КИИ).
  • Ускорение разработки
  • Создание изолированных сред для тестирования и разработки без влияния на продуктивный контур.

Реализованное решение: архитектура ЦОД

Командой «Вектор Инжиниринг» была спроектирована и внедрена высокодоступная кластерная архитектура ЦОД, состоящая из трёх логически и физически разделённых контуров.

Продуктивный контур (Production)

Контур предназначен для работы критически важных приложений и обработки данных в реальном времени.
Реализация:
  • отказоустойчивый кластер серверов и систем хранения данных (СХД);
  • автоматическое переключение (failover) в случае сбоя;
  • горизонтальная масштабируемость;
  • использование высокопроизводительных брокеров сообщений.
Контур обеспечивает одновременную обработку данных с более чем 30 000 устройств.

Контур тестирования (Testing / Staging)

Контур представляет собой полную аппаратную и логическую копию продуктивного контура (в меньшем масштабе).
Назначение:
  • проведение нагрузочного тестирования;
  • интеграционное тестирование новых версий ПО и обновлений;
  • исключение рисков для основной инфраструктуры.

Контур разработки (Development)

Изолированная среда для:
  • создания новых сервисов;
  • отладки алгоритмов;
  • быстрого развертывания виртуальных сред.
Контур не влияет на работу продуктивных сервисов и позволяет вести параллельную разработку.

Отличительные особенности и реализованные технологии

Кластерная модель высокой доступности

  • Все ключевые компоненты (серверы, СХД, сетевое оборудование) задублированы и объединены в кластеры.
  • Исключены единые точки отказа.
  • Обеспечено выполнение SLA на уровне 99,99%.

Система мониторинга собственной разработки

Вместо готовых решений была разработана специализированная система мониторинга, адаптированная под задачи клиента.
Преимущества решения:
  • адаптация под уникальные метрики клиента (специфичные протоколы телематики, параметры устройств);
  • высокая производительность сбора данных в реальном времени;
  • глубокая кастомизация оповещений;
  • возможность прогнозирования сбоев.

Многоуровневая система защиты

Физический уровень
  • контроль доступа в дата-центр.
Сетевой уровень
  • сегментация сети (VLAN, микросегментация);
  • межсетевые экраны нового поколения (NGFW);
  • системы обнаружения и предотвращения вторжений (IDS/IPS).
Программный уровень
  • защита от DDoS-атак;
  • строгий контроль доступа на основе ролей (RBAC);
  • шифрование данных на лету и в состоянии покоя.

Результаты и достигнутые эффекты

Повышение отказоустойчивости

Достигнута доступность ключевых сервисов на уровне 99,99%, что соответствует мировым стандартам для критической инфраструктуры.

Обработка Big Data

ЦОД стабильно обрабатывает данные с 30 000+ устройств с минимальной задержкой, обеспечивая руководство актуальной аналитикой для принятия управленческих решений.

Масштабируемость

Инфраструктура позволяет:
  • увеличивать вычислительные мощности;
  • подключать новые устройства
  • без кардинального изменения архитектуры.

Ускорение вывода новых сервисов

Разделение контуров позволило сократить время выхода обновлений на 40%, так как разработка и тестирование стали параллельными и независимыми процессами.

Соответствие требованиям

Решение полностью соответствует строгим стандартам безопасности для объектов КИИ Российской Федерации.