Управление инфраструктурой центров обработки данных

Управление инфраструктурой центров обработки данных (ЦОД) (DCIM – Data Center Infrastructure Management) не новое, но набирающее силу направление в развитии ИТ индустрии (по оценкам 451 Research мировой оборот систем DCIM вырастет с $450 млн. до $1.2 млрд. в 2015), которое связано с значительным ростом количества корпоративных ЦОД-ов и процессом консолидации в индустрии коммерческих ЦОД-ов. Основными целями решений в этом направлении является максимизация использования ресурсов ЦОД, повышение эффективности службы эксплуатации и, как следствие, достижение наилучших показателей по стоимости владения ЦОД. В контексте DCIM под ресурсами ЦОД понимаются как ИТ активы: сервера, системы хранения, сетевое оборудование, так и ресурсы ЦОД, обеспечивающие работу ИТ активов: строительные (серверные помещения), инженерные системы, системы энергообеспечения и сама электроэнергия, системы поддержания необходимых параметров среды помещений ЦОД. 

     В решениях DCIM обычно выделяют следующие большие функциональные области:
 

  • Инвентаризация, визуализация и управление активами. Что имеется в ЦОДе (монтажные шкафы, серверы, сетевое оборудование), как расположено оборудование, как организованы соединения, параметры и характеристики каждого устройства.
  • Планирование изменений в ЦОД. Любое изменение в высоконагруженном ЦОДе (установка нового шкафа, сервера, перемещение оборудования из шкафа в шкаф и т.д.) вызывает целый ряд проблем, связанных с определением возможности и осуществлением такого изменения. Очень много факторов влияют на решение – наличие места в шкафу, наличие резерва электропитания, охлаждения, свободных портов в PDU и коммутаторе и т.д. Многочисленные изменения требуют аккуратного планирования и бронирования ресурсов под каждый такой проект.
  • Контроль и управление энергопотреблением ЦОДов. Чем ближе измеритель потребляемой мощности к нагрузке, обеспечивающей работу ИТ сервиса и чем больше таких измерителей, тем точнее карта энергопотребления ЦОДа. Точные данные по энергопотреблению позволяют рассчитывать коэффициенты энергоэффективности (например, PUE), планировать размещение ИТ активов так, чтобы не возникало перегрузки энергетической системы или точек повышенной теплоотдачи (hot-spot), отслеживать тенденции.
  • Мониторинг рабочей среды серверных помещений и организация системы оповещения и противодействия в случаях аварийных ситуаций.
  • Обеспечение удаленного доступа к ИТ-оборудованию для оперативного управления и устранения проблем;
  • Мониторинг и управления критичной физической инфраструктурой в ЦОД, к которой можно отнести системы обеспечения бесперебойного питания (генераторы, ИБП), системы охлаждения и вентиляции.
  • Формализация регламентов по внесению изменений в ЦОД – позволяет точно описать логическую и временную схему заданий каждому сотруднику ЦОД для реализации какого-либо изменения в ЦОД (инсталляция, перенос, вывод из эксплуатации, и т.д.).

     Хорошо функционирующая система DCIM позволяет поднять эффективность — минимизировать стоимость ИТ сервиса в пересчете на одного пользователя в единицу времени и в долгосрочной перспективе, и обеспечить надежность функционирования ЦОД — гарантировать требуемый уровень обслуживания (SLA) пользователей, существенно снизить капитальные и операционные расходы на строительство, модернизацию и эксплуатацию ЦОД.
 

     Все вышесказанное в полной мере относится к решениям компании Avocent (подразделение Emerson) по управлению инфраструктурой ЦОД, имеющей более чем 20-и летний опыт разработок в этой области ИТ.
 

     В настоящее время с развитием технологий виртуализации и облачных вычислений стандартный подход к управлению проектированием, строительством и эксплуатацией центров обработки данных на трех независимых уровнях: ИТ сервисы, ИТ оборудование, инженерное оборудование, представляется статичным и уже не соответствующим процессам, происходящим в ИТ отрасли.
 

     Компания Avocent предлагает реализацию комплексного подхода к ЦОД как к ИТ экосистеме, требующей управления. 

 

Рисунок 1. ЦОД – ИТ экосистема
 

     Платформа Avocent (Emerson) Trellis представляет собой инновационный программно-аппаратный комплекс управления инфраструктурой ЦОД. Это платформа, обеспечивающая совместную работу различных функциональных модулей комплекса, специализированных устройств сбора информации из разных источников и устройств обеспечения доступа к портам управления ИТ и инженерного оборудования ЦОД производства компании Avocent (Emerson). 

 

Рисунок 2. Архитектура Trellis
 

      Аппаратным компонентом платформы DCIM Trellis является устройство UMG (Universal Management Gateway) (Рисунок 3). Universal Management Gateway занимает роль основного связующего звена между программными модулями управления и мониторинга с одной стороны и физической инфраструктурой с другой, обеспечивая непрерывный сбор данных и управление с обратной связью для инженерного оборудования, вычислительных и сетевых средств. Устройство UMG взаимодействует с системами электропитания, охлаждения, датчиками параметров среды и оборудованием ИТ, собирая, унифицируя и передавая необходимую информацию в соответствующие функциональные модули платформы Trellis. Это позволяет контролировать состояние ЦОД, а также обеспечивает доступ и управление ИТ и инженерными системами в реальном времени. 

 

Рисунок 3. UMG-универсальный шлюз управления
 

     Основными задачами UMG являются: 

  • Мониторинг и сбор данных:
    • С датчиков параметров среды серверных помещений ЦОД;
      • С портов сервисных процессоров ИТ активов;
    • С оборудования инженерной инфраструктуры;
  • Удалённое управление активами ЦОД (Доступ/Управление) через:
    • Цифровой KVM;
    • Доступ Serial over IP;
    • Управление через Service Processor.

     Внешний вид устройства UMG представлен на рисунке 4. 

 

Рисунок 4. Устройство UMG 6000
 

     На текущий момент выпускаются модели устройства UMG со следующими характеристиками: 

 

     Основные характеристики UMG. 

     Поддержка сервисных процессоров: 

  • IPMI 1.5 (+ non-standard SoL), IPMI 2.0;
  • HP iLO — iLO3, IPMI, HP Blade System
  • Dell DRAC4, 5, Dell BladeCenter, DRAC MC, DELL 10G, M1000e Blade Chassis Controller, Blade Chassis Management Controller/iDRAC for blades/iDRAC6 for blades;
  • Cisco UCS-C Rack Mount servers;
  • FSC iRMC, iRMC S2;
  • IBM RSA (RSA II), IBM BladeCenter;
  • Sun ALOM, Sun ILOM, Sun eLOM;

     Управление серверами: 

  • Консольный доступ Serial&KVM over IP;
  • Логирование консольных сессий (local, NFS, Syslog);
  • Поддержка управления питанием через управляемые PDU;
  • Graceful shutdown (для IPMI);
  • System event logs (SEL);
  • Hardware environmental sensors;
  • Alert management;
  • Platform event traps (PET);

     Поддержка протоколов инженерного оборудования: 

  • BACNET;
  • Modbus;
  • SNMP;
  • Velocity;

     Интерфейсы и соединения: 

  • 40xRJ45 портов с автоматической настройкой (искл. UMG2000, 32xSP + 8x авто);
  • Цифровые входы для совместимых сенсоров (температура, влажность, сухие контакты, движение, задымление);
  • Цифровые выходы для удаленного управления;
  • Совместимые сенсоры: серия Liebert SN;

     Пользовательский интерфейс: 

  • Встроенный графический и веб- интерфейсы;
  • Управление через DSView и Trellis;
  • Командный интерфейс SSH;
  • Локальная KVM консоль.

     Программная часть платформы Trellis в настоящее время включает следующие основные функциональные модули:
 

  • Trellis Platform Services – программная платформа, обеспечивающая совместную работу функциональных модулей Trellis.
  • Trellis Inventory Manager – дает возможность администраторам создавать точные и полные модели своих ЦОД, в том числе местоположение устройств и оборудования, взаимодействие этих компонентов, и ресурсов, используемых оборудованием ЦОД.
  • Trellis Site Manager – информирует персонал о состоянии инфраструктуры, включая климатические условия, распознает и решает проблемы, влияющие на производительность системы.
  • Trellis Change Planner – позволяет отслеживать и планировать изменения в ЦОД.
  • Trellis Energy Insight – позволяет легко получать отчёты по уровням потребления энергии любым объектом.

     В планах компании расширение функционала Trellis следующими модулями:
 

  • Trellis Power System Manager — просмотр ресурсов и утилизации систем энергоснабжения, повышение уровня знания об активных цепях электропитания, состояния каждого устройства энергетической системы ЦОД, понимание зависимостей в энергетической системе ЦОД, визуализация агрегированного состояния и ресурсов устройств питания, работающих параллельно.
  • Trellis Mobile suite – расширение платформы Trellis, набор приложений для управления ЦОД с мобильных устройств.
  • Trellis Process Manager — создание и оптимизация процессов и процедур по управлению ЦОД.
  • Trellis Cooling Systems Manager — контроль ресурсов и запасов по охлаждению.
  • Virtual Insight Manager – управление виртуальной инфраструктурой ЦОД.

     Начиная со второго релиза системы (лето 2013) будет добавлен API, который позволит эффективно встраивать DCIM в комплекс систем функционирования компании и ЦОД, например, синхронизировать с CMDB (для автоматизации загрузки первоначальных данных по оборудованию), Asset Manager, Service Desk, 1C, BMS (если мониторинг осуществляется внешней системой) и др. системами.
 

Trellis Inventory Manager

Функционал:
 

  • Ведение базы активов ЦОД;
  • Визуальная конфигурация актива, планировки помещения, возможность просматривать и редактировать различные срезы помещения (подпольное пространство, пол, потолок,…);
  • Библиотека образов для всех типов устройств с возможностью добавления любого недостающего устройства (выполняет Avocent);
  • Поиск расположения актива (ов) внутри ЦОД по любым параметрам;
  • Визуальные планы размещения в ЦОД и в отдельной стойке;
  • Описание силовых и сетевых соединений, возможность отслеживания цепочки силового подключения, от устройства до генератора, анализа соответствия заданным стандартам.

     Преимущества:
 

  • Позволяет быстрее находить любую единицу оборудования;
  • Позволяет администратору ЦОД быстро принимать решения по размещению нового оборудования;
  • Даёт менеджеру ЦОД моментальный обзор по установленному оборудованию, используемым ресурсам и доступным ресурсам, основываясь на информации о реальном энергопотреблении оборудования;
  • Позволяет оценивать правильность подключений на предмет соответствия стандартам отказоустойчивости, принятых в данном ЦОДе

Trellis Site Manager

Функционал:
 

  • Сбор оповещений и тревожных сообщений и информирование соответствующих служб и ответственного персонала;
  • Сбор и анализ данных в реальном времени;
  • Цветовое отображение статуса устройств;
  • Настройка и сбор отчётов по энергетике по зонам или отдельным шкафам.

     Преимущества:
 

  • Обеспечит наиболее эффективное использование персонала, расставляя фокусы на основные проблемы;
  • Уменьшает время на обнаружение и устранение проблем, связанных с критичными инфраструктурными устройствами, статистические данные по всем параметрам оборудования позволяют быстро анализировать причины возникшей проблемы и принимать решения по ее устранению;
  • Позволяет анализировать за конкретный период, какие проблемы возникали, их причины и скорости их ликвидации.

Trellis Change Planner

Функционал:
 

  • Моделирование изменений в ЦОД;
  • Планирование основных активностей в ЦОД;
  • Отслеживание и управление взаимосвязями;
  • Анализ истории изменений.

     Преимущества:
 

  • Даёт техническому персоналу чёткие инструкции и последовательность действий для реализации действий по изменению в ЦОД;
  • Позволяет эксплуатационной службе ЦОД чётко планировать будущее использование ресурсов, заранее предвидеть момент исчерпания того или другого ресурса;
  • Помогает обосновывать будущие потребности для руководства;
  • Помогает планировать использование ресурсов наиболее оптимальным образом, минимизирует риски создания точек перегрева или перегрузки энергетической системы;
  • Значительно сокращает время на внесение изменений.

Trellis Energy Insight

Функционал:
 

  • Отчёты по потреблению энергии и операционной эффективности;
  • Метрики эффективности ЦОД, включая PUE;
  • Потребление электроэнергии (kВт/час) и ее стоимость;
  • Потери в подсистемах.

     Преимущества:
 

  • Выявление неэффективных зон в эксплуатации ЦОД и получение рекомендаций по улучшению производительности;
  • Текущие и исторические показатели метрик эффективности (PUE and DCiE);
  • Отчёты по стоимости потребляемой электроэнергии в подсистемах;
  • Расчет необходимого бюджета на электроэнергию и другие затраты (например, топливо для дизель-генератора)

Trellis Power System Manager

Функционал:
 

  • Взаимосвязи в электро-оборудовании, представление однолинейной схемы энергосистемы;
  • Энергосистема – утилизация ресурсов и мощности;
  • Статус подключённых компонентов электро-цепей.

Преимущества:
 

  • Обзор доступных ресурсов энергосистемы, степени утилизации и доступных мощностей;
  • Обзор активных электро-цепей и статус каждого компонента энергосистемы;
  • Понимание взаимосвязей в энергосистеме, таблицы зависимости ИТ-оборудования от каждой компоненты энергосистемы;
  • Визуализация функционирования параллельных энергосистем (общий статус и доступные ресурсы);
  • Возможность параллельного анализа исторических данных функционирования компонент энергосистемы

Trellis Process Manager

Функционал:
 

  • Планирование регламентов для реализации изменений в ЦОД, расписывание ролей персонала и последовательности операций;
  • Минимизация инцидентов при внесении изменений, связанных человеческим фактором;
  • Предотвращает ошибки и обеспечивает совместимость со стандартами;

     Преимущества:
 

  • Повышает операционную эффективность;
  • Управление сложными процессами в ЦОД;
  • Отслеживание истории изменений для анализа связанных с этим инцидентов и обеспечения совместимости со стандартами индустрии.

Trellis Cooling Systems Manager

Функционал:
 

  • Комплексная картина функционирования систем охлаждения и их утилизации;
  • Понимание режима работы и статуса каждого компонента системы охлаждения;
  • Отчёт о наличии ресурсов системы, используемых и неиспользуемых мощностях.

     Преимущества:
 

  • Быстрый доступ к информации о наличии, установленных мощностях и утилизации имеющихся ресурсов системы охлаждения;
  • Оперативная картина по статусам каждого компонента системы охлаждения;
  • Чёткое понимание по взаимосвязям внутри системы охлаждения и зависимости ИТ-оборудования от компонент системы охлаждения.

Virtual Insight Manager

Функционал:
 

  • Инвентаризация виртуальных машин поверх физических хостов;
  • Определение потребляемых виртуальной машиной ресурсов – электроэнергии, систем охлаждения, ресурсов хоста;
  • Проактивный мониторинг и предупреждение ситуаций, связанных с нехваткой ресурсов;
  • Визуализация состояния и зависимостей.

     Преимущества:
 

  • Быстрое определение локации виртуальной машины в ЦОД (хост, расположение хоста в ЦОД);
  • Понимание наличия доступных ресурсов (мощность, охлаждение, вес, место в шкафу) на физическом хосту и предупреждение потенциальных проблем, связанных с перегрузкой;

Trellis Mobile suite

Функционал:
 

  • Инновационные технологии сканирования и распознавания штрих-кодов оборудования ЦОД;
  • Обновление информации на мобильном устройстве в реальном времени;
  • Быстрый поиск шкафа и устройства в ЦОД;
  • Просмотр отчетов Trellis в реальном времени;
  • Быстрый доступ к данным о ресурсах и портах устройства;
  • Просмотр и обновление силовых соединений;
  • Доступ к портам управления ИТ оборудования.

     Преимущества: 

  • Эффективное использование персонала ЦОД;
  • Сокращение сроков восстановления после сбоев;
  • Оперативность получения информации.



Поделиться информацией

Вы можете послать эту статью или новость коллеге или знакомому по email со своим комментарием, пригласить обсудить ее. Просто нажмите на иконку конверта --->


Сообщения, вопросы и ответы

Вы можете задать вопрос, написать комментарий, обсудить данную новость или статью.

Ваше сообщение (вопрос, ответ, комментарий)