Скачок напряжения в сети вызвал остановку работы датацентра компании NaviSite

В середине января произошла остановка работы датацентра, находящемся в Силиконовой долине, в компании NaviSite. Представители компании указали в качестве причины сбоя центра обработки данных (ЦОД) компании бросок напряжения в сети, который вывел из строя реле переключателей электропитания, лишив возможности автоматического включения резерва электроснабжения от генератора.

     "Генераторы не получили сигнал на включение сразу после отключения основной системы электроснабжения", сказала Клодин Бьянчи, главный маркетолог компании NaviSite. «Нашему специалисту пришлось вручную запускать генераторы и переключать нагрузку».

     Весь ЦОД был отключен от системы электроснабжения в течение 40 минут. Ровно столько времени потребовалось для отправки главного электрика на объект. Сотрудник компании, прибыв на место вручную включил генераторы.

     В поисках способов повышения устойчивости инфраструктуры системы электроснабжения и обеспечения автоматического переключения источников питания в случае возникновения подобных ситуаций в будущем компания NaviSite уже приняла решение, необходимость в котором стала очевидной после произошедшего случая.

     «Мы увеличили штат сотрудников в датацентре и теперь на объекте есть специалист, которые может вручную включить генераторы», — сообщила Бьянчи -"теперь на объекте будет круглосуточно находиться квалифицированный электрик".

     Этому событию предшествовало отключение электроснабжения на территории большой географической области в районе Сан-Хосе, штат Калифорния. Энергетическая компания PG&E, которая обслуживает эту область, приписала отключение сильным бурям, которые разыгрались на побережье залива на прошлой неделе.

     Центр обработки данных компании NaviSite был отключен от электроснабжения 19 января, утром, около 4:20, сказала Бьянчи. Центр обработки данных продолжал работать от источников бесперебойного электропитания (ИБП) до 4:56, пока батареи не разрядились и дата-центр не был полностью отключен.

     В то время как центр обработки данных был переведен на генераторное питание к 5:35, для восстановления рабочих сред некоторых клиентов потребовалось до 24 часов. Из-за проблемы пострадало свыше 100 клиентов.

     Вице-президент отдела услуг, Эллен Элисон сообщила, что инженеры в первую очередь занялись восстановлением систем тех клиентов, которые использовали датацентр для размещения своих бизнес-приложений.

     Бьянчи сказала, что все пострадавшие сразу же были уведомлены о происшествии по электронной почте. Компания использовала свой блог и твиттер для размещения информации о событии, которое произошло в датацентре. Группа управления учетными записями также информировала пользователей центра обработки данных по телефону.

     «К среде не было подано никаких исков, связанных с отключением, ни клиентами, ни самой компанией NaviSite», — сказала Бьянчи. Элисон также сообщила, что компания полностью возместит убытки пострадавшим клиентам в соответствии с соглашением об уровне обслуживания (SLA).

NaviSite использует дата-центр площадью 2400 кв. метров для предоставления услуг collocation и хостинга.


Поделиться информацией

Вы можете послать эту статью или новость коллеге или знакомому по email со своим комментарием, пригласить обсудить ее. Просто нажмите на иконку конверта --->  


Сообщения, вопросы и ответы

Вы можете задать вопрос, написать комментарий, обсудить данную новость или статью.

Ваше сообщение (вопрос, ответ, комментарий)