Центры обработки данных требуют оптимизации сетей WAN

Количество данных, которыми обмениваются дата-центры, постоянно растет, одновременно растет и коэффициент использования сетей WAN. Причиной повышения этого коэффициента является необходимость защиты данных (например, путем репликации и резервного копирования), а также необходимость обеспечения доступности информации (например, взаимодействие активных хранилищ данных или интерактивная миграция).

Независимо от причины, очевидно одно: предприятиям необходимо модернизировать сети WANs (что является дорогостоящей и трудоемкой задачей) или искать решения для их оптимизации. В частности, когда один дата-центр компании находится от других на расстоянии, превышающем сотни километров, можно сначала рассмотреть технологии оптимизации WAN, чтобы понять, могут ли они уменьшить объемы передаваемой информации.

Первые решения для оптимизации сетей WAN

Первые решения для оптимизации трафика WAN в центрах обработки данных были реализованы поставщиками систем хранения данных и сетевого оборудования, которые встраивали в свои изделия функции сжатия данных. Сжатие – это эффективный метод уменьшения трафика, который может работать с относительно небольшими блоками данных (размером 4 Кб) в потоке информации и распознает повторяющиеся блоки размером от нескольких байтов до десятков килобайтов. В большинстве случаев использование метода сжатия позволяет уменьшать объем трафика WANs приблизительно на 25-50%.

Следующим шагом в оптимизации WAN стало решение, получившее название контроллеры оптимизации WAN (WOCs). Вместе с WOCs появилось понятие «поточной» дедупликации, похожей на кэширование. Посредством дедупликации можно идентифицировать и сводить до минимума повторяющиеся блоки данных в рамках одного или более потоков данных размером порядка нескольких гигабайт. Точно также как в механизмах кэширования, кэш находится в месте хранения шаблонов данных. Дедупликация чрезвычайно эффективна в случае многократной передачи больших блоков данных по сетям WAN; в таких ситуациях очень выгодно использовать WOCs для уменьшения трафика.

Подобные сценарии используются преимущественно в филиальных сетях WANs, где, например, обычным явлением является рассылка одного и того же вложения электронной почты нескольким удаленным сотрудникам. В этом сценарии стоит только первому электронному сообщению с данным вложением пересечь границу данных WAN, контроллеры WOCs будут правильно идентифицировать все последующие передачи данного вложения и заменять их ссылками, которые можно будет использовать для восстановления этого вложения в удаленном размещении.

Однако, в случае внешних WANs в центрах обработки данных, приложения (например, передающие данные, связанные с репликацией или резервным копированием) обычно передают в удаленный data centre только измененные блоки данных. В таких случаях технологии дедупликации должны быть пригодны для распознавания блоков данных, размер которых меньше, чем у блоков, используемых данными приложениями.

Рассмотрим массив памяти на диске, который поддерживает блоки данных размером 4 Кб, и отправляет удаленному массиву данных только измененные блоки данных. Если используемые контроллеры WOCs будут искать только блоки данных размером 4 Кб или более, то этот WOC не найдет никаких повторяющихся блоков. Даже если WOC поддерживает блоки размером 2 Кб, то наилучшим результатом будут уменьшение трафика в два раза, а это слишком мало для того, чтобы оправдать приобретение контроллера WOC.

Поставщики контроллеров WOC с готовностью заявляют, что их технологии дедупликации поддерживают блоки данных размером 32 байта. Может быть это и так, когда контроллеры WOCs обрабатывают трафик, скорость передачи данных в котором не превышает 10 мегабит/сек. Однако, если данные передаются по сети WAN даже со скоростью нескольких сотен мегабит в секунду, одна только величина усилий, требуемых для обнаружения повторений в словарях размером порядка нескольких гигабайт или терабайт вынуждает контроллеры WOCs обрабатывать блоки все больших размеров. Передача блоков данных размером до 4 Кб является обычным явлением, в случае если контроллеры WOCs имеют дело с потоками данных, скорость которых превышает 500 мегабит/сек.

Впоследствии некоторые поставщики стали встраивать функции сжатия в свои контролеры WOCs. Идея заключалась в том, что технология дедупликации будет использоваться для обнаружения более крупных повторений в пределах одного или нескольких потоков данных. Функции сжатия будут заниматься поиском повторяющихся блоков меньшего размера в отдельных потоках данных, которые были пропущены механизмом дедупликации. Конечно, такая модель имеет смысл, но вопрос в том, дает ли сама технология дедупликации сколько-нибудь значимое преимущество.

Избавление от утопии

Технологии дедупликации трафика внешних сетей WAN в центрах обработки данных должны быть абсолютно независимыми от скорости передачи данных. Передаются данные со скоростью 10 мегабит в секунду или 10 гигабит в секунду, эффективность дедупликации должна быть неизменной. В разговоре с поставщиками решений оптимизации WAN клиенты должны требовать такую гарантию. В идеале, система дедупликации должна быть способна обнаруживать повторяющиеся блоки размером до 10 байт в рамках одного или более потоков данных, для того чтобы затраты на уменьшение трафика были оптимальными.

Функция сжатия является ключевой составляющей идеальной системы оптимизации трафика. Имея в виду некоммутативный характер технологий дедупликации и сжатия, системы оптимизации WAN должны сначала дедуплицировать входящий трафик, а затем сжимать его.

Технологии сжатия полезны, когда механизм дедупликации в состоянии обнаружить значительное число повторений, и когда он обнаруживает и «запоминает» новые шаблоны. В первом случае функция сжатия может быстро обрабатывать несколько малых пакетов, выводимых механизмом дедупликации в виде одного крупного блока после того, как каждый из них был очень эффективно дедуплицирован. В последнем случае функция сжатия избавляется от необходимости оповещения удаленного решения оптимизации WAN о новом шаблоне, который необходимо «запомнить».

Если организация не справляется с растущими требованиями к полосе пропускания внешних сетей WAN, то оптимизация WAN как раз то, что может решить эту проблему. В данном случае ключевое значение имеет выбор поставщика, системы которого действительно подходят для преобладающих скоростей обмена информацией между данными центрами обработки данных. Не соглашайтесь на решения, которые изначально предназначались для решения совсем других проблем (например, филиальных сетей WAN), а теперь будто бы могут решать и проблемы внешних WAN в центрах обработки данных.


Поделиться информацией

Вы можете послать эту статью или новость коллеге или знакомому по email со своим комментарием, пригласить обсудить ее. Просто нажмите на иконку конверта --->


Сообщения, вопросы и ответы

Вы можете задать вопрос, написать комментарий, обсудить данную новость или статью.

Ваше сообщение (вопрос, ответ, комментарий)