Проектирование и внедрение системы многоуровневого хранения данных

О заказчике

Иркутский авиационный завод основан в 1932 г. За семьдесят девять лет на предприятии было освоено производство более двадцати типов самолетов практически всех конструкторских бюро СССР и России. При этом каждый новый тип авиационной техники отличался конструкторскими и технологическими решениями, уникальными для своего времени. Самолеты Иркутского авиационного завода поставлялись в 37 стран мира. В 1997 г. завод первым из предприятий авиационной промышленности России получил сертификат соответствия системы обеспечения качества производства международному стандарту ISO 9002.

Задачи

Проектирование и производство современной авиационной техники требует постоянного совершенствования ИТ-инструментов. Согласно принятой в компании ИТ-стратегии, Управление ИТ регулярно проводит необходимую модернизацию оборудования и программного обеспечения. Очередное обновление ИТ-систем было запланировано в связи со стартом программы проектирования ближне-среднемагистрального самолета MC-21. В том числе, возникла необходимость построить надежную отказоустойчивую систему хранения данных, поддерживающую многоуровневое хранение информации и быстрый доступ к архиву, а также существенно увеличить объем дискового пространства.

По итогам рассмотрения технико-коммерческих предложений компаний было выбрано предложение «Инфосистемы Джет», основанное на решениях ЕМС.

«Прежде чем приступить к проектированию решения, мы провели предварительное обследование, а также анализ структуры данных, которые использовались на заводе. В результате было выделено несколько типов данных, различающихся между собой по объему занимаемого дискового пространства, по актуальности и частоте использования. Обследование показало, что масштабировать существующую систему хранения данных не имело смысла – часть оборудования морально устарела. Но также стало очевидно, что его вполне можно использовать в качестве архивного хранилища для размещения на нем редко используемой информации, сохранив тем самым ранее вложенные инвестиции, – рассказывает архитектор проекта Александр Котенко. – Кроме того, специалисты компании ЕМС предложили разработать механизм распределения данных по релевантности и настроить непрерывную репликацию, обеспечивающую целостность копируемых данных».

Специалисты компании «Инфосистемы Джет» при участии консультантов компании ЕМС спроектировали катастрофоустойчивое решение. Поскольку система хранения данных должна обеспечивать полную отказоустойчивость, было решено построить распределенную СХД и разместить ее на двух физически разделенных площадках – основном и резервном центрах обработки данных. Оборудование на обеих площадках практически идентично друг другу в плане функциональности и производительности. Подробную схему решения можно рассмотреть на риc. 1.

Оперативное хранение данных

«Выбирая "основу" для комплекса, в первую очередь мы обращали внимание на возможность построения унифицированного многоуровневого хранилища. В итоге мы остановились на массивах Celerra NS960, который укомплектован дисками разных типов: 146 GB 15K FC, 300 GB 15K FC, 600 GB 10K FC и 1000 GB 7.2K SATA», – комментирует архитектор проекта Александр Котенко.

На схеме отчетливо видно, что ресурсы хранения системы разделены на два класса – для файлового доступа и для блочного доступа. Файловый уровень предоставляет пользователям доступ к данным через папки общего доступа. Блочный - предусмотрен для обеспечения серверов выделенными дисковыми ресурсами (хранение баз данных, создание специализированных файловых систем и др.). Очевидным преимуществом является сочетание в одном массиве одновременно блочных и файловых протоколов доступа, что сокращает количество эксплуатируемых систем.

Архивное хранение данных

«Совместно с представителями компании ЕМС мы отработали решение, в котором информация может храниться не только на EMC Celerra, но и в архивном хранилище – на EMC Centera. – рассказывает архитектор проекта Александр Котенко. В качестве связующего звена между оперативным хранилищем и архивом используется программно-аппаратный комплекс EMC Rainfinity FMA. Он позволяет прозрачно мигрировать данные между системами хранения, отправляя их в архив, когда они не востребованы, и восстанавливая их на оперативное хранилище, когда это необходимо. После отправки файла или документа «на покой» на его месте остается ярлык, содержащий путь к данным. Процесс восстановления занимает считанные секунды».

Еще один инструмент оптимизации пространства дисковых ресурсов серверов Unix - DiskXtender. Он производит непрерывный мониторинг файловых систем серверов на предмет наличия свободного пространства. В случае превышения определенного порога, указанного в настройках файловой системы, DiskXtender осуществляет миграцию данных в архивное хранилище – EMC Centera.

Для осуществления операций с архивом, таких как сохранение, доступ к данным и удаление объектов из хранилища, используется специальный интерфейс Centera API. При этом задачи по оптимальному размещению данных, поиску объектов, устранению неисправностей, балансировке нагрузки, расширению емкости и т.д. решаются системой Centera самостоятельно.

Защита архивных данных

Для логической защиты данных в Centera используется метод зеркалирования объектов (CPM). При сохранении объекта приложение может указать минимальный период хранения (retention period). В этом случае объект не может быть удален приложением до окончания данного периода, что позволяет гарантировать сохранность информации в течение заданного времени даже при ошибках оператора, сбоях приложения или диверсии. После истечения срока хранения объект будет уничтожен.

Еще один уровень защиты обеспечивает возможность репликации данных между несколькими системами Centera, которые расположены в различных центрах обработки. Такая репликация, обеспечиваемая CentraStar, позволяет защищать данные от масштабных аварий и катастроф. При этом максимально упрощается процесс доступа к данным в резервном центре, так как они будут автоматически запрошены через интерфейс Centera API с резервной системы при недоступности основной системы Centera.

Репликация между центрами обработки данных

Репликация между основным ЦОД и резервным реализована двумя разными способами: средствами EMC Celerra Replicator V2 (для файлового уровня), а также при помощи программно-аппаратного комплекса EMC RecoverPoint (для блочного уровня). EMC RecoverPoint представляет собой набор серверов с предустановленным ПО, собранных в отказоустойчивый кластер: при выходе из строя одного из узлов, комплекс продолжит работу. Кластер RecoverPoint подключается к существующим сетям и осуществляет непрерывную журналируемую репликацию дисковых томов на блочном уровне, т.е. создает мгновенные снимки, которые потом хранятся в виде журнала. Программно-аппаратный комплекс поддерживает прямой порядок записи и сохраняет данные в журнале в соответствии с хронологией. В случае сбоя это позволяет осуществить «откат» к любому зафиксированному состоянию системы. Таким образом, вся инфраструктура, подключенная к EMC RecoverPoint, находится под надежной защитой вне зависимости от типа угрозы: сбой серверов, повреждение данных, ошибки ПО, проникновение вирусов, человеческий фактор, природные катаклизмы или иные форс-мажоры.

Унифицированная СХД с различными уровнями хранения позволила снизить операционные затраты на хранение информации и обслуживание системы. При этом эффективность хранения данных в системе стала значительно выше. Благодаря гибкой политике настройки параметров системы, теперь можно автоматически разделять данные по классам с учетом требований к времени доступа и к частоте их использования. Таким же образом выбирается и уровень защиты данных.

«Решение, предложенное и реализованное специалистами компаний ЕМС и " Инфосистемы Джет", позволило реализовать все поставленные задачи. Во-первых, мы получили увеличение объема свободного дискового пространства с запасом на 2-3 года вперед с учетом динамики роста. Во-вторых, в нашем распоряжении теперь надежная многоуровневая система хранения данных, которая позволит нам гибко управлять данными и эффективно использовать доступное дисковое пространство, а значит, оптимизировать затраты на хранение данных приложений, требующих различной производительности и емкости. И, наконец, ряд автоматических процедур избавили персонал ИТ-службы от рутинных операций», – обобщает итоги проекта Александр Иннокентьевич Шишанов – начальник бюро системного сопровождения корпоративных информационных систем Иркутского авиационного завода.

«Многоуровневое хранение данных в этом проекте реализовано в пределах одного дискового массива за счет использования различных типов дисков. Эта простая, но эффективная технология может быть применена практически для всех сфер бизнеса, где ведется активная работа с данными и сложными вычислениями, – подчеркивает Роман Володин, руководитель группы систем хранения данных компании «Инфосистемы Джет».

Скачать (pdf, 419.6 Кб)

Проектирование и внедрение системы многоуровневого хранения данных