Развитие систем хранения данных и управления ими прошли долгий путь развития, будучи критичными для любого корпоративного IT решения. Сегодня наиболее совершенными являются гиперконвергентные системы, которые имеют целый ряд преимуществ перед используемыми сегодня и устаревшими наследуемыми системами. Они дешевле, проще в управлении, легко масштабируются и обеспечивают точное соответствие своих ресурсов потребностям предприятия.
В данной статье дана сравнительная характеристика традиционных, конвергентных и гиперконвергентных систем, связанных с хранением и обработкой данных. Рассматриваются варианты масштабирования аналогичных корпоративных систем и архитектура Scale-Out. Приведены описание и характеристика гиперконвергентной системы нового поколения для работы с данными NetApp HCI.
Конвергентные и традиционные системы
Конвергентные системы (converged systems) ─ это результат естественного прогресса, уход от традиционной IT инфраструктуры, которая всегда была связана с созданием обособленных и не связанных друг с другом «бункеров» для хранения и обработки данных.
Для наследуемой окружающей IT среды, как правило, создавались отдельные административные группы (коллективы специалистов) для систем хранения, для серверов и для поддержки сети. Например, группа систем хранения занималась покупкой, обеспечением и поддержкой инфраструктуры хранения данных. Она также поддерживала отношения с поставщиками аппаратных средств хранения. То же касалось групп серверов и сети.
Конвергентная система объединяет два или больше из этих компонентов IT инфраструктуры, как предварительно спроектированное решение. Лучшие решения данного класса объединяют все три компонента, которые тесно связаны между собой соответствующим ПО.
Явное преимущество такого решения ─ относительно простой дизайн для сложной IT инфраструктуры. Идея состоит в том, чтобы создать единую команду для поддержки, ─ так же, как ориентироваться на единственного продавца для поддержки всех необходимых компонентов.
Конвергентные и гиперконвергентные системы
Гиперконвергентные системы (HCS) выводят само понятие «convergence» на новый уровень. Конвергентные системы типично состоят из отдельных компонентов, спроектированных так, чтобы они хорошо работали вместе. HCS типично представляют собой модульные решения, разработанные для масштабирования за счет включения в систему дополнительных модулей. Фактически они выполняют «размасштабирование» большой системы хранения данных за счет слоя ПО контроллера.
Типичные архитектуры традиционной и гиперконвергентной систем хранения данных и управления ими
Чем больше устройств хранения добавляется, тем больше их общая емкость и производительность. Вместо того, чтобы расширяться, добавляя больше дисков, памяти или процессоров, просто добавляются новые самостоятельные модули, содержащие все необходимые ресурсы. В дополнение к упрощенной архитектуре используется упрощенная модель администрирования, поскольку HCS управляются через единый интерфейс.
Вертикальная и горизонтальная масштабируемость
Масштабируемость понимается как способность систем некоторых типов продолжать функционировать должным образом при изменении их размера (или объема) для соответствия потребностям пользователей. В некоторых контекстах масштабируемость понимается как способность удовлетворить большие или меньшие запросы пользователей. В контексте хранения чаще говорят об удовлетворении спроса на больший объем.
Схематическое представление вертикальной и горизонтальной масштабируемости
Вертикальная масштабируемость (scale-in) ─ увеличение возможностей существующих аппаратных средств или ПО за счет добавления новых ресурсов к физической системе ─ например, вычислительной мощности к серверу, чтобы сделать его быстрее. В случае систем хранения это означает добавление новых контроллеров, дисков и модулей вводавывода к существующей системе по мере необходимости.
Горизонтальная масштабируемость (scale out) подразумевает соединение многих автономных единиц так, чтобы они работали общей и единственной логической единицей. При горизонтальном масштабировании, например, может быть много узлов, удаленных географически.
Архитектура Scale-out storage
Согласно концепции архитектуры scale out, новые группы устройств могут быть добавлены в систему почти без пределов, по мере требования. Каждое устройство (или узел, node) имеет некоторую емкость хранения данных. Она, в свою очередь, может набираться дисковыми устройствами и иметь собственную вычислительную мощность, ─ как и полосу пропускания ввода / вывода (input/output, I/O).
Включение этих ресурсов означает, что, увеличивается не только емкость, но и производительность работы с данными. Масштаб системы растет по мере добавления узлов, объединяемых в кластеры. Для этого часто используются x86 серверы со специальной ОС и системами хранения, связанными через внешнюю сеть.
Пользователи администрируют кластер как единую систему и управляют данными в глобальном пространстве имен или в распределенной файловой системе. Таким образом, они не должны волноваться о фактическом физическом расположении данных.
NetApp Enterprise-Scale HCI: новое поколение гиперконвергентных систем
Безусловно, в ряде случаев специальные и уникальные решения (сделанные на заказ системы хранения, сеть, серверы) остаются лучшим выбором. Однако другие варианты ─ «as-a-service», converged infrastructure (CI) и software-defined systems (SDS) быстро захватывают рынок IT инфраструктуры, и это движение будет доминирующим в последующие несколько лет.
Рынок CI растет очень быстро, поскольку организации стремятся к меньшей сложности эксплуатации и быстрому внедрению IT. Платформы Hyper Converged Infrastructure (HCI) появились в результате их естественного развития, поскольку организации уже переходят к построению информационных центров следующего поколения.
Ожидается также, что к 2020 г. 70% функций управления хранением данных будет автоматизировано и они войдут в инфраструктурную платформу. NetApp HCI представляет следующее поколение гиперконвергентной инфраструктуры и является первой HCI платформой, разработанной для приложений масштаба предприятия.
Первое поколение решений HCI было более подходящим для проектов относительно небольшого масштаба, ─ клиенты нашли, что в них имеется довольно много архитектурных ограничений. Они касались многих аспектов ─ производительности, автоматизации, смешанных рабочих нагрузок, масштабирования, гибкости конфигурации и др.
Это, конечно, противоречило стратегии построения информационного центра следующего поколения, где «проворство», масштабирование, автоматизация и предсказуемость являются обязательными требованиями.
Введение в NetApp HCI
NetApp HCI ─ первое гиперконвергентное инфраструктурное решение масштаба предприятия. Решение обеспечивает подобную облаку инфраструктуру (ресурсы хранения, а также вычислительные и сетевые) в «проворном», масштабируемом, легком в управлении стандартном блоке с четырьмя узлами (node).
Решение разработано на основе флэш-системы хранения данных SolidFire. Простое централизованное управление через VMware vCenter Plug-in дает полный контроль над всей инфраструктурой через интуитивный пользовательский интерфейс.
Интеграция с NetApp ONTAP Select открывает новый диапазон возможностей развертывания ─ как для существующих клиентов NetApp, так и для тех, кто хочет модернизировать свой датацентр. NetApp HCI решает ограничения в текущем поколении предложений HCI четырьмя ключевыми способами:
Гарантируемая производительность. Специализированные платформы и большая избыточность сегодня не представляются приемлемым выбором. NetApp HCI ─ решение, которое обеспечивает «гранулированный» контроль работы каждого приложения, который «устраняет шумных соседей». Все приложения развертываются на общей платформе. При этом, по данным компании, устраняется более 90% традиционных проблем производительности.
Гибкость и масштабирование. Предыдущие поколения HCI имели фиксированные ресурсы, ограничиваясь несколькими конфигурациями узла. Теперь NetApp HCI имеет независимые ресурсы хранения и вычислений. В результате NetApp HCI хорошо подходит для конфигураций любого масштаба.
Автоматизированная инфраструктура. Новая утилита NetApp Deployment Engine (NDE) устраняет большинство ручных шагов при развертывании инфраструктуры. VMware vCenter Plug-in делает управление простым и интуитивным. Соответствующий API позволяет интеграцию в системы управления верхнего уровня, обеспечивает резервное копирование и аварийное восстановление. Время возвращения системы в рабочее состояние после сбоев не превышает 30 минут.
The NetApp Data Fabric. В ранних поколениях платформ HCI существовала необходимость введения новых групп ресурсов в IT инфраструктуру. Очевидно, что это ─ неэффективный подход. NetApp HCI интегрируется в «ткань данных», NetApp Data Fabric. Это увеличивает мобильность данных, их видимость и защиту, позволяя использовать весь потенциал данных ─ в локальном (on-premise), публичном или гибридном облаке.
NetApp Data Fabric
Модель развертывания Data Fabric
NetApp HCI представляет собой решение «из коробки», сразу готовое работать в среде Data Fabric. Таким образом, пользователь получает доступ ко всем своим данным, которые находятся в публичном или гибридном облаке.
NetApp Data Fabric ─ определяемый ПО подход к управлению данными, которое позволяет предприятиям использовать несовместимые ресурсы хранения данных и обеспечить непрерывное потоковое управление данными между локальными и облачными хранилищами.
Продукты и сервисы, которые составляют NetApp Data Fabric, разработаны так, чтобы обеспечить клиентам свободу. Они должны быстро и эффективно перемещать данные в/из облака, при необходимости восстанавливать облачные данные и перемещать их из облака одного провайдера в облако другого.
Основа NetApp Data Fabric ─ операционная система для систем хранения данных Clustered Data ONTAP. Как часть Data Fabric, NetApp разработала специальную облачную версию ONTAP for Cloud. Она создает виртуальную СХД NetApp в пределах публичной облачной среды уровня предприятия.
Эта платформа позволяет сохранять данные тем же способом, которым это осуществляется во внутренних системах NetApp. Непрерывность позволяет администраторам перемещать данные туда, где и когда это необходимо, не требуя никаких промежуточных преобразований. В свою очередь, это фактически позволяет расширять датацентр предприятия. за счет публичного облака провайдера.
NetApp впервые представила концепцию Data Fabric в 2014 на своей ежегодной конференции Insight. Согласно NetApp, это стало ответом на потребность ее клиентов получать объединенное представление о данных предприятия, которые хранятся во многих внутренних и внешних датацентрах. В частности, с Data Fabric предприятия получили легкий доступ к своим корпоративным данным, находящимся в публичных облаках Google Cloud Platform, Amazon Simple Storage Service (S3), Microsoft Azure и IBM SoftLayer.
Соответствие требованиям предприятия
Одна из самых больших проблем в любом датацентре ─ предсказуемость необходимой в данный момент производительности. В наибольшей степени это касается «разрастающихся» приложений и их рабочих нагрузок, которые иногда могут быть очень интенсивными.
Каждое предприятие использует большое количество корпоративных приложений, использующих одну и ту же IT инфраструктуру. Таким образом, всегда есть потенциальная опасность того, что какое-либо приложение будет мешать работе другого.
В частности, у важных приложений, ─ таких, как, например, виртуальная десктопная инфраструктура (Virtual Desktop Infrastructure, VDI) и приложения базы данных, механизмы ввода / вывода довольно сильно разнятся и имеют тенденцию воздействовать на друг друга. HCI NetApp устраняет проблему непредсказуемости, обеспечивая необходимую производительность в каждый момент.
NetApp HCI доступен для малых, средних и больших конфигураций систем хранения данных и вычислений. Система может наращиваться с шагом 1RU. В результате предприятия могут очень точно определять требуемые им ресурсы и не иметь незадействованных избыточных аппаратных средств.
Основная задача каждого IT подразделения ─ автоматизировать все обычные задачи, устраняя риск ошибок пользователя, связанных с ручными операциями и освободить ресурсы для решения более приоритетных и сложных бизнес-задач. NetApp Deployment Engine (NDE) устраняет большинство ручных операций по разворачиванию инфраструктуры. В то же время программное расширение vCenter делает управление в виртуальной среде VMware простым и интуитивным.
Наконец, набор API позволяет выполнять «бесшовную» интеграцию подсистемы хранения и обработки данных в системы управления более высокого уровня, а также обеспечивает резервное копирование и аварийное восстановление данных.
NetApp HCI объединяет и поддерживает следующие технологии:
- NetApp SolidFire Element OS ─ SolidFire Storage Operating System, позволяет быстро масштабировать узел хранения данных.
- Intuitive Deployment Engine ─ развертывает и формирует компоненты ПО для управления ресурсами хранения и вычислений.
- Robust Monitoring Agent ─ осуществляет мониторинг ресурсов HCI и устройств хранения, а также отсылает информацию в vCenter и Active IQ.
- NetApp SolidFire vCenter Plugin ─ предоставляет исчерпывающий набор функций для управления хранением данных.
- NetApp SolidFire Management Node ─ VM для мониторинга и апгрейда HCI с поддержкой удаленного управления.
- VMware ESXi and vCenter v6 ─ хост для виртуализации и управления ПО.
- NetApp Data Fabric ─ обеспечивает интеграцию с помощью средств SolidFire Element OS, включая SnapMirror, SnapCenter, файловые сервисы ONTAP Select, а также средства резервного копирования AltaVault и StorageGRID.
Минимальная конфигурация NetApp HCI: два конструктива (шасси), в которых в совокупности имеется четыре модуля для флеш-памяти, два вычислительных модуля и два пустых отсека для дополнительных модулей
Внешний вид одного модуля NetApp HCI с обратной стороны
Спецификации NetApp HCI
Effective Block Capacity ─ один из параметров дедупликации, зависит от типа данных. Подробнее см. здесь.
Система будет доступна к заказу не ранее осени этого года. За детальной информацией обращайтесь по адресу netapp@muk.ua.
Автор: Orest_ua