Какой raid выбрать

Какой raid выбрать

Как выбрать подходящий уровень RAID

Преимущества и недостатки различных уровней RAID описаны во многих статьях. Я, например, как-то рассказывал, почему в определенных случаях предпочитаю использовать RAID 50, в каких ситуациях RAID 60 — это лишнее, а когда наоборот, и отчего RAID 10 лучше RAID 6, несмотря на большие затраты. Оговорюсь сразу, настройка RAID довольно сложная процедура и не каждый пользователь с ней справится корректно, поэтому может понадобиться компьютерная помощь от профессионалов. Мой коллега Рик Вановер (Rick Vanover) объяснял, когда стоит использовать RAID 5, а когда — RAID 6.

Что стоит учитывать при выборе уровня RAID

Выбирая уровень RAID для нового массива, следует иметь в виду несколько важных факторов:

• Производительность. Не все приложения одинаковы. Некоторые генерируют минимум операций ввода/вывода, другие наоборот, очень активно эксплуатируют дисковые накопители, поэтому уровень RAID должен соответствовать нагрузке.

• Емкость. Уровни RAID различаются по количеству чистого пространства, доступного для использования, за вычетом зарезервированного для служебных нужд. Если в конкретном применении важнее всего емкость, это стоит учитывать.

• Стоимость. Чем выше емкость и производительность, тем выше стоимость. Правильный выбор уровня RAID позволяет уравновесить цену и производительность.

• Доступность. Потребности разных организаций существенно различаются. Некоторые готовы переплатить, чтобы максимально обезопасить себя от простоя, а для других это не так актуально. Уровень RAID нужно выбирать в зависимости от того, насколько важна для компании постоянная доступность системы хранения.

Давайте посмотрим, как разные уровни RAID соответствуют каждому из перечисленных критериев. Речь пойдет об относительно распространенных типах RAID.

Обратите внимание: в каждой из категорий два пункта отмечены звездочкой (*) — таким способом я обозначил уровни RAID, лучше всего соответствующие заданному критерию. RAID 0 часто оказывается в числе лучших, но я бы не рекомендовал использовать его в промышленных масштабах.

• * RAID 0. С точки зрения производительности, RAID 0 намного опережает все остальные типы RAID, потому что не требует записи служебных данных и позволяет объединить все диски в единый высокопроизводительный пул.

• * RAID 1/10. В большинстве случаев RAID 10 обеспечивает превосходную производительность, поскольку позволяет считывать данные с нескольких дисков одновременно. Быстродействие снижается только при многочисленных операциях последовательной записи небольших объемов данных. В целом, для обеспечения чистой производительности практически при любых нагрузках RAID 1 и 10 — идеальный выбор. RAID 1 сам по себе — это двухдисковая система, не особенно повышающая производительность, но в крупных массивах она в любом случае практически не используется.

• RAID 5/50. Для приложений, создающих большую нагрузку с точки зрения чтения, RAID 5/50 обеспечивает прекрасную производительность. Однако при активной записи необходимость сохранять контрольные суммы приводит к ощутимому снижению быстродействия. При восстановлении данных производительность RAID 5/50 остается на минимальном уровне вплоть до завершения операции.

• RAID 6/60. В отличие от других уровней, RAID 6 обеспечивает превосходную скорость чтения, однако производительность при записи у него еще ниже, чем у RAID 5, потому что контрольные суммы рассчитываются в двойном экземпляре. Восстановление данных тоже существенно замедляет работу системы.

• * RAID 0. Поскольку хранение контрольных сумм и зеркалирование в этой конфигурации не предусмотрены, RAID 0 отличается прекрасной емкостью, позволяя на 100% использовать пространство всех жестких дисков в массиве.

• RAID 1/10. Этот уровень RAID предусматривает сохранение зеркальной копии данных, а значит, емкость массива снижается вдвое. Недостаток компенсируется высокой скоростью чтения и записи.

• * RAID 5/50. Одна из причин популярности RAID 5 заключается в том, что этот тип RAID расходует минимум пространства на служебные нужды — всего один диск. В случае с RAID 5/50 на это тратится до 33% от общей емкости массива (в трехдисковой конфигурации RAID 5) — в зависимости от того, как созданы тома.

• RAID 6/60. Популярность RAID 6 в последнее время постепенно увеличивается, но с точки зрения емкости этот вариант менее выгоден, чем RAID 5. Для хранения контрольных сумм требуются два диска, так что в четырехдисковой конфигурации на это уходит до 50% от общей емкости.

• * RAID 0. При высокой емкости и производительности стоимость у RAID 0 минимальная. Высокая скорость и отсутствие необходимости тратить место на сохранение контрольных данных обеспечивают RAID 0 наилучшее соотношение «цена — емкость» и «цена — производительность».

• RAID 1/10. С точки зрения емкости, RAID 1/10 стоит чересчур дорого, зато если оценивать производительность, цена оказывается ненамного выше, чем у RAID 0. В этой конфигурации на служебные нужды уходит 50% свободного пространства, зато скорость работы остается очень высокой, поэтому RAID 1/10 пользуется большой популярностью в самых разных применениях.

• * RAID 5/50. Этот тип RAID является фактическим стандартом для тех, кому нужен RAID-массив, и неважно, с какими характеристиками. Все RAID-контроллеры поддерживают RAID 5, а издержки с точки зрения емкости на этом уровне не так уж высоки, особенно при наличии большого количества дисков. Однако производительность существенно снижается при активной записи, поэтому с точки зрения скорости записи RAID 5 оказывается дороже RAID 0, 1 и 10.

• RAID 6/60. Этот тип RAID невыгоден в обоих отношениях: на служебные нужды уходит до 50% от общей емкости массива, как у RAID 1/10, а производительность при записи оказывается еще ниже, чем у RAID 5.

• RAID 0. С точки зрения доступности, ноль в названии RAID 0 говорит сам за себя. В общем-то, это даже не RAID-массив — просто скопление дисков (JBOD). При отказе хотя бы одного из дисков в массиве данные будут безвозвратно утеряны. Производительность и емкость у RAID 0 высоки, но сохранность данных этот тип RAID никак не гарантирует.

• * RAID 1/10. Поскольку RAID 1/10 предусматривает зеркалирование, с точки зрения надежности это наилучший вариант. Все данные сохраняются сразу на два диска, поэтому в большом массиве можно не опасаться отказа сразу нескольких дисков — лишь бы оставалась одна копия данных.

• RAID 5/50. С точки зрения доступности RAID 5 обладает неплохими характеристиками, которых бывает вполне достаточно для большинства организаций. Массив может лишиться одного диска и при этом оставаться функциональным, хотя уже и не безопасным. Если откажет и второй диск, данные будут потеряны. Соответственно, отдельный подмассив RAID 5 в массиве RAID 50 может потерять один диск и при этом оставаться в рабочем состоянии. Теоретически, массив будет работать, даже если в каждом подмассиве откажет по одному диску.

• * RAID 6/60. Этот уровень RAID обеспечивает высочайшую доступность, поскольку RAID 6 остается функциональным даже при отказе двух дисков.

Если вы не можете решить, какой уровень RAID предпочесть, я бы посоветовал использовать RAID 50 в тех случаях, когда емкость важнее производительности (а если основная нагрузка складывается из последовательных операций чтения, производительность у RAID 50 тоже будет на высоте). Для тех, кому высокая скорость чтения/записи случайных и последовательных блоков данных важнее, чем емкость, подойдет RAID 10. Наконец, если главная задача — обеспечить сохранность данных, стоит остановить свой выбор на RAID 6/60.

Как выбрать уровень RAID?

RAID – избыточный массив независимых дисков. В общем, система RAID использует два или более жестких диска для повышения производительности или обеспечения определенного уровня отказоустойчивости машин – обычно NAS или сервера. Отказоустойчивость означает обеспечение безопасности сети при неисправном оборудовании, гарантируя, что машина с неисправным компонентом, как правило, жестким диском, продолжит работать. Отказоустойчивость уменьшает перебои в производительности, и это также снижает вероятность потери данных.

Отказоустойчивость зависит от уровня RAID, который вы настроили. Уровни RAID зависят от того, как много дисков в запоминающем устройстве, насколько важно аварийное переключение и восстановление данных и насколько это важно для достижения максимальной производительности. Различные уровни RAID представляют различные конфигурации, направленные на обеспечение различных балансов между оптимизацией производительности и защиты данных.

RAID Обзор
RAID традиционно реализуется на предприятиях и в организациях, где отказоустойчивость диска и оптимизация производительность необходимость, а не роскошь. Серверы и NAS в бизнес-центрах обработки данных обычно имеют RAID-контроллер – часть оборудования, которая управляет массивом дисков. Эти системы имеют несколько дисков SSD или SATA, в зависимости от конфигурации RAID. Из-за повышенных требований хранения данных домашние NAS устройства также поддерживают RAID. Домашние, просьюмерские NAS и NASдля малого бизнеса все чаще имеют два или более отсеков для дисков, чтобы пользователи могли использовать возможности RAID так же, как на предприятии.

Программный RAID означает, что вы можете настроить RAID без потребности в выделенном аппаратном контроллере RAID. Возможности RAID имеют операционные системы. StorageSpacesWindows 8 и Windows 7 (версии Proи Ultimate) имеют встроенную поддержку RAID.

Этот тип RAID доступен в других операционных системах: OS X Server, Linux и Windows Servers. Программный RAID может также содержать виртуальные решения RAID, предлагаемые такими поставщиками, как Dot Hill.

Какой RAID выбрать?
Как уже говорилось, существует несколько уровней RAID, выбор зависит от того, нужен RAID для производительности или отказоустойчивости (или того и другого). Имеет значение и то, есть ли у вас аппаратный или программный RAID, так как программное обеспечение поддерживает меньше уровней, чем аппаратный RAID. В случае аппаратного RAID нужно определиться с типом. Различные контроллеры поддерживают различные уровни RAID и диктуют выбор дисков, которые можно использовать в массиве: SAS, SATA или SSD.

Читать еще:  Какую марку велосипеда выбрать

Наиболее популярные уровни RAID:

• RAID 0 используется для повышения производительности сервера. Он также известен как “расщепление дисков.” С RAID 0 данные записываются на несколько дисков. Это означает, что компьютер обрабатывает несколько дисков, а не только один, увеличивая производительность, поскольку несколько дисков читают и записывают данные, улучшая операции ввода/вывода. Требуется минимум два диска. И программные, и аппаратные средств RAID поддерживают RAID 0. Недостатком является то, что не включена отказоустойчивость. Если один диск выходит из строя, это влияет на весь массив и шансы на потерю данных или их повреждение увеличиваются.

• RAID 1 представляет собой конфигурацию отказоустойчивости известную как “зеркалирование дисков.” С RAID 1 данные копируются плавно и одновременно с одного диска на другой, создавая копию, или зеркало. Если один диск выйдет из строя, другой продолжит работать. Это самый простой способ реализации отказоустойчивости и относительно недорогой.

Недостатком является то, что RAID 1 понижает производительность. RAID 1 может быть реализован или через программное, или аппаратное обеспечение. Требуется минимум два диска. С программным обеспечением RAID 1 вместо двух физических дисков данные могут быть зеркально отражены между разделами на одном диске. Еще один момент в том, что RAID 1 сокращает объем диска в два раза: если сервер с двумя дисками по 1TБ настроен на RAID 1, то общий объем хранения будет 1TБ, не 2TБ.

• RAID 5 на сегодняшний день является наиболее распространенной конфигурацией RAID для бизнес-серверов и корпоративных NAS устройств. Этот уровень RAID обеспечивает лучшую производительность, чем зеркалирование, а также отказоустойчивость. С RAID 5 данные и четности (дополнительные данные, используемые для восстановления) распределяются на три или более дисков. Если диск выдает ошибку или выходит из строя, данные воссоздаются из распределенных данных и блоков четности – плавно и автоматически. По существу, система все еще действует, даже если один из дисков полетел. Еще одно преимущество RAID 5 в том, что он позволяет много NAS и серверным дискам быть заменяемыми, что означает, что привод может быть заменен на новый диск без выключения сервера или NAS и без прерывания пользователей от доступа к серверу или NAS. Это отличное решение для отказоустойчивости. Недостатком RAID 5 является снижение производительности на серверах, выполняющих много операций записи. Например, с RAID 5 на сервере при доступе к базе данных многими сотрудниками в рабочий день может быть заметное отставание.

• RAID 6 также часто используется на предприятиях. Он идентичен RAID 5, за исключением, что это еще более надежное решение, поскольку он использует еще один блок четности, в отличие от RAID 5. Два диска могут выйти из строя, но система продолжит функционировать.

• RAID 10 является комбинацией RAID 1 и 0 и часто обозначается как RAID 1 +0. Она сочетает в себе зеркалирование RAID 1 с чередованием из RAID 0. Это уровень RAID дает лучшую производительность, но этот вариант дорог, так как требует вдвое больше дисков. Этот уровень RAID идеально подходит для интенсивно используемых серверов с базами данных или любого сервера, выполняющего множество операций записи. RAID 10 может быть реализован в виде аппаратных средств или программного обеспечения, но общее мнение таково, что многие из преимуществ производительности теряются при использовании программного обеспечения RAID 10.

Другие уровни RAID

Есть и другие уровни RAID: 2, 3, 4, 7, 0 +1 . но по сути это варианты основных конфигураций RAID, и используются они для конкретных случаев. Вот некоторые краткие описания каждого из них:

• RAID 2 похож на RAID 5, но вместо расщепления дисков с использованием паритета, чередование происходит в бит-уровне. RAID 2 редко применяются, потому что расходы по реализации, как правило, непомерны (типичная установка требует 10 дисков), а уровень работы низкий с некоторыми дисковыми операциями ввода/вывода.

• RAID 3 также похож на RAID 5, за исключением того, что это решение требует наличия выделенного диска четности. RAID 3 используется редко, за исключением специализированных баз данных или сред обработки, которые могут извлечь выгоду из этого.

• RAID 4 – конфигурация, в которой чередование дисков происходит на уровне байтов, а не в бит-уровне, как в RAID 3.

• RAID 7 является собственностью уровня RAID, принадлежащей ныне прекратившей свое существование Storage Computer Corporation.

• RAID 0 +1 часто путают с RAID 10 (который является RAID 1 +0), но эти два не то же самое. RAID 0 +1 является зеркальным массивом с сегментами RAID 0 массивов. Он реализован в конкретных инфраструктурах, требующих высокой производительности, но не высокого уровня масштабируемости.

Для большинства малых и среднего размера целей RAID 0, 1, 5 и в некоторых случаях 10 достаточны для хорошей отказоустойчивости и производительности. Для большинства домашних пользователей RAID 5 может быть излишним, но RAID 1 обеспечивает достойную отказоустойчивость.

Важно помнить, что RAID не резервное копирование, не заменяет стратегию резервного копирования. Резервное копирование на RAID устройстве вполне может быть частью такой стратегии. RAID может быть отличным способом, чтобы оптимизировать NAS и производительность сервера и быстро оправиться от аппаратных сбоев, но это только часть общего решения аварийного восстановления.

Сравнение типов RA >

Технология объединения физических дисков в логический том — RAID — имеет огромное количество вариаций. Практическую реализацию в системах хранения данных и серверном оборудовании можно встретить у следующих спецификаций: RAID 0, 1, 3, 4, 5, 6, DP, 10, 50, 60, однако в коммерческом применении как правило используются только некоторые из них.

Таблица сравнения коммерчески используемых типов RA >

Тип RAID Производительность в IOPS при операциях записи Производительность во время цикла восстановления (Rebuild) Время восстановления RAID Эффективность использования дискового пространства RAID 5 Хорошая Плохая Плохое Очень хорошая RAID 6 Плохая Хорошая Плохое Хорошая RAID 10 Лучшая Лучшая Лучшее Плохая RAID DP Очень хорошая Очень хорошая Хорошее Хорошая RAID TEC Хорошая Хорошая Хорошее Очень хорошая

RAID 0

RAID 0 — массив дисков с чередованием данных (страйп). При использовании RAID 0 блоки данных записываются по очереди на каждый диск, что существенно увеличивает производительность операций чтения и записи. Избыточность данных отсутствует, поэтому выход из строя любого диска ведет к потере данных всей RAID-группы.

Использование:
Рекомендуется использовать RAID 0 для быстрого доступа к неважным или временным данным, когда требуется высокая производительность и имеется возможность в случае сбоя восстановить информацию. Типичным сценарием использования можно назвать пост-обработку видео или кэширование данных.

    Преимущества:
  • самая высокая скорость чтения и записи;
  • 100% эффективность использования дискового пространства.
    Недостатки:
  • самая низкая надежность хранения данных.

Формула эффективности:
S * N, где N — количество дисков в массиве, S — объем наименьшего диска.

RAID 1

RAID 1 — зеркалированный массив дисков (зеркало). Блоки данных записываются на все диски одновременно, поэтому допустим выход из строя всех дисков, кроме одного. Данная конфигурация обладает наименьшей эффективностью использования дискового пространства, и, как следствие, наибольшей стоимостью при использовании трех и более дисков.

Использование:
Рекомендуется использовать RAID 1 для максимального повышения надежности хранения и доступности данных. Наиболее частым сценарием является зеркалирование двух системных дисков серверов.

    Преимущества:
  • самая высокая степень надежности при использовании трех и более дисков;
  • самая высокая скорость чтения за счет параллельных запросов ко всем дискам сразу.
    Недостатки:
  • самая низкая эффективность использования дискового пространства при трех и более дисках;
  • незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10.

Формула эффективности:
S, где S — объем наименьшего диска.

RAID 3

RAID 3 — массив дисков с побайтным чередованием с одним выделенным диском четности на группу. Байты данных записываются поочередно на все диски, кроме одного. Отдельный диск выделяется для хранения информации о четности.

Использование:
Из-за побайтового чередования RAID 3 подходит для работы с большими файлами, однако на практике не используется в коммерческих задачах в связи с невысокой надежностью.

    Преимущества:
  • значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
  • высокая эффективность использования дискового пространства по сравнению с RAID 1, 6, DP, 10;
  • базовый уровень надежности, допустим выход из строя одного диска.
    Недостатки:
  • снижена скорость записи в IOPS по сравнению с RAID 0, DP, 10;
  • высокая нагрузка на диск четности и, как следствие, снижение его срока эксплуатации;
  • в случае выхода из строя диска четности, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных;
  • низкая скорость работы с блоками малого размера.

Формула эффективности:
S * (N – 1), где N — количество дисков в массиве, S — объем наименьшего диска.

RAID 4

RAID 4 — массив дисков с поблочным чередованием с одним выделенным диском четности на группу. Принцип работы похож на RAID 3, но данные разбиваются не на байты, а на блоки. Это увеличивает производительность при работе с небольшими файлами. Слабым местом RAID 4 является диск четности, на который ложится большая нагрузка в RAID-группе. Как следствие, диск четности почти всегда первым выходит из строя.

Читать еще:  Какой выбрать себе подарок на день рождения

Использование:
RAID 4 ранее использовался в дисковых массивах NetApp серии FAS, где недостаток надежности компенсировался принципом записи файловой системы WAFL (Write Anywhere File Layout). Рекомендуется только для временных и неважных данных. На данный момент RAID 4 в СХД NetApp вытесняется RAID DP.

В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы для NL-SAS составляет 7 дисков; для SAS или SSD — от 8 до 14 дисков.

    Преимущества:
  • значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
  • высокая эффективность дискового пространства по сравнению с RAID 1, 6, DP, 10;
  • базовый уровень надежности, допустим выход из строя одного диска.
    Недостатки:
  • высокая нагрузка на диск четности и, как следствие, снижение срока эксплуатации (за исключением использования в системах NetApp серии FAS);
  • в случае выхода из строя диска четности, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных.

Формула эффективности:
S * (N – 1), где N — количество дисков в массиве, S — объем наименьшего диска.

RAID 5

RAID 5 — массив дисков с поблочным чередованием с одной контрольной суммой. При построении RAID 5 для контрольных сумм не выделяется отдельный диск, как в RAID 4, вместо этого данные циклически записываются на все диски. Аналогично RAID 4, RAID 5 позволяет производить параллельную запись, что существенно увеличивает производительность. Нагрузка на диск четности равномерно распределяется по всем дискам в массиве.

Использование:
RAID 5 широко применяется в реальных бизнес-задачах. Типовым сценарием является использование в серверах в области хранения данных для пользовательских приложений и выполнения транзакций. Использовать в СХД рекомендуется в первую очередь для маловажной информации с небольшой нагрузкой на диски, например, в системах видеонаблюдения.

    Преимущества:
  • значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
  • высокая эффективность использования дискового пространства в сравнении с RAID 1, 6, DP, 10;
  • базовый уровень надежности, допустим выход из строя одного диска.
    Недостатки:
  • в случае выхода из строя одного диска, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных;
  • незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10.

Формула эффективности:
S * (N – 1), где N — количество дисков в массиве, S — объем наименьшего диска.

RAID 6

RAID 6 — массив дисков с поблочным чередованием с двумя контрольными суммами. Данные распределяются по дискам массива по очереди, в качестве информации для восстановления используется схема двойной четности. RAID 6 может выдержать отказ двух дисков одновременно, однако низкая производительность по операциям ввода-вывода (IOPS) ограничивает область применения.

Использование:
Сценарии применения RAID 6 аналогичны RAID 5 с уклоном в более надежное хранение информации. RAID 6 широко применяется в системах хранения данных, где не важна высокая транзакционная производительность — архивное хранение, видеонаблюдение стратегических объектов, использование в системах безопасности, а также для надежного хранения критически важных данных.

    Преимущества:
  • значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
  • высокая степень надежности по сравнению с RAID 5, допустим выход из строя двух дисков.
    Недостатки:
  • самая низкая скорость записи в IOPS;
  • эффективность использования дискового пространства ниже, чем у RAID 5.

Формула эффективности:
S * (N – 2), где N — количество дисков в массиве, S — объем наименьшего диска.

RAID DP

RAID DP — массив дисков с двойной четностью в линейке продукции FAS компании NetApp. Под контрольные суммы выделяются два отдельных диска. Благодаря использованию файловой системы WAFL транзакционная производительность выше, чем в RAID 5 и RAID 6.

Использование:
Является основным типом RAID в оборудовании NetApp линейки FAS. Рекомендуется для SSD дисков, SATA/NL-SAS дисков объемом менее 6TB (для дисков большего объема рекомендуется RAID-TEC).

В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы — от 14 до 20 дисков.

    Преимущества:
  • высокая скорость чтения по сравнению с дисками, не объединенными в RAID;
  • высокая скорость записи в IOPS по сравнению с RAID 5 и RAID 6, приближается к RAID 10;
  • высокая степень надежности по сравнению с RAID 5, допустим выход из строя двух дисков.
    Недостатки:
  • данный RAID используется только в дисковых массивах NetApp серии FAS;
  • эффективность использования дискового пространства ниже чем у RAID 5.

Формула эффективности:
S * (N – 2), где N — количество дисков в массиве, S — объем наименьшего диска.

RAID TEC

RAID TEC — массив дисков с тройной четностью в линейке продукции FAS компании NetApp. Данный тип RAID разработан для медленных объемных дисков с устойчивой производительностью во время восстановления.

Использование:
Рекомендуется для SATA/NL-SAS дисков объемом 6TB и более.

В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы — от 20 до 29 дисков.

    Преимущества:
  • высокая скорость чтения по сравнению с дисками, не объединенными в RAID;
  • высочайшая степень надежности в сочетании с хорошей эффективностью хранения (около 89% при RAID группе в 29 дисков).
    Недостатки:
  • данный RAID используется только в дисковых массивах NetApp серии FAS.

Формула эффективности:
S * (N – 3), где N — количество дисков в массиве, S — объем наименьшего диска.

RAID 10

RAID 10 — массив дисков с зеркалированием и чередованием. Представляет собой массив RAID 0 из нескольких массивов RAID 1. В реализации RAID 10 на практике каждый подмассив RAID 1 состоит из двух дисков, поэтому допускается выход из строя не более одного диска в каждом подмассиве. RAID 10 обладает самой высокой производительностью и надежностью, при этом эффективность использования дискового пространства составляет 50%.

Использование:
Основным сценарием применения является использование для работы с базами данных (Oracle, SAP HANA, SQL) и другими высокотранзакционными нагрузками.

    Преимущества:
  • самая высокая скорость чтения и записи среди коммерчески используемых типов RAID;
  • повышенная надежность по сравнению с RAID 5.
    Недостатки:
  • эффективность использования дискового пространства 50%.

Формула эффективности:
S * N / 2, где N — количество дисков в массиве, S — объем наименьшего диска.

RAID 50

RAID 50 — массив дисков, состоящий из чередования массивов RAID 5. Реализуется построением страйпа (RAID 0) из RAID 5. Допускается отказ не более одного диска в каждом подмассиве. Производительность RAID 50 выше, чем при использовании RAID 5, и стремится к RAID10, но надежность недостаточна для применения в реальных бизнес-задачах.

Использование:
Поддерживается ограниченным количеством производителей, т.к. не рекомендуется к использованию ввиду низкой надежности. Возможная модель использования предполагает хранения временных или неважных данных.

    Преимущества:
  • значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
  • высокая эффективность использования дискового пространства по сравнению с RAID 1, 6, DP, 10.
    Недостатки:
  • незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10;
  • недостаточная надежность для коммерческого использования.

Формула эффективности:
S * (N – 2), где N — количество дисков в массиве, S — объем наименьшего диска.

RAID 60

RAID 60 — массив дисков, состоящий из чередования массивов RAID 6. Реализуется построением страйпа (RAID 0) из RAID 6. Допускается отказ до двух дисков в каждом подмассиве. Обладает базовой надежностью и невысокой эффективностью используемого пространства . Для построения минимальной RAID-группы требуется 8 дисков.

Использование:
Поддерживается ограниченным количеством производителей, т.к. не обладает явными преимуществами по сравнению с использованием других типов RAID. Область практического применения ограничена.

    Преимущества:
  • значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
  • базовая надежность хранения.
    Недостатки:
  • невысокая эффективность использования дискового пространства по сравнению с RAID 5, 6, DP.
  • скорость записи в IOPS ниже, чем у RAID 0, DP, 10.

Формула эффективности:
S * (N – 4), где N — количество дисков в массиве, S — объем наименьшего диска.

RAID для «чайников» и не только

KDV, iBase.ru, 26.11.2004, последнее обновление – 27.02.2009.

Со времени первой публикации статьи, на forum.ibase.ru в ее обсуждении появилась масса интересных сообщений. Так что после чтения статьи рекомендую обязательно просмотреть топик на форуме.

В интернете есть масса статей с описанием RAID. Например, эта описывает все очень подробно. Но как обычно, читать все не хватает времени, поэтому надо что-нибудь коротенькое для понимания – а надо оно или нет, и что лучше использовать применительно к работе с СУБД (InterBase, Firebird или что то иное – на самом деле все равно). Перед вашими глазами – именно такой материал.

Примечание. Сейчас есть хорошая статья о RAID в Википедии.

В первом приближении RAID это объединение дисков в один массив. SATA, SAS, SCSI, SSD – неважно. Более того, практически каждая нормальная материнская плата сейчас поддерживает возможность организации SATA RAID. Пройдемся по списку, какие бывают RAID и зачем они. (Хотел бы сразу заметить, что в RAID нужно объединять одинаковые диски. Объединение дисков от разных производителей, от одного но разных типов, или разных размеров – это баловство для человека, сидящего на домашнем компьютере).

RAID 0 (Stripe)

Грубо говоря, это последовательное объединение двух (или более) физических дисков в один “физический” диск. Годится разве что для организации огромных дисковых пространств, например, для тех, кто работает с редактированием видео. Базы данных на таких дисках держать нет смысла – в самом деле, если даже у вас база данных имеет размер 50 гигабайт, то почему вы купили два диска размером по 40 гигабайт, а не 1 на 80 гигабайт? Хуже всего то, что в RAID 0 любой отказ одного из дисков ведет к полной неработоспособности такого RAID, потому что данные записываются поочередно на оба диска, и соответственно, RAID 0 не имеет средств для восстановления в случае сбоев.

Читать еще:  Какой провод выбрать для проводки в квартире

Конечно, RAID 0 дает ускорение в работе из-за чередования чтения/записи.

RAID 0 часто используют для размещения временных файлов.

RAID 1 (Mirror)

Зеркалирование дисков. Если Shadow в IB/FB это программное зеркалирование (см. Operations Guide.pdf), то RAID 1 – аппаратное зеркалирование, и ничего более. Упаси вас от использования программного зеркалирования средствами ОС или сторонним ПО. Надо или “железный” RAID 1, или shadow.

При сбое тщательно проверяйте, какой именно диск сбойнул. Самый частый случай погибания данных на RAID 1 – это неверные действия при восстановлении (в качестве “целого” указан не тот диск).

Насчет производительности – по записи выигрыш 0, по чтению – возможно до 1.5 раз, т. к. чтение может производиться “параллельно” (поочередно с разных дисков) . Для баз данных ускорение мало, в то время как при параллельном обращении к разным (!) частям (файлам) диска ускорение будет абсолютно точно.

RAID 1+0

RAID 2-3-4

RAID 5

Для него нужно минимально 3 диска. Данные четности распределяются по всем дискам массива

Обычно говорится, что “RAID5 использует независимый доступ к дискам, так что запросы к разным дискам могут выполняться параллельно”. Следует иметь в виду, что речь идет, конечно, о параллельных запросах на ввод-вывод. Если такие запросы идут последовательно (в SuperServer), то конечно, эффекта распараллеливания доступа на RAID 5 вы не получите. Разумеется, RAID5 даст прирост производительности, если с массивом будут работать операционная система и другие приложения (например, на нем будет находиться виртуальная память, TEMP и т. п.).

Вообще RAID 5 раньше был наиболее часто используемым массивом дисков для работы с СУБД. Сейчас такой массив можно организовать и на SATA дисках, причем он получится существенно дешевле, чем на SCSI. Цены и контроллеры вы можете посмотреть в статьях

  • http://old.computerra.ru/2004/540/204913/
  • http://www.thg.ru/storage/20040625/index.html

Причем, следует обратить внимание на объем покупаемых дисков – например, в одной из упомянутых статей RAID5 собирается из 4-х дисков объемом 34 гиг, при этом объем “диска” получается 103 гигабайта.

Объем дискового массива RAID5 расчитывается по формуле (n-1)*hddsize, где n – число дисков в массиве, а hddsize – размер одного диска. Например, для массива из 4-х дисков по 80 гигабайт общий объем будет 240 гигабайт.

Есть интересное мнение по поводу “непригодности” RAID5 для баз данных. Как минимум его можно рассматривать с той точки зрения, что для получения хорошей производительности RAID5 необходимо использовать специализированный контроллер, а не то, что есть по умолчанию на материнской плате.

RAID 10, 50

Дальше идут уже комбинации из перечисленных вариантов. Например, RAID 10 это RAID 0 + RAID 1. RAID 50 – это RAID 5 + RAID 0.

Интересно, что комбинация RAID 0+1 в плане надежности оказывается хуже, чем RAID5. В копилке службы ремонта БД есть случай сбоя одного диска в системе RAID0 (3 диска) + RAID1 (еще 3 таких же диска). При этом RAID1 не смог “поднять” резервный диск. База оказалась испорченной без шансов на ремонт.

Для RAID 0+1 требуется 4 диска, а для RAID 5 – 3. Подумайте об этом.

RAID 6

В отличие от RAID 5, который использует четность для защиты данных от одиночных неисправностей, в RAID 6 та же четность используется для защиты от двойных неисправностей. Соответственно, процессор более мощный, чем в RAID 5, и дисков требуется уже не 3, а минимум 5 (три диска данных и 2 диска контроля четности). Причем, количество дисков в raid6 не имеет такой гибкости, как в raid 5, и должно быть равно простому числу (5, 7, 11, 13 и т. д.)

Допустим одновременный сбой двух дисков, правда, такой случай является весьма редким.

По производительности RAID 6 я данных не видел (не искал), но вполне может быть, что из-за избыточного контроля производительность может быть на уровне RAID 5.

Rebuild time

У любого массива RAID, который остается работоспособным при сбое одного диска, существует такое понятие, как rebuild time. Разумеется, когда вы заменили сдохший диск на новый, контроллер должен организовать функционирование нового диска в массиве, и на это потребуется определенное время.

Во время “подключения” нового диска, например, для RAID 5, контроллер может допускать работу с массивом. Но скорость работы массива в этом случае будет весьма низкой, как минимум потому, что даже при “линейном” наполнении нового диска информацией запись на него будет “отвлекать” контроллер и головки диска на операции синхронизации с остальными дисками массива.

Время восстановления функционирования массива в нормальном режиме напрямую зависит от объема дисков. Например, Sun StorEdge 3510 FC Array при размере массива 2 терабайта в монопольном режиме делает rebuild в течение 4.5 часов (при цене железки около $40000). Поэтому, при организации массива и планировании восстановления при сбое нужно в первую очередь думать именно о rebuild time. Если ваша база данных и бэкапы занимают не более 50 гигабайт, и рост в год составляет 1-2 гигабайта, то вряд ли имеет смысл собирать массив из 500-гигабайтных дисков. Достаточно будет и 250-гигабайтных, при этом даже для raid5 это будет минимум 500 гигабайт места для размещения не только базы данных, но и фильмов. Зато rebuild time для 250 гигабайтных дисков будет примерно в 2 раза меньше, чем для 500 гигабайтных.

Резюме

Получается, что самым осмысленным является использование либо RAID 1, либо RAID 5. Однако, самая частая ошибка, которую делают практически все – это использование RAID “подо все”. То есть, ставят RAID, на него наваливают все что есть, и . получают в лучшем случае надежность, но никак не улучшение производительности.

Еще часто не включают write cache, в результате чего запись на raid происходит медленнее, чем на обычный одиночный диск. Дело в том, что у большинства контроллеров эта опция по умолчанию выключена, т.к. считается, что для ее включения желательно наличие как минимум батарейки на raid-контроллере, а также наличие UPS.

Текст
В старой статье hddspeed.htmLINK (и в doc_calford_1.htmLINK) показано, как можно получить существенное увеличение производительности путем использования нескольких физических дисков, даже для IDE. Соответственно, если вы организуете RAID – положите на него базу, а остальное (temp, OS, виртуалка) делайте на других винчестерах. Ведь все равно, RAID сам по себе является одним “диском”, пусть даже и более надежным и быстродействующим.
признан устаревшим. Все вышеупомянутое вполне имеет право на существование на RAID 5. Однако перед таким размещением необходимо выяснить – каким образом можно делать backup/restore операционной системы, и сколько по времени это будет занимать, сколько времени займет восстановление “умершего” диска, есть ли (будет ли) под рукой диск для замены “умершего” и так далее, т. е. надо будет заранее знать ответы на самые элементарные вопросы на случай сбоя системы.

Я все-таки советую операционную систему держать на отдельном SATA-диске, или если хотите, на двух SATA-дисках, связанных в RAID 1. В любом случае, располагая операционную систему на RAID, вы должны спланировать ваши действия, если вдруг прекратит работать материнская плата – иногда перенос дисков raid-массива на другую материнскую плату (чипсет, raid-контроллер) невозможен из-за несовместимости умолчательных параметров raid.

Размещение базы, shadow и backup

Несмотря на все преимущества RAID, категорически не рекомендуется, например, делать backup на этот же самый логический диск. Мало того что это плохо влияет на производительность, но еще и может привести к проблемам с отсутствием свободного места (на больших БД) – ведь в зависимости от данных файл backup может быть эквивалентным размеру БД, и даже больше. Делать backup на тот же физический диск – еще куда ни шло, хотя самый оптимальный вариант – backup на отдельный винчестер.

Объяснение очень простое. Backup – это чтение данных из файла БД и запись в файл бэкапа. Если физически все это происходит на одном диске (даже RAID 0 или RAID 1), то производительность будет хуже, чем если чтение производится с одного диска, а запись – на другой. Еще больше выигрыш от такого разделения – когда backup делается во время работы пользователей с БД.

То же самое в отношении shadow – нет никакого смысла класть shadow, например, на RAID 1, туда же где и база, даже на разные логические диски. При наличии shadow сервер пишет страницы данных как в файл базы так и в файл shadow. То есть, вместо одной операции записи производятся две. При разделении базы и shadow по разным физическим дискам производительность записи будет определяться самым медленным диском.

Ссылка на основную публикацию