Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Серверы, сетевое оборудование, тесты, характеристики, советы Восстановление RAID массивов простыми методами




Сумма Технологий - Серверные Системы

информационно-аналитический электронный журнал
Проект компании "SumTech Servers Systems"
www.stss.ru

Вторник, 28 Октября 2008 года (1917 год – Состоялось расширенное заседание ЦК РСДРП(б) на котором был избран Военно-революционный центр по руководству вооружённым восстанием.)

Восстановление RAID массивов простыми методами

Введение

В этой статье написано про восстановление данных с RAID массивов в простых случаях. Для этого используются методы, которым можно обучится не обладая специальными знаниями в этой области, и за короткое время. Случаи, которые можно отнести к сложным, слишком отличаются друг от друга, и требуют индивидуального подхода, поэтому  нет смысла описывать их в рамках одной статьи. Однако, можно обсудить конкретную ситуацию в предназначенном для этой цели разделе форума.

Безусловно, если потерянная информация критически важна, а вы не являетесь специалистом в области носителей информации и восстановления данных, то настоятельно рекомендуем сразу обратиться в компанию, чьей основной областью деятельности является решение такого рода проблем.  Но если возможность с большей вероятностью получить назад ценную информацию меркнет перед желанием попробовать самостоятельно восстановить данные, то эта статья для Вас.

Причины выхода RAID  массивов из строя

Наиболее распространённой причиной выхода из строя дисковых массивов является халатность системных администраторов, рассчитывающих на то, что «в одну воронку бомба дважды не падает». Во время работы, например RAID 5, выходит из строя один из дисков. Массив продолжает работать дальше корректно, но уже с заметным уменьшением скорости. Системный администратор, заметив сбой в работе накопителя, не очень спешит предпринимать активные действия, т.к. рассчитывает на то, что массив в таком виде еще сможет поработать некоторое время. Это порой оказывается заблуждением.

Если у Вас выходит из строя один из дисков, лучше всего немедленно произвести резервное копирование особо важных данных и потом, заменив один из накопителей, произвести ребилд массива.

Почему пришлось отметить то, что необходимо предварительно произвести бэкап?  Потому что при попытке ребилда массива, иногда случается такое,  что процесс зависает. Как правило, это происходит, если в процессе  чтения\записи на одном из дисков обнаруживается бэд-блок, и контроллер не может вычитать информацию из сектора. В результате, после длительного и бесполезного ожидания, сервер перегружают. После чего выясняется, что массив полностью развалился. Зависание в таких случаях, вероятнее всего, связано с некорректной обработкой исключительной ситуации. Как правило, описанное явление более характерно для дешевых моделей контроллеров, но встречается также и при использовании дорогого «железа».

Для избежания подобной ситуации можно также рекомендовать перед ребилдом проверить диски на бэд-блоки.

Ещё одной распространённой причиной отказа массивов, является одновременный переход нескольких дисков в режим off-line. Как показала практика, чаще всего это происходит из-за проблем со SMART, или накопления бэд-блоков. Пока их количество не превысит определённое значение, диск работает корректно, но в один прекрасный момент, массив перестает запускаться. И вроде бы все хорошо, и диск, судя по звуку, нормально стартует, и  контроллером правильно определяется, но вот только непонятно, почему статус у диска off-line, массив не стартует и данные не отдает. Все из-за того, что контроллер при попытке считать необходимые данные из диска не может их считать, либо, диагностируя SMART, определяет диск как «мертвый».

Можно привести ещё множество примеров сбоев в работе массивов, но что делать, если таки это свершилось? Информация потеряна, её необходимо восстановить.

Небольшое отступление

В продаже сейчас можно увидеть массу различного оборудования, которое можно использовать для создания массивов, по ценам от 20 до нескольких тысяч долларов. Сравнение надёжности – вопрос сложный, но догадаться, что разница в цене «не из пальца высосана», думаю, может каждый.

В первую очередь хотелось бы обратить особое внимание на то, что обеспечение сохранности данных с помощью RAID массивов не является панацеей. При  использовании массивов без выполнения своевременного резервного копирования, потери данных вполне возможны, вопрос в том, чем эти потери могут быть вызваны, и какова вероятность их появления. Практика показывает, что случаются как сбои в работе контроллера, так и сбои в работе жестких дисков, или же происходит одно вытекающее из другого.

Контроллеры бюджетного уровня, естественно менее надежны, так как имеют упрощенный алгоритм работы и восстановления после сбоев, что выражается в большей вероятности потери информации. Дорогие модели, хотя также не идеальны, заметно надёжнее, в том числе и по тому, что алгоритмы обработки ошибок у них более совершенны. Вопросы, касающиеся особенностей работы определённых моделей RAID контроллеров, вы можете задать здесь.

В любом случае, полностью полагаясь на надёжность массивов и не позаботившись о своевременном создании резервных копий, вы рискуете в один прекрасный момент остаться без «надежно хранимой» информации. Вероятность потери данных можно заметно уменьшить, регулярно отслеживая состояние массива и выполняя профилактические работы, но полностью свести к нулю таким образом её нельзя.

Теория: Уровни RAID и принципы восстановления данных

Чаще всего  сейчас используются массивы уровней 0, 1, 10, 5, 50.  В последнее время наблюдается возрастающий интерес к шестому уровню.

Ниже приведена краткая информация о принципах работы массивов. Более подробно, об этом, можно прочитать в соответствующей статье.

RAID 0 – использование чередующейся записи (страйп). Строится из двух и более накопителей.  Информация записывается  на все диски массива блоками определенного (8Kб, 16Kб, 32Kб, 64 Kб, 128Kб…) размера. Файлы, размер которых один блок, равномерно «разбрасываются» по двум или более дискам, включённым в массив.

Из-за отсутствия избыточности или дублирования данных, при выходе из строя одного из дисков, восстановить информацию в полном объеме без использования данных с неисправного накопителя не представляется возможным. Исключением будут лишь файлы, размер которых меньше размера блока. Для полноценного восстановления информации в таких случаях необходимо сначала снять данные с неисправного диска, после чего восстанавливать RAID.

В случаях, когда все диски исправны, а  массив отказывается корректно работать, восстановление производится  программными методами, которые описаны ниже.

RAID 1 – использование технологии зеркалирования (зеркало). Строится из двух дисков. Информация на них идентична. В случае выхода из строя одного из дисков массив остается работоспособным.

Если происходит сбой в работе контроллера и массив перестает определяться, то восстановление данных можно выполнить, воспользовавшись советами из статьи «Простое восстановление данных». Для этого один из дисков следует подключить к компьютеру на прямую, минуя RAID контроллер. Если повезёт, после подключения Ваши данные могут оказаться доступными и без использования программ, описанных в вышеуказанной статье.

RAID 10 – это объединение уровня 0 с уровнем 1, т.е. два страйпа объединяются в зеркало. В массиве используются минимум 4 диска. Он может остаться работоспособным при выходе из строя одного из составляющих его RAID 0.

При возникновении проблемы, в первую очередь необходимо определить, с чем именно возникли неполадки – с контроллером или с дисками.

Когда проблема на уровне контроллера, Вам следует определить, какие винчестеры являются парами, составляющими страйпы. Здесь важно не перепутать диски, т.к. это приведет к потерянному времени и отсутствию результата. После того, как это станет известно, берётся одна такая пара, и с неё снимается информация таким же образом, как и с самостоятельного RAID 0.

Во время эксплуатации RAID 10, случается и такое, что выходят из строя два диска. Здесь возможны следующие варианты:

1) Оба диска принадлежат к одному страйпу, контроллер корректно обрабатывает исключительную ситуацию, и массив продолжает функционировать нормально.

2) Оба диска принадлежат к одному страйпу, но массив разваливается. В этом случае просто берём исправный страйп, и программно собираем его (об этом ниже).

3) Диски принадлежат к разным страйпам, но в одном из них уцелел первый, а в другом второй накопитель. Попробуйте программно собрать из них RAID 0.

4) Вышли из строя одноимённые диски разных страйпов. Увы :( Один из сломанных дисков придётся отремонтировать, или каким-либо ещё образом снять с него данные. Затем программная сборка.

RAID 5 – массивы с контролем четности. Основным их достоинством которых является распределение блоков информации и контрольных блоков четности по всем дискам массива. Для создания такого массива требуется  минимум три диска. Объём массива равен сумме объёмов составляющих его накопителей, минус один диск. Блоки контроля чётности используются для вычисления недостающей информации при выходе из строя одного из накопителей, составляющих массив. Таким образом, при утрате одного из дисков данные не теряются, и массив может продолжать работу.

К сожалению, случается такое, что после выхода из строя одного накопителя, контроллер неверно обрабатывает исключительную ситуацию и массив перестает корректно работать, либо полностью «падает». Подобный сбой может возникнуть также во время выполняемого после замены диска ребилда. Бывает и такое, что в течении короткого времени после смерти первого диска, выходит из строя ещё один.

Если массив развалился, и количество неисправных дисков не более одного, то его можно собрать программно, аналогично тому, как собирается RAID 0. При выходе из строя двух накопителей, сначала потребуется восстановить работоспособность, или снять информацию на исправный диск с одного из них, и лишь затем можно заняться сборкой массива.

Практика: Описание действий при падении массива

Расскажу Вам о том, чего не стоит делать,  для того, чтобы окончательно не потерять  данные. 

Прежде всего, не стоит создавать новый массив из старых дисков в надежде, что он запустится, и будет работать как раньше. Это может и сработать, но достаточно высока вероятность того, что контроллером будут выполнены  действия, которые приведут к уже необратимой потере данных.

Запуск инициализации тоже ни к чему хорошему не приведёт, так что рекомендуется от неё отказаться, а если это не возможно, то использовать только quick init.

Чем еще можно навредить массиву?  Запуском чекдиска или чего-то подобного. А вообще лучше всего помнить, что при потере информации на  RAID следует отказаться от любой записи на диски. Если вы точно не знаете, приведут ли определенные действия к утрате информации или нет, то лучше либо проконсультироваться с тем, кто это знает, либо отказаться от их выполнения.

Продолжение и другие статьи тут >>>

*****

Последние публикации в разделе «Новости и обзоры»:

  • «FTP-клиенты: FlashFXP v.3.7.5 Build 1300 Beta»
    Выпущена новая бета-версия популярной и очень удобной программы FlashFXP v.3.7.5, которая позволяет кроме традиционных для ftp-клиентов функций по загрузке файлов с локальной машины на сайты и обратно, управлять пересылкой файлов между отдельными серверами (FXP). Имеется поддержка докачки после разрыва связи, синхронизации директорий на локальной и удаленной машине, планирование работы клиента во времени и многое-многое другое...
  • «IBM: мейнфрейм нового поколения для среднего бизнеса»
    Корпорация IBM анонсировала новый мэйнфрейм System z10 Business Class (z10 BC). Разработанная как высокопроизводительная младшая версия представленного ранее в этом году мэйнфрейма масштаба крупного предприятия IBM System z10 Enterprise Class (z10 EC), новая система IBM z10 Business Class делает преимущества, характерные мэйнфреймам IBM, доступными клиентам из сектора среднего бизнеса. Теперь компании на развивающихся рынках (подобно ЮАР и Сингапуру) или из быстрорастущих экономических сегментов (таких как мобильная коммерция или социальные сети) могут позволить себе флагманскую технологию мэйнфрейма IBM по цене ниже 100 тыс. долларов...
  • «Мониторинг серверов: DEKSI Network Inventory v.8.1»
    Обновилась мощная утилита DEKSI Network Inventory, которая поможет отследить работоспособность компьютеров и программного обеспечения на них. DEKSI Network Inventory позволяет экспортировать ценную информацию в MS Access, MS Excel, ODBC и Oracle. DEKSI Network Inventory поможет сетевым администратором автоматически устанавливать исправления от Microsoft на все клиентские компьютеры, после установки MBSA. В состав DNI также входит несколько других полезных утилит...
  • «Настройщики: Mz Vista Force v.2.2»
    Mz Vista Force - бесплатная программа для настройки внутренних параметров операционных систем семейства Windows Vista на максимальное быстродействие и оптимизации Интернет-соединений. Для работы приложения необходим установленный .NET Framework версии 2.0+...
  • «Роадмап по завершению выпуска (EOL) настольных, серверных и мобильных процессоров Intel»
    Слайды, демонстрирующие жизненный цикл (Product Lifecycle Roadmap) процессоров Intel, привел на страницах своего сайта источник...

*****

Обзор серверного и сетевого программного обеспечения с возможностью скачать:

  • BlindScanner Pro, 3.10
    Программа BlindScanner расшарит (сделает общедоступным) и откроет доступ к сканеру в локальной сети, неподключенному напрямую к вашему компьютеру, а установленному, например, на компьютере, который расположен в соседнем кабинете. Возможности программы: легкость в использовании, сохранение в различные форматы, сжатие изображений, автоматическое сканирование, мультистраничное сканирование, поддержка автоподатчика...
  • AggreGate Network Manager for Linux, 4.11.03
    AggreGate SNMP Network Manager - это система для мониторинга и контоля IP сетей, включающих маршрутизаторы, коммутаторы, серверы, датчики и другие устройства. Возможности по обработке данных включают сигналы тревоги, графики, отчеты, групповые операции, конструктор форм и т.д. Поддерживаются многочисленные способы интеграции с другими системами...
  • UltraVNC, 1.0.5.1
    Программа UltraVNC предназначена для удаленного управления компьютером по любому TCP/IP-соединению...
  • Ngage ICS Viewer, 1.0.0.8
    Ngage ICS Viewer - бесплатная программа для мониторинга трафика в реальном времени...
  • Strong DC++, 2.21
    Программа StrongDC появилась как дальнейшее развитие клиента CZDC++, который, в свою очередь, «произошел» от классического DC++. Direct Connect - это файлообменная система, построена по тому же принципу что и eDonkey, Kazaa и т.п. То есть на компьютер ставится DC++-клиент, в котором указывается какие папки сделать «общими», после чего он подключается к общему серверу в локальной сети, и через сервер позволяет увидеть компьютеры, подключенные к нему...

Внимание! У нас открыт форум посвященный серверному и компьютерному оборудованию, программному обеспечению и телефонии!

Приглашаем Вас принять активное участие в жизни и развитии форума. Создавайте свои темы, дискутируйте с участниками и производителями компьютерной техники. Наши технические специалисты отвечают на любой вопрос по компьютерной и серверной тематике. Если возникли проблемы с Вашим оборудованием - не откладывайте её в долгий ящик, ведь есть МЫ - спросите у нас и получите ОПЕРАТИВНЫЙ БЕСПЛАТНЫЙ ответ в форуме, по почте или ICQ 177229825 (наши специалисты всегда On-Line).

Последние публикации из рубрики «Полезные советы по работе с компьютером»:

Интернет - Почта

Сохранение правил сортировки Outlook Express.
Правила сортировки хранятся в реестре здесь:
HKEY_CURRENT_USER\Identities\{B47BAD20-BDC8-11D4-92E4-B641C8EC2B30}\Software\Microsoft\Outlook Express\5.0\Rules\Mail
У вас будут различаться цифры в скобках и, наверное, версия.
После переустановки той же версии ОЕ на тот же компьютер создастся новая ветка реестра с другими цифрами в скобках. Я, чтобы не устанавливать вручную правила сортировки по-новому, делал так:

– сохранял старую ветку реестра в файле;
– переустанавливал Windows, устанавливал ОЕ;
– запускал сохранённый reg-файл;
– заходил в реестр по вышеуказанному адресу, там две ветки:
HKEY_CURRENT_USER\Identities\{новое_значение} и
HKEY_CURRENT_USER\Identities\{старое_значение};
– к имени "нового_значения" прибавлял любой символ (например, "новое_значение_1");

– "старое_значение" переименовывал в "новое_значение";
– сохранял доработанную таким образом ветку в файле и удалял её из реестра;
– переименовывал "новое_значение_1" в "новое_значение";
– запускал сохранённый reg-файл.
Так делал для того, чтобы руками в сохранённом файле с правилами не заменять старую группу цифр на новую (там их очень много).

Вячеслав Вербович

Другие публикации и советы тут >>>

Отдохни (анекдоты, забавные истории):

Вчера устанавливал Windows. "Винда" сама нашла все встроенные устройства, сетевой принтер, старый монитор в шкафу и три дохлых мыши в ящике.

*****

Нажмите какую-нибудь клавишу для выхода или любую другую для продолжения.

Другие анекдоты тут >>>

Приглашаем авторов и журналистов, пишущих статьи по тематике информационных технологий!
Разместите их у нас на сайте anobis.ru в разделе статьи!


Вы можете добавить свою новость, статью или программу по адресу (необходимо зарегистрироваться): http://www.anobis.ru
По вопросам размещения Ваших статей и информации в наших рассылках - пишите нам: osbekar@mail.ru
ICQ: 340597008

Подпишитесь на другие наши рассылки

Рассылки Subscribe.Ru
Секреты рекламы и создания интернет-магазинов
Скидки, подарки, призы...
1С и электронная коммерция
Серверы, сетевое оборудование, тесты, характеристики, советы
Рукопашный бой для девушек – выживание, психология, самозащита!
Милосердие. Чем ты можешь помочь ближнему.
Православные знакомства.
Здоровый образ жизни.

В избранное