Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Серверы, сетевое оборудование, тесты, характеристики, советы Кластеры как средство повышения отказоустойчивости систем


Информационный Канал Subscribe.Ru



Сумма Технологий - Серверные Системы

информационно-аналитический бюллетень
Проект компании "SumTech Servers Systems"
www.stss.ru

04.08.2005

Кластеры как средство повышения отказоустойчивости систем - 1 часть.

Цель этой статьи - ознакомить посетителей нашего сайта с преимуществами применения кластерных решений. Построим это знакомство на примерах конкретных реализаций и постараемся дать сводный обзор кластерных отказоустойчивых технологий. Более полную информацию от производителей рассматриваемых решений можно найти по приведенным в тексте ссылкам. В конце даются ссылки на статьи доступные в Интернет, материалы которых использовались при подготовке этого обзора. Хочется надеяться, что эта статья поможет получить общее представление об особенностях кластерных решений для повышения отказоустойчивости компьютерных систем.

По мере развития своей функциональности информационные технологии все более полно интегрируются в деятельность предприятий и организаций. Чем больше мы полагаемся на компьютерные системы, тем больше и наша зависимость от их бесперебойной работы. Понимание того, что отказы и простои обходятся все дороже, заставляет искать отказоустойчивые решения - вносить изме-нения в структуру существующих систем и переосмысливать правила построения информационных комплексов предприятий.

Выбор конкретного решения разумно определяется тем, что стоимость последствий возмож-ного отказа не должна превышать стоимости затрат, необходимых для построения отказоустойчивой системы.

Кластеры, как технологии для построения систем высокой доступности, на рынке известны давно, однако, несмотря на целый ряд преимуществ, их массовое применение сдерживалось из-за вы-сокой цены. Сегодня из-за снижения стоимости аппаратных средств и совершенствования самих кла-стерных технологий, их применение становится экономически оправданным в большинстве органи-заций. Действительно, сейчас для построения кластеров можно использовать недорогие серверы на платформе Intel, стандартные сетевые адаптеры и распространенные операционные системы. Именно доступность недорогих кластеров делает эту технологию все более привлекательной, и кластеры из разряда экзотики переходят в категорию рядовых решений повышения отказоустойчивости компью-терных систем.

Повышение отказоустойчивости и преимущества кластера

Понятно, что для повышения надежности компьютерной системы можно использовать неко-торую избыточность ее оборудования, чтобы, в случае выхода из строя, неисправное устройство за-менялось на резервное. Например, использование резервных вентиляторов, двух или трех блоков пи-тания и применение избыточной RAID технологии в дисковой подсистеме являются типичными ре-шениями повышения отказоустойчивости при построении серверов. При этом переход на резерв обычно осуществляется на аппаратном уровне. Резервирование принято называть горячим, если пе-реход на резерв производится без перерыва в доступности системы и холодным, если для восстанов-ления работоспособности, требуется ее останов и перезапуск.

Комплексным решением повышения отказоустойчивости может быть резервирование не только на аппаратном уровне, но на уровне всей компьютерной системы в целом, включая и опера-ционную систему (ОС) и работающие под ней приложения. Переход на резерв, в этом случае, осуще-ствляется под управлением программного обеспечения (ПО), иногда с использованием дополнитель-ного оборудования. Коротко рассмотрим, как такое резервирование может быть технологически реа-лизовано.

Компанией Novell на базе ОС NetWare была разработана система SFT III работающая по принципу горячего резервирования. Два сервера с одинаковым аппаратным обеспечением, при работе синхронизируясь по специальному каналу, динамически поддерживают зеркальную копию содержи-мого жестких дисков и процессов в памяти. Все клиентские запросы обслуживаются только одним из серверов, другой же находится в пассивном режиме до момента отказа активного сервера. Клиенты не ощущают сбоев в работе при переходе на резерв, так как перезапуска процессов при переключе-нии не происходит. Платой за повышение отказоустойчивости в данном случае является неэффек-тивное использование вычислительных ресурсов - резервный сервер в режиме ожидания кроме дуб-лирования никакой работы для клиентов не выполняет.

Оригинальное и значительно более экономичное решение было предложено компанией Vinca. Пакет StandbyServer Many-to-One реализует принцип холодного резервирования в среде ОС Novell Netware. Во время работы на диски резервного сервера ведется копирование данных с нескольких разных активных серверов. Идентичности аппаратного обеспечения серверов не требуется. При отка-зе одного из активных серверов, резервный сервер способен заменить клиентам вышедший из строя сервер. Недостатком данного решения является то, что процесс активизации резервного сервера за-нимает значительное время, так как требуется его перезапуск.

А можно ли построить отказоустойчивую систему свободную от недостатков показанных в вышеприведенных примерах? Вот, наконец-то, мы и подошли к рассмотрению кластерных систем.

Кластерные решения также применяются для обеспечения устойчивости к сбоям на уровне всей системы, однако имеют ряд преимуществ по сравнению с обычным резервированием. Строго говоря, кластеры могут работать и в режиме резервирования, но такая настройка будет неоправданна.

Итак, кластер - это программно-аппаратный комплекс, состоящий из нескольких свя-занных между собой компьютеров, который используется и управляется как единая система.

Пользователи при обращении "видят" кластер как один большой сервер, на котором работает множество приложений, и предоставляются сетевые службы, хотя в действительности все это функ-ционирует на различных компьютерах кластера называемых узлами. При отказе программного или аппаратного компонента узла его сервисы и приложения, по указанным правилам, автоматически пе-рераспределяются между другими узлами, и кластер продолжает предоставлять эти ресурсы пользо-вателям. При восстановлении работоспособности отказавшего узла его приложения и сервисы, если это предварительно указано в настройках, могут быть перенесены обратно.

По внутрикластерным каналам узлы осуществляют обмен необходимой информацией, контролируют работу и состояние друг друга. Эти межузловые соединения обычно не связаны с клиентской ЛВС, хотя существуют реализации кластеров, позволяющие узлам взаимодействовать и по внешней общедоступной сети в случае отказа межузлововых каналов.

У кластера могут быть общие подсистемы хранения данных, физически доступные несколь-ким узлам, что, впрочем, не исключает наличие подобных локальных подсистем на самих узлах. На-пример, это может быть общая оперативная память или, что типично для большинства кластеров, общая дисковая подсистема. Узлы совместно управляют присоединенными к ним устройствами хранения данных.

Узлов в кластере может быть от двух до нескольких десятков, причем узлы могут иметь различную аппаратную конфигурацию: разное количество процессоров и оперативной памяти, разную емкость локальных жестких дисков и т.д.

Возможно добавление нового узла в кластер, и это не требует перегрузки других узлов. Таким образом, при нехватке вычислительных ресурсов кластер можно "на ходу" наращивать.

В распределении нагрузки задействованы все узлы, что, по сравнению с простым резервиро-ванием, позволяет более эффективно использовать имеющиеся вычислительные мощности.

Представление кластера как единого владельца ресурсов всех узлов позволяет управлять кла-стером как одной системой, что намного проще, чем управлять разрозненным парком серверов. Разу-меется, с помощью соответствующих утилит, администратор может управлять и отдельными узлами.

*****

Последние публикации в разделе «Новости и обзоры»:

  • «Intel собирается переделать «ноутбучный» процессор в «серверный»»
    Один из серверных процессоров, которые компания Intel намерена выпустить в следующем году, имеет необычные корни: его предшественники предназначались для ноутбуков...
  • «В MDaemon найдена опасная уязвимость»
    Эксперты по информационной безопасности обнаружили уязвимость в почтовом сервере MDaemon...
  • «Elpida начинает производство "самых-самых" модулей FB-DIMM 4 Гб для серверов»
    Компания Elpida сообщила о начале выпуска модулей памяти FB-DIMM (Fully Buffered Dual In-Line Memory Modules), предназначенных для использования в серверах. Как утверждает изготовитель, новые модули характеризуются самой высокой скоростью работы, самой высокой плотностью хранения данных и уменьшенной толщиной. Среди дополнительных преимуществ новой памяти — улучшенная синхронизация с контроллером памяти и повышенная скорость шины, обеспечивающая поддержку нового поколения высокопроизводительных серверных процессоров...
  • «Intel обыграл AMD благодаря Microsoft»
    Второй квартал закончился для AMD уступкой 0,7% рынка процессоров конкуренту — Intel. Несмотря на большие достижения AMD на рынке серверов, Intel обыграл компанию благодаря поставкам Pentium III, закупленных Microsoft для игровых консолей Xbox...

Имеющиеся у Вас материалы по тематике бюллетеня Вы можете опубликовать на нем, отправив их по адресу biznesolimp@mail.ru в имеющемся у Вас формате. Не забудьте указать Ваши координаты и информацию личного характера, которую желаете опубликовать вместе с предоставленными материалами.

В нашей конференции Вы можете обсудить новые темы:

  • Сетевая по витой на четыре контакта

  • Фирма подключила кабель по витой паре на четыре контакта к сетевой карте. Обычно на восемь контактов подключают (если сетевая). Интернет, то работает, то не работает. Подскажите пожалуйста можно проблему с подключением решить? У меня информация на восемь контактов только имеется. И в сети и между двумя компьютерами. А вот с четырьмя чего-то не понятно...
  • Fedora Core 4 и Intel SRCU42X

  • Уже три дня маюсь - не могу заставить работать установщик Fedora на сервер, оборудованный этим контроллером. Постоянно Kernel Panic, который убивает init... Что делать - не подскажите?...
  • Заменить зеркало на сервере под в2к3

  • Проблема: сервер под в2к3. Система на зеркале из 18 Гб, данные на другом канале этого же контроллера (intel srcu 32) в рэйд10. В зеркале умер второй винт. На 18 гиг новых нет, ЗИП тоже нет -> купили 2 по 36. Ставить новый в пару к старому не очень хочется, решил попробовать перенести систему на новое зеркало. Но как это правильно сделать? Мне видится 2 варианта: 1. Поставить новый винт в пару к старому, дождаться окончания зеркалирования, выключить сервер, вынуть старый, на его место поставить только что зазеркалированный и в пару к нему второй новый. Но будет ли такой вариант вообще работоспособен и получится ли увеличить "на горячую" размер раздела до 36 или создать там ещё один логический диск, чтобы место не пропадало? 2. Создать акронисом образ раздела и перенести целиком на новый винт. Вроде всё должно быть ок, но не могу придумать, как запустить восстанавливалку образов на сервере после вынимания винта - ведь системы там уже не будет?...

Внимание! У нас открыт форум посвященный серверному оборудованию!

Приглашаем Вас принять активное участие в жизни и развитии форума. Создавайте свои темы, дискутируйте с участниками и производителями компьютерной техники. Наши технические специалисты отвечают на любой вопрос по компьютерной и серверной тематике. Если возникли проблемы с Вашим оборудованием - не откладывайте её в долгий ящик, ведь есть МЫ - спросите у нас и получите ОПЕРАТИВНЫЙ БЕСПЛАТНЫЙ ответ в форуме, по почте или ICQ 177229825 (наши специалисты всегда On-Line).

Последние публикации из рубрики «Полезные советы по работе с компьютером»:

Локальные сети

Удалённое выключение нескольких компьютеров одновременно.

Если у Вас в конторе множество машин и Вам надоело каждый раз после рабочего дня ходить и выключать их, используйте утилиту shutdown.exe из Windows NT Resource Kit и bat-файл (компьютеры PDC и BDC выключаются через 2 секунды, локальные — через 5):

========

shutdown \\pdc /t:2 /y /c

shutdown \\bdc /t:2 /y /c

shutdown /l /t:5 /y /c

========

Создайте на рабочем столе ярлык для этого командного файла и выключайте все компьютеры нажатием на этот ярлык.

Андрей Харченко

Отдохни (анекдоты, забавные истории):

Злые программисты утверждают, что слово "деБилльный" произошло от корня "Билл", (Гейтс, разумеется).

*****

Сидят два программиста в кабаке под изрядным количеством пива...
Мимо проходит потрясающая девушка...
Пеpвый: Ого, глянь какие пpопеpтис!
Втоpой: Да-а-а жаль только, что pид онли!

Приглашаем авторов и журналистов, пишущих статьи по тематике информационных технологий!
Разместите их в бюллетене у нас совершенно – БЕСПЛАТНО!


Архив рассылки по адресу: http://www.stss.ru
Пишите нам: biznesolimp@mail.ru
ICQ: 177229825 (техническая поддержка - любые вопросы)
ICQ: 149756711 (отдел продаж)
ICQ: 340597008 (по вопросам размещения информации в рассылке)
Тел./Факс (095)737-55-77 (многоканальный - любые вопросы)

Online System Group - Создание сайта, создание интернет магазина. Профессиональные Веб - сайты - решения по разработке интернет магазинов и сайтов. Технология создания сайтов и интернет магазинов. Аренда интернет-магазинов от 50$.

Новый Иерусалим on-line: Все о Ново Иерусалимском монастыре, городская и районная информация, объявления, расписание автобусов и электричек, телефоны предприятий и частных лиц, православный чат, форум и много другой полезной информации.

Подпишитесь на другие наши рассылки

Рассылки Subscribe.Ru
Секреты рекламы и создания интернет-магазинов
Скидки, подарки, призы...
1С и электронная коммерция
Серверы, сетевое оборудование, тесты, характеристики, советы
Рукопашный бой для девушек – выживание, психология, самозащита!
Милосердие. Чем ты можешь помочь ближнему.
Православные знакомства.

Subscribe.Ru
Поддержка подписчиков
Другие рассылки этой тематики
Другие рассылки этого автора
Подписан адрес:
Код этой рассылки: comp.hard.stss
Отписаться
Вспомнить пароль

В избранное