12. Системы высокой готовности и отказоустойчивые системы
UNIX-кластеры компании IBM
Компания IBM предлагает несколько типов слабо связанных систем
на базе RS/6000, объединенных в кластеры и работающих под управлением
программного продукта High-Availability Clastered Multiprocessor/6000
(HACMP/6000). В этих системах поддерживаются три режима автоматического
восстановления системы после отказа:
Режим 1 - в конфигурации с двумя системами, одна из которых является
основной, а другая находится в горячем резерве, в случае отказа
обеспечивает автоматическое переключение с основной системы на резервную.
Режим 2 - в той же двухмашинной конфигурации позволяет резервному
процессору обрабатывать некритичные приложения, выполнение которых
в случае отказа основной системы можно либо прекратить совсем, либо
продолжать их обработку в режиме деградации.
Режим 3 - можно действительно назвать кластерным решением, поскольку
системы в этом режиме работают параллельно, разделяя доступ к логическим
и физическим ресурсам пользуясь возможностями менеджера блокировок,
входящего в состав HACMP/6000.
Начиная с объявления в 1991 году продукт HACMP/6000 постоянно развивался.
В его состав были включены параллельный менеджер ресурсов, распределенный
менеджер блокировок и параллельный менеджер логических томов, причем
последний обеспечил возможность балансировки загрузки на уровне
всего кластера. Максимальное количество узлов в кластере возросло
до восьми. В настоящее время в составе кластера появились узлы с
симметричной многопроцессорной обработкой, построенные по технологии
Data Crossbar Switch, обеспечивающей линейный рост производительности
с увеличением числа процессоров.
Первоначально обязательным требованием режима 3 было использование
высокопроизводительной дисковой подсистемы IBM 9333, которая использовала
последовательный дисковый интерфейс с поддержкой 17.6 Гбайт дискового
пространства, а также дисковой подсистемы IBM 9334 с интерфейсом
SCSI, обеспечивающим дисковое пространство в 8.2 Гбайт. В августе
1993 года была анонсирована первая подсистема RAID: две модели 7135
RAIDiant Array могут поддерживать до 768 Гбайт дискового пространства
в стоечной конструкции серии 900 и 96 Гбайт в напольных тумбовых
конструкциях, при этом реализуют RAID уровней 1, 3 и 5.
Кластеры RS/6000 строятся на базе локальных сетей Ethernet, Token
Ring или FDDI и могут быть сконфигурированы различными способами
с точки зрения обеспечения повышенной надежности:
- Горячий резерв или простое переключение в случае отказа. В этом
режиме активный узел выполняет прикладные задачи, а резервный
может выполнять некритичные задачи, которые могут быть остановлены
в случае необходимости переключения при отказе активного узла.
- Симметричный резерв. Аналогичен горячему резерву, но роли главного
и резервного узлов не фиксированы.
- Взаимный подхват или режим с распределением нагрузки. В этом
режиме каждый узел в кластере может "подхватывать" задачи,
которые выполняются на любом другом узле кластера.
|