12. Системы высокой готовности и отказоустойчивые системы
Кластеры AT&T GIS
Отделение GIS (Global Information Systems) образовалось после покупки
AT&T компании NCR, успешно работавшей в направлении создания
систем с симметричной многопроцессорной обработкой (SMP) и систем
с массовым параллелизмом (MPP) на базе микропроцессоров Intel. В
1993 году NCR анонсировала программное обеспечение для поддержки
высокой готовности, получившее название LifeKeeper FRS (Fault Recilient
Systems) Clastering Software, которое вместе с дисковыми массивами
NCR позволяло строить высоконадежные кластерные решения. В состав
кластеров NCR могут входить многопроцессорные системы серий 3400
и 3500, каждая из которых включает от 1 до 8 процессоров 486DX2
или Pentium (рис. 11.3).
Disk Array Subsystem 6298 включает до 20 дисковых накопителей емкостью
1 Гбайт и поддерживает RAID уровней 0, 1, 3 и 5 в любой комбинации.
Подсистема обеспечивает замену дисковых накопителей, вентиляторов
и источников питания в режиме on-line, т.е. без приостановки работы
системы. В ней предусмотрено три порта и возможна поставка с избыточными
контроллерами.
Программное обеспечение LifeKeeper допускает построение кластеров
высокой готовности с четырьмя узлами, причем любой из узлов кластера
может служить в качестве резервного для других узлов. Плановое время
простоя для инсталляции программного обеспечения может быть значительно
снижено, поскольку переключение на резерв можно инициировать вручную,
затем модифицировать программное обеспечение и произвести обратное
переключение с резерва. LifeKeeper обеспечивает также восстановление
системы после обнаружения ошибок в системных, прикладных программах
и периферийном оборудовании. Он обеспечивает автоматическое переключение
при обнаружении отказа и инициируемое оператором обратное переключение.
Все связи узлов кластера с помощью Ethernet, Token Ring и FDDI дублированы,
а дисковые подсистемы, как уже отмечалось, могут подключаться сразу
к нескольким узлам кластера. Все это обеспечивает построение системы,
устойчивой к одиночным отказам, причем программное обеспечение выполняет
автоматическое обнаружение отказов и восстановление системы.
Рис. 11.3. Архитектура двухмашинного кластера
AT&T GIS LifeKeeper FRS
При использовании Oracle Parallel Server распределенный менеджер
блокировок, входящий в состав LifeKeeper, позволяет параллельной
базе данных работать с системой высокой готовности.
В планы компании входит построение крупномасштабных кластеров для
университетских кампусов, а также глобальных кластеров, способных
продолжать работу в случае стихийных бедствий.
|