ПРОЦЕССОРЫ
AMD делает ставку на 64-разрядную архитектуру
Самая сложная проблема новейшей 64-разрядной архитектуры ЦП связана
с ее неполной совместимостью по программному обеспечению с преобладающей
ныне 32-разрядной архитектурой. AMD надеется, что ситуация изменится
с выпуском Opteron - первого процессора из фирменного семейства
микросхем AMD64 (кодовое обозначение Hammer).
Opteron нас положительно поразил. По результатам нашего тестирования
он явно превзошел 32-разрядный Хеоп фирмы Intel, а кроме того,
в нем предусмотрен более простой способ перехода к 64-разрядной
архитектуре по сравнению с предлагаемым компанией Intel переходом
к 64-разрядной платформе IA-64 (представленной семейством Ita-nium).
Разработанная фирмой AMD платформа расширяет 32-разрядную архитектуру
х86 до 64 разрядов. На долгом пути развития 64-разрядной архитектуры
предложенный компанией Intel проект IA-64 кажется более революционным,
в то время как AMD больше рассчитывает на эволюцию. Opteron, в
отличие от IA-64, обеспечивает работу уже имеющихся 32-разрядных
программ с выигрышем, а не потерями в производительности. Это
позволит компаниям переходить к 64-разрядному программному обеспечению
постепенно, поскольку на одном и том же компьютере, оснащенном
процессором Opteron, смогут работать как 32-, так и 64-разрядные
приложения без потери скорости.
Отметим для сравнения, что компаниям, использующим при переходе
к 64-разрядным вычислениям процессоры Ita-nium, придется для выполнения
32-разрядных приложений переключать Ita-nium в 32-разрядный режим
(понижающий производительность) либо предусмотреть в имеющемся
парке машин наличие как 32-разрядных серверов и рабочих станций,
так и компьютеров на основе процессора Itanium из семейства IA-64.
Процессор Opteron кажется хорошим выбором для тех, кто хочет установить
на своих предприятиях однотипное оборудование на основе единой
платформы, обеспечивающей при этом достаточно высокий уровень
производительности.
Важно отметить, что, хотя Opteron считается 64-разрядным процессором,
этот первый представитель семейства, реализующего архитектуру
AMD64, предусматривает только 48-разрядную виртуальную и 40-разрядную
физическую адресацию, тогда как Itanium 2 рассчитан на 64-разрядное
виртуальное и 50-разрядное физическое пространство адресов. Opteron
вполне пригоден для выполнения задач, возлагаемых сегодня на многие
серверы и большинство рабочих станций, но мы еще раз напомним,
что Itanium обладает более высокой производительностью.
Сильные стороны IA-64 проявляются также в серверных структурах
с использованием более четырех процессоров (4Р) с возможностью
эффективного масштабирования до 32Р, что имеет решающее значение
для приложений, требующих интенсивных вычислений с плавающей точкой.
С самого начала тестирования Opteron прекрасно проявил себя в
конфигурациях от 2Р до 4Р.
Итак, если Intel со своими последующими версиями процессора Itanium,
скорее всего, сохранит в ближайшие несколько лет первенство в
области высокопроизводительных серверов высокого класса, то конструкции
на базе Ор-teron (по крайней мере, поначалу), по всей вероятности,
составят конкуренцию серверам и рабочим станциям на процессоре
Хеоп. В этом чувствительном к издержкам секторе рынка цр достоинству
будет оценен и более низкий уровень затрат на подготовку разработчиков,
требуемый при использовании ЦП Opteron.
Главные конструктивные элементы ЦП Opteron
Взяв за основу хорошо зарекомендовавшую себя архитектуру, специалисты
AMD при проектировании Opteron использовали ядро процессора Athlon
ХР, существенно дополнив и улучшив его. Оба процессора выполнены
с 0,13-мкм проектными нормами. Наиболее быстродействующая в семействе
Athlon модель ХР 3000+ работает на частоте 2,16 ГГц, а самый быстрый
Opteron (Opteron 244) рассчитан на частоту 1,8 ГГц, но для изготовления
последнего применяется технология КНД (кремний на диэлектрике),
которая обеспечивает уменьшение емкостей транзисторов и тем самым
способствует повышению быстродействия схем.
В принятой компанией AMD новой системе обозначений для семейства
Opteron первая цифра указывает, что речь идет о двухпроцессорной
микросхеме. Следующими двумя цифрами отмечается относительная
производительность (чем меньше числа, тем ниже быстродействие).
Так, модели 240 и 242 работают на частотах соответственно 1,4
и 1,6 ГГц, а микросхемы серий 100 и 800 предназначены для одно-
и восьмипроцессорных систем.
Как это часто бывает с изделиями от AMD, тактовая частота мало
о чем говорит; их быстродействие обеспечивается другими факторами.
В отличие от модели Athlon ХР в процессоре Opteron реализована
архитектура "северного моста" с контроллером DDR-памяти,
обслуживающим два 72-разрядных канала. В нынешнем виде эта структура
способна работать с DDK SDRAM объемом до 8 Гбайт на частотах 200,
266 и 333 МГц. Утверждается, что встроенный контроллер памяти
уменьшает задержку обращения к памяти примерно на 20% по сравнению
с внешним интерфейсом на "северном мосте".
Opteron и Athlon ХР оснащены 128-Кбайт кэшем L1, который разбит
на две части по 64 Кбайт для данных и команд. Но помимо удвоения
размера буферов команд и быстрого преобразования: адреса (с 256
до 512 Кбайт) для процессора Opteron увеличен и общий объем кэша
L2 с 512 Кбайт до 1 Мбайт. В кэш-памяти и DDR применяется код
с исправлением ошибок.
Несмотря на более низкую по сравнению с Athlon ХР тактовую частоту
процессора Opteron, в новом ЦП немного удлинен конвейер, что позволит
установить больший, чем для процессора Athlon ХР, коэффициент
умножения тактовой частоты. В Opteron предусмотрено 12 ступеней
выполнения целочисленных операций и 17 ступеней операций с плавающей
точкой против соответственно И и 15 для Athlon ХР. Кроме того,
в составе нового микропроцессора применяется набор команд SSE2,
которого нет в Athlon ХР. При измерениях на той же тактовой частоте
ядра процессор Opteron осуществлял обработку SSE-команд и целочисленное
умножение быстрее, чем Athlon ХР.
Добавим, что команды SSE (и SSE2) выполняются в процессоре Opteron
значительно быстрее вследствие того, что они реализованы аппаратно,
а не в виде последовательности микрокоманд. Благодаря наличию
в кэше L2 селекторов ветвления в процессоре обеспечивается также
прогнозирование ветвления. Эти на первый взгляд незначительные
улучшения позволяют обрабатывать больше команд за такт, чем в
процессоре Athlon ХР.
В расчете на многопроцессорные структуры Opteron имеет в своем
составе три порта Hyper-Transport для соединения с другими ЦП.
В намеченной к выпуску серии 800 эти порты должны обеспечивать
практически "бесшовную" совместную работу до восьми
процессоров. Кроме того, для осуществления доступа к средствам
ввода-вывода возможно взаимодействие нескольких процессоров с
компонентами системного набора ИС.
Так как микросхемы серии 200 рассчитаны на объединение в пары,
когерентным будет только одно соединение Hyper-Transport. То есть
по нему можно будет передавать информацию о взаимном соответствии
содержимого кэшей двух процессоров. В микросхеме серии 100 когерентных
соединений HyperTransport не предусмотрено, а в серии 800 когерентными
будут все три соединения, обеспечивая согласованность действий
восьми микропроцессоров.
Opteron и Хеоп
AMD позиционирует Opteron на рынке в качестве конкурента процессору
Хеоп, и поэтому мы провели их сравнение. Стремясь к тому, чтобы
испытательные системы были как можно более идентичны, мы воспользовались
двухпроцессорным сервером на базе Opteron 242 и аналогично сконфигурированным
двухпроцессорным сервером на основе Хеоп с тактовой частотой 2,8
ГГц. Обе тестовые системы были выполнены компанией Polywell в
виде стоечной конструкции высотой 1U.
В основу машины на процессорах Opteron была положена исходная
конструкция, которую AMD и Newisys предложат изготовителям систем.
Вариант фирмы Polywell получил официальное наименование PolyRaxx
2200А-242; его цена в конфигурации с 4-Гбайт памятью 333 DDK SDRAM
и двумя 10 000-об/мин 36-Г5айт жесткими SATA-дисками составляет
5250 долл. В состав тестовой конфигурации на процессорах Хеоп
входили такие же диски, но из-за ограничений, налагаемых набором
микросхем, рабочая частота 4-Гбайт памяти DDR 333 составила 266
МГц.
Для сопоставления этих серверов мы воспользовались своим 32-разрядным
тестом серверов приложений, реализующим спецификацию Nile. (Он
имитировал транзакции по заказам посетителей фиктивного книжного
Mfeb-магазина.) Проводимый тест характеризуется интенсивной нагрузкой
на процессорные и дисковые подсистемы. При проведении теста Nile,
в который входит пакет сервера приложений ВЕА WebLogic Server
7.0.2, в качестве СУБД использовался пакет Oracle 9i. Оба проходивших
испытания сервера работали в среде Windows 2000 с SP3.
Как видно из полученной диаграммы рассеивания, система на двух
процессорах Opteron существенно превосходила сервер на двух процессорах
Хеоп. Так, на тесте Pages Received (принятые страницы) при уровне
нагрузки в пределах от 300 до 500 пользователей (где производительность
при обработке транзакций стабилизировалась высокой интенсивностью
обращения к дискам и ЦП) показатель машины на процессорах Хеоп
составил в среднем 7,6 страницы в секунду, а для ЦП Opteron средняя
величина оказалась равной 15,2. На тесте Search Response Times
(время отклика на поиск) показатели обоих серверов при уровне
нагрузки 200 пользователей получились очень близкими. Но по мере
увеличения числа виртуальных пользователей для обслуживания запросов
серверу на процессорах Хеоп требовалось гораздо больше вре мени,
чем модели на процессорах Opteron.
Мы проводили также ориентированные на сдвоенные процессоры тесты
SPEC, в которых выделялись показатели производительности отдельных
процессоров. Opteron и в этом случае опередил Хеоп. За такую производительность
приходится, конечно, платить: при прочих равных условиях сервер
на процессорах Opteron обойдется в расчете на один процессор примерно
на 300 долл. дороже, чем на процессорах Хеоп.
По мере удешевления памяти и роста объемов данных перед большинством
компаний и даже отдельных высококвалифицированных пользователей
и разработчиков может в скором времени возникнуть необходимость
выйти за 4-Гбайт предел физического адресного пространства 32-разрядной
архитектуры. Opteron существенно облегчит переход к 64-разрядной
архитектуре, особенно с появлением осенью настольных машин с ЦП
Athlon 64. Именно таким образом и может существиться проникновение
на корпоративный рынок, к которому стремится компания AMD.