|
Процессор Athlon 64 3000+: особенности архитектуры, производительность
До 2003 года 64-разрядные процессоры в настольных ПК не использовались. Они находили применение в серверах, рабочих станциях, даже в игровых консолях, но не в «персоналках». Корпорация Intel, законодатель мод на рынке настольных систем, полагала, что большинством пользователей ПК 64-битные вычисления не будут востребованы. Они необходимы для выполнения сложных научных, деловых и инженерных расчетов. Для таких задач Intel предлагает процессоры с совершенно новой архитектурой – Itanium. А компания AMD так не считала. В новое семейство процессоров K8 с самого начала была заложена поддержка расширенных 64-разрядных инструкций. Осенью 2003 года на рынок вышли первые 64-разрядные процессоры для настольных ПК, получившие название “Athlon 64”.
На самом деле уникальность новых процессоров AMD отнюдь не ограничивается 64-битностью. Эти процессоры внесли коррективы в архитектуру платформы ПК в целом, а не только в набор команд и регистров. Особенность 1: встроенный контроллер памятиЯдро процессора Athlon 64 впервые в истории платформы ПК включает логику, до этого размещаемую в северном мосту чипсета. Речь идет о коммутаторе, управляющем потоками данных, команд и управляющих сигналов между основными компонентами компьютера – процессором, оперативной памятью и периферийными устройствами. Сделано это было по вполне очевидной причине – для повышения быстродействия подсистемы памяти. Как известно, именно она сегодня является основным узким местом при выполнении интенсивных вычислений. Расположив контроллер памяти на одном кристалле с ядром процессора, разработчики из AMD решили проблему высоких задержек. При обычной архитектуре ПК данные между памятью и процессором неизбежно проходят через логику чипсета и процессорную шину. У Athlon 64 эти промежуточные стадии отсутствуют, а точнее, их размеры сведены к минимуму. Контроллер памяти соединен с общим коммутатором напрямую, внутри чипа, а тот в свою очередь подключен к внутренней шине процессора. Если бы у такого подхода не было недостатков, он бы давно нашел применение в процессорах. Встроенный контроллер памяти не обладает такой же гибкостью, как внешний. Для его модификации необходимо переделывать весь процессор, менять маски для литографии, проводить множество новых тестов – тратить время и деньги. Конечно, разработчики из AMD постарались упростить себе задачу – максимально изолировали контроллер памяти на кристалле, но его доработка все равно будет трудоемкой. Контроллер памяти наверняка будет мешать наращивать частоты, совершенствовать технологию производства и т.п. Для нас как пользователей это означает только одно – высокие цены на новые семейства процессоров, а также ограниченные возможности разгона. Особенность 2: канал HyperTransportДругая интересная концепция пришла в архитектуру ПК с появлением Athlon 64 – туннели. Это контроллеры, подключаемые к одному высокоскоростному каналу обмена данными по цепочке. Канал, встроенный в Athlon 64, базируется на 16-разрядной шине HyperTransport, разработанной AMD совместно с несколькими партнерами. Эта шина претендует на роль универсального промышленного стандарта и уже применяется в различных устройствах. На ПК эту шину впервые использовала NVIDIA для соединения двух мостов чипсета nForce. В архитектуре Athlon 64 шина HyperTransport в общем случае используется для подключения к коммутатору процессора одного туннеля – AGP-контроллера, и одного оконечного устройства – периферийного моста (обычного южного моста, унаследованного от прежней архитектуры). Гибкость подобной архитектуры состоит в том, что в цепочку между процессором и периферийным мостом можно подключать неограниченное количество туннелей, поддерживающих различные шины и устройства. Расширение возможностей системы становится возможным без сложной модификации всей платформы в целом.
Пару слов о HyperTransport. Базовая частота этой шины совпадает с частотой шины процессора и составляет 200 МГц. Как и в случае с ядром процессора, для увеличения производительности может быть применен множитель частоты; максимальный равняется восьми. За один такт по встроенной в процессор шине передается два 16-битных пакета (технология DDR), отсюда получается пропускная способность - 3.2 Гб/с в каждом из направлений. На сегодня этого вполне достаточно для обслуживания и AGP-видеокарты, и всех остальных устройств. Процессоры Opteron имеют несколько каналов шины HyperTransport, которые служат для соединения с другими процессорами в многопроцессорных конфигурациях. Особенность 3: 64-битная архитектураДа, Athlon 64 является 64-разрядным процессором. Речь идет о том, что его регистры общего назначения (РОН) имеют разрядность 64 бита. Но сам по себе этот факт не может дать прироста производительности, даже если использовать соответствующее ПО. На самом деле нынешние процессоры Athlon XP и Pentium 4 способны обрабатывать даже 128-битные данные в целочисленном формате, используя инструкции SSE. Но в архитектуре AMD64, которая реализована в процессорах Athlon 64, не только расширены существующие регистры, но и добавлены новые – 8 регистров РОН и 8 регистров SSE. Набор инструкций дополнен максимально корректно – коды команд не изменились, а для доступа к дополнительным регистрам необходимо использовать командные префиксы (программисты меня поймут). В итоге Athlon 64 способен выполнять любой 16- и 32-разрядный код без изменений, работая в реальном и защищенном режимах соответственно. 64-битный код, выполняемый в так называемом Long-режиме, благодаря использованию дополнительных регистров и 64-битной адресации будет короче и компактнее, то есть будет работать в общем случае быстрее.
К сожалению, воспользоваться преимуществами 64-битности мы еще долго не сможем. Перейти на 64-разрядную операционную систему, поддерживающую Long-режим, для этого будет недостаточно. Потребуются оптимизированные 64-разрядные драйверы для всех без исключения устройств. Их доводка потребует от разработчиков значительных затрат средств и времени. Другие особенностиВ остальном ядро Athlon 64 похоже на ядро Athlon XP.
Был переработан конвейер – увеличена на две стадии его длина (теперь она составляет 17 стадий для чисел с плавающей запятой и 12 стадий для целочисленной арифметики) при сохранении прежнего разделения на три параллельных ветки для целых чисел и три ветки для чисел с плавающей запятой. Сравните: у Athlon XP конвейер состоит из 10 стадий, у Pentium 4 Northwood – из 20 стадий, у Pentium 4 Prescott – из 31 стадии. К сожалению, разработчики из AMD не исправили блок вычислений с плавающей запятой – он по-прежнему оптимизирован для 80-разрядных, а не 128-разрядных данных, из-за чего скорость выполнения инструкций SSE, а также SSE2, поддержка которых была внедрена в Athlon 64, по-прежнему остается недостаточно высокой. Кэш первого уровня у Athlon 64 совпадает с таковым у Athlon XP – объем 64+64 Кб, двухпортовый, с двумя ассоциативными наборами. Кэш второго уровня – однопортовый, с 16 наборами, подключен к внутренней шине с помощью 128-битной, а не 64-битной шины, как у Athlon XP. Кэширование по-прежнему выполнено по двухуровневой эксклюзивной схеме - суммарный объем кэшируемых данных у Athlon 64 составляет сумму кэша второго уровня и кэша данных первого уровня. В Athlon 64 была добавлена термозащита, позволяющая экстренно останавливать процессор при перегреве. Новый корпус, схожий с корпусом процессора Pentium 4 благодаря наличию медной крышки-рассеивателя, улучшает «эргономику» процессора – теперь риск повредить кристалл или не обеспечить надежный контакт кулера с процессором сведен к минимуму. Еще одно улучшение – система динамического управления частотой и напряжением ядра Cool’n’Quiet, позволяющая снижать общее потребление энергии практически без ущерба для производительности. ВариантыВ предыдущем абзаце намеренно не был указан объем кэша второго уровня. Дело в том, что AMD собирается одновременно выпускать процессоры с различными кэшами. Так, основная серия Athlon 64, а также все процессоры Opteron имеют кэш L2 объемом 1024 Кб. В линейке процессоров Athlon 64 есть модели с 512 Кб кэша, никак не отличимые от остальных моделей, кроме как по рейтингу. Кроме того, процессоры с кэшем 256 Кб тоже появятся на свет, но они, скорее всего, будут обозначаться как 32-разрядные Athlon XP для систем, совместимых с Athlon 64. На момент подготовки статьи у AMD было всего четыре модели процессоров Athlon 64. Все они имеют одноканальный 64-разрядный контроллер памяти с поддержкой обычной памяти DDR400 (в том числе ECC) и устанавливаются в разъем Socket-754. Athlon 64 2800+ и 3000+ имеют кэш L2 512 Кб и тактовые частоты 1.8 и 2 ГГц соответственно. Athlon 64 3200+ и 3400+ имеют 1 Мб кэша L2 и частоты 2 и 2.2 ГГц соответственно. Напряжение питания составляет 1.5 В, частота шины FSB – 200 МГц. В данном случае частота процессорной шины – условный признак, обозначающий базу для отсчета тактовой частоты процессора и частоты канала HyperTransport. Кстати, частота процессора по-прежнему задается с помощью множителя, и этот множитель у Athlon 64 пока не заблокирован – это хорошее подспорье для разгона, так как из-за встроенного контроллера памяти повышение частоты шины будет проблематичным. Процессоры Athlon 64 FX – это двухканальный вариант Athlon 64, предназначенный для установки в платы с разъемом Socket-940. Они не совместимы с обычными Athlon 64. Кроме того, их контроллер памяти совместим только с дорогостоящей регистровой памятью, поэтому в настольных компьютерах их использование не оправданно. Процессор Athlon 64 3000+Существует мнение, что данный процессор базируется на новом ядре NewCastle, поскольку объем его кэша второго уровня составляет 512 Кб, в то время у других моделей Athlon 64 он вдвое больше. На самом деле ядро NewCastle появится значительно позже, и его основной изюминкой будет не урезанный кэш, а двухканальный контроллер памяти с поддержкой обычных модулей DDR400. Нынешний процессор с рейтингом 3000+ использует то же ядро, что и процессоры 3200+ и 3400+, но с отключенной половиной кэша.
Впрочем, для Athlon 64 размер кэша второго уровня не так важен. У этого процессора достаточно большой кэш первого уровня – 128 Кб, обладающий низкой латентностью – 3 такта (измерения это подтверждают). Кэш второго уровня служит лишь для сохранения данных, вытесняемых из кэша первого уровня, поэтому он хранит данные достаточно долго. К тому же суммарного объема кэша Athlon 64 3000+, который составляет 640 Кб, оказывается вполне достаточно для эффективного кэширования. Другое дело – процессор Pentium 4: у него сравнительно небольшой кэш первого уровня (8 или 16 Кб в зависимости от ядра), а кэш второго уровня более быстродействующий, но с меньшим временем хранения данных. Поэтому в его случае чем больше объем кэша L2, тем больше будет выигрыш в производительности. Урезанный кэш с лихвой компенсируется ценой. Как известно, первая модель нового процессора, Athlon 64 3200+, из-за своей высокой цены, сравнимой с ценой «топовых» процессоров Pentium 4, недоступна большинству пользователей. Другое дело - модель 3000+: на момент объявления этот процессор стоил почти вдвое дешевле – около $250, что сравнимо с ценой процессора Pentium 4 3.0. В дальнейшем цены будут продолжать снижаться, а на рынок должны выйти еще более доступные модели Athlon 64, например, 2800+ с частотой 1.8 ГГц.
Powered by X-ray.Издательство"Самопал"©2004 |