Пентиум 5 характеристики. Технические характеристики различных ядер. Tejas, Jayhawk и другие

Пентиум 5 характеристики. Технические характеристики различных ядер. Tejas, Jayhawk и другие

09.04.2019

Начиная с 1995 г. Intelприступила к выпуску серийногоCISC-процессораP6 шестого поколенияi 686 под торговой маркойPentiumProс напряжением питания около 3 В. Он содержит 5 500 тысяч транзисторов на кристалле и изготовлен по 0,35 мкм технологии в корпусе с 387 выводами. В создании этого процессора разработчики воспользовались всеми техническими решениями, ранее применяемыми в суперЭВМ. К таким решениям относятся включение в структуру процессора устройств динамического определения порядка выполнения команд и нескольких многоступенчатых конвейеров. В отличии от двух 5-ступенчатых конвейеровPentium,P6 имеет три 10-ступенчатых. Увеличение числа конвейеров и ступеней обработки команд в них позволило увеличить внутреннюю тактовую частоту синхронизации, которая стала равной 133, 166, 180, 200 МГц и более. ВPentiumProдля повышения производительности вычислений за счет увеличения внутренней тактовой частоты внедрены следующие структурные дополнения в семейство х86:

Применено динамическое исполнение команд, при котором команды, не зависящие от вычислений ранних операций в программе, выполняются в измененном сдвоенном порядке с передачей результатов в закрепленном в программе порядке;

Использован тыльный кэш-2 с двумя раздельными системными шинами обмена: скоростной короткой для обмена между МП и кэш-2; традиционной процессорной с частотой синхронизации 66,6 МГц;

Внешний кэш-2 емкостью 256 или 512 Кб размещен в корпусе МП;

Внедрены дополнительные средства контроля ECCпри обмене в системной шине, кэш-2, ОЗУ и возможность контроля дублированием вычислений вторым МП в режимеFRC;

Системная шина с программируемым контроллером и интерфейсом APICобеспечивает мультипроцессорную обработку до 4 МП, объединенных в единую систему.

Увеличение частоты синхронизации позволяет повысить быстродействие обработки команд, что, в свою очередь, требует повышения скорости обмена с внешним ОЗУ. Чтобы исключить задержки обмена с ОЗУ, в кристалле процессора смонтирована буферная память второго уровня (кэш-2) емкостью 256 Кб. Блок кэш-2 связан внутри процессора через интерфейс памяти собственной синхронной внутренней 64-разрядной шиной данных, работающей на тактовой частоте процессора.

С целью эффективного вычисления последовательности команд в PentiumProиспользуется буфер предсказания ветвлений ВТВ0, ВТВ1 на 512 входов. Использование этих блоков позволило разработчикам добиться наибольшей загрузки двух блоков целочисленной арифметики (АЛУ), сопроцессора (FPU), блоков записи и загрузки, увеличив производительность по сравнению сPentiumна 35 – 45 %. Эта производительность оказалась всего лишь в 1,5 раза меньше, чем у самого быстрогоRISC-процессораDECAlpha21164. Схема МПPentiumProпоказана на рис. 2.13. ПроцессорPentiumProвыполняет вычисления в конвейере в следующей последовательности. Операционная система загружает из ОЗУ через системную шину в кэш-2 массивы данных и набор команд для выполнения программ, которые образуют очередь с приоритетами и привилегиями. Первая программа из очереди одновременно загружается в кэш-1 команд, а операнды, с которыми она работает, передаются в кэш-1 данных. Адреса команд и данных располагаются в блоке тэгов обоих кэш-1, и в случае промаха при обращении к кэш-1 недостающие команды или данные постоянно доизвлекаются чаще всего из кэш-2 и реже, при отсутствии в нем, из основного ОЗУ. На первой ступени дешифрирования (DC) три команды динамически распределяются на параллельную обработку во вторую ступень дешифрацииID1 (распределение на параллельную обработку в целочисленные АЛУ иFPU). В результате после второй ступени дешифрации в каждом такте могут появляться одновременно до шести микроопераций, подлежащих выполнению в операционном блоке (Port0 - 4) ядра процессора.

Эти микрооперации закрепляются за регистрами в блоке переименования регистров и выделения ресурсов RAT. Блок переименования регистровRATпозволяет закрепить для выполнения операций более восьми РОН, используемых для программирования. При наличии нескольких конвейеров это даёт возможность одновременно выполнять несколько команд, ссылающихся на одни и те же регистры в разных конвейерах по мере их освобождения.

После RATнабор микроопераций направляется в блок резервированияRSи буфер переупорядочивания чтенияROBRd, который осуществляет вычисление адресов операндов и загрузку ими переименованных регистров РОН в двух целочисленных АЛУ.

После выполнения микроопераций ROBRdудаляет их из блока резервированияRS. БлокRSявляется начальной ступенью произвольной обработки в ядре МП. В нем микрооперации могут ожидать операнды или устройства для выполнения операции. Если операнды доступны и устройства свободны, микрооперация направляется на исполнение через один из портовPort0 - 4 минуя такты ожидания. Результаты выполнения микроопераций передаются в переупорядочивающий буфер записиROBwbи файл регистровRRF, способный принимать за один такт три операнда. В этом блоке результаты окончания операций ожидают освобождения ШД для записи в кэш и ОЗУ. Для чего им восстанавливается порядок, соответствующий порядку результатов при выполнении закодированной программы.

Для PentiumProIntelразработала два чипсетаPCI: 82450GX(для серверов) и 82450FХ (для рабочих станций) и специальное программное обеспечение, обеспечивающее параллельную обработку команд в конвейере с 32 - разрядными числами. ХотяPentiumProпрограммно совместим с предыдущими моделями микропроцессоровx86, эффективное его использование в персональных компьютерах сдерживалось дороговизной ЭВМ и недостаточным количеством необходимого программного обеспечения.

5.2. Процессор Pentium II

Процессор PentiumII, ранее носивший названиеKlamath, характеризуется дальнейшим увеличением быстродействия процессоровPentium, совместимых с архитектуройx86. Объединив технологиюMMXи архитектуру ядра МПPentiumPro, фирмаIntelс мая 1997 года начинает производить процессорPentiumIIпо 0.35-мкм КМОП-технологии с четырьмя слоями металлизации. Центральное ядро содержит 7.5 млн транзисторов и располагается на площади 203 мм 2 .

Кристалл PentiumIIразмещается в пластмассовом корпусеPLGA, имеющем матрицу из 528 миниатюрных контактных площадок. Этот корпус устанавливается на одной процессорной мини-плате, уменьшающей отбраковку МП при производстве, вместе с кэш второго уровня и микросхемой памяти для хранения тэговTagRAM. Он закрыт в картридже общей крышкой, которая и охлаждается специальным вентилятором. Картридж с односторонним расположением контактов (S.E.C.С.) устанавливается в специально разработанный фирмойIntelразъёмSlot1 на системной плате. Картридж может быть легко модифицирован с появлением новых промышленных кристаллов МП, кэш-2, памяти тэгов и контроллера кэша. Используя размер стока транзистора 0.28 мкм,Intelудалось повысить предельное быстродействие и достигнуть тактовой частоты от 233 до 450 МГц. На частоте 266 МГцPentiumIIпотребляет до 38 Вт электроэнергии.

Внешняя тактовая частота процессора остается 66,6 МГц, что не позволяет более эффективное использование SDRAM, предназначенной для работы на частотах 83 и 100 МГц. С использованием двухпроцессорного режимаSMPи интерфейсаAPICвозможна работа МП как в режиме параллельной обработки информации, так и в режиме контроля одного процессора другим в системеFRC.

В процессорах PentiumProиPentiumIIдля расширения адресного пространства используется шина запроса памятиREQ(3,0). В режиме обмена с памятью, дополняя ША до 36 бит, она позволяет работать МП с памятью до 64 Гб.

Архитектура ядра PentiumIIмало отличается от архитектурыPentiumPro. Традиционная система команд х86 реализуется с использованием методов, заимствованных уRISC-процессоров. При этом каждая операция преобразуется в последовательность простых микрокоманд. Эти простейшие микрокоманды выполняются с использованием принципов множественного предсказания переходов, исполнения команд по предположению и с изменением последовательности способа переименования регистров, что позволяет организовать параллельную конвейерную обработку нескольких команд.

Однако архитектуры PentiumIIиPentiumProимеют два существенных отличия.PentiumIIспециально создан для скоростной обработки мультимедиа-приложений, сочетает использование до 40 Мб видеопамяти с выполнением высококачественных ускоренных графических процессов, включающих до 512 Мб ОЗУSDRAM, и обменом через новую шинуAGPс профессиональным графическим ускорителем и поддержкой разрешения 1600х1280 при 16.7 млн цветов. МП поддерживает мультимедийное расширение набора команд (MMX). Для исполнения команд ММХ ядромPentiumProвPentiumIIвведены порты:

Кроме того, PentiumIIимеет средства переименования сегментных регистров. Использование этих средств ускоряет работу процессора под управлением 16-разрядных программ. При выполнении вPentiumProранее разработанных 16-разрядных программ изменение содержимого сегментных регистров происходит часто. При этом обновление содержимого сегментного регистра требует очистки конвейера от команд, то есть необходимо выполнить все команды, использующие текущее значение сегментного регистра, до его обновления. С учетом времени, необходимого на передачу результатов для записи, полученная задержка составит почти 30 тактов.

PentiumIIв этом режиме выполняет запись в регистры по предположению, что позволяет командам, использующим старое значение сегмента, сосуществовать с командами, использующими новое значение сегмента. Ускорение работы 16-разрядных приложений может составить до 50% на той же частоте по сравнению с процессоромPentiumPro.

PentiumIIможет обрабатывать 57MMX-команд, при этом используется 8 адресуемых 64-разрядных регистров ММХ. Наличие команд поддержки режимаMMXпозволяет ускорить обработку мультимедиа-приложений при соответствующем программном обеспечении.

Для компенсации относительно медленной работы кэш второго уровня размер внутреннего кэш был увеличен вдвое: с 16 Кб до 32 Кб (16 Кб для хранения команд и 16 Кб – для данных), где кэш-1 данных разбит на 8 чередующихся банков. Увеличение объема внутреннего кэша позволяет снизить частоту обращений к внешней памяти. Для установки PentiumIIразработаны материнские платы с набором ИС 440LX, конструктивно несовместимые с ранее выпускавшимися процессорами.

В январе 1998 г. Intel представила, кроме МП Pentium II 233, 266 и 300 МГц, четвертый по счету процессор семейства Pentium II, имеющий тактовую частоту 333 МГц на кристалле, содержащем 7.5 млн транзисторов (каждый транзистор в 400 раз меньше диаметра человеческого волоса). Он выпущен с применением передовой тогда 0,25 мкм производственной технологии Intel. ПроцессорPentium II 333 МГц имеет наивысшую производительность по сравнению с предыдущими моделями при выполнении целочисленных операций и при работе с мультимедиа (для обработки звука, видео, оцифрованных изображений и поддержки видеоконференций).

Процессор Pentium II 333 МГц имеет все те же характеристики, что и ранее выпущенные версии процессора Pentium II, в том числе: архитектуру двойной независимой шины (DIB), режим динамического исполнения, набор мультимедийных команд технологии Intel MMX и шину кэш-памяти второго уровня (L2) 512 Kб, работающую на частоте, в два раза меньшей тактовой частоты процессора. Для процессора Pentium II 333 МГц частота шины кэш-памяти L2 составляет 166.5 МГц.

При работе со стандартными офисными приложениями процессор Pentium II 333 МГц превосходит процессор Pentium II 300 МГц по производительности на 10 % . Более ощутимо преимущество процессора Pentium II 333 МГц при его сравнении с процессором Pentium MMX, имеющим тактовую частоту 233 МГц. Притом что разница тактовых частот этих процессоров составляет 42 %, Pentium II 333 МГц превосходит его по производительности на 50 – 80 %.

Характеристики процессора Pentium II представлены в табл. 2.4, из которой видно, что в дальнейшем было выпущено еще несколько его модификаций вплоть до Pentium II 450 МГц.

Вторичный кэш в PentiumIIмедленнее, чем вPentiumPro. Он построен по четырёхканальной множественно-ассоциативной синхронной структуре без блокирования на элементах статической памятиSRAMи работает в пакетном режиме. Частота тыльного кэш второго уровня в два раза ниже, чем внутренняя частота процессора. Емкость кэш второго уровня составляет 512 Кб, однако в других вариантах процессораPentiumIIможет устанавливаться кэш меньшей емкости (256 Кб).

5.3. Процессор Pentium III

Процессор Pentium II, как описано в п. 2.5.(«ПроцессорPentiumII»), изготовлен на основе ядраKlamathпо технологии 0,35 мкм с частотой внешней шины 66 МГц. Затем на основеKlamathфирмойIntelбыло разработано ядроDeschutesдля 0,25 мкм технологии и изготовлен PentiumIIс частотой шины 100 МГц и PentiumIIXeon(Зеон), отличающиеся более высоким быстродействием и емкостью кэш-2, и дешевыйCeleron(в начале без кэш-2 с частотой внешней шины 66 МГц). Позже на базеDeschutesбыло разработано ядро с интегрированным в тот же корпус быстрым кэш-2Mendocino, на базе которого выпускались всеCeleron«А» (с внутренним кэш-2 емкостью 128 Кб). ЗатемIntelразработала МПDixonс емкостью 256 Кб встроенного кэш-2. ЭтоCeleronс увеличенным кэш-2 вдвое. Но так как он работает как PentiumII, то имеет другое название. В начале 1999 г. на основе ядраKatmaiизготовленыPentiumIIIиPentiumIIIXeon(Tanner). В конце 1999 г. на базе ядраCoppermineпо 0,18 мкм технологии изготовленPentiumIIIиPentiumIIIXeon(Cascades), имеющие какMendocinoбыстрый интегрированный кэш-2. С 2001 г.Pentium III выпускается по 0,13 мкм (металлизацияCu) технологии на базе ядраTualatinс частотой шины 1400 МГц и дешевыйCeleron(1.2 и 1.3 ГГц).

Так, ядро Coppermineимеет кэш-2 емкостью 256 Кб, который работает синхронно с МП. Организация внутреннего кэш-2 изменена. Он представляет собой 8-канальный ассоциативный буфер с 256-разрядной шиной ядра. Обмен МП с кэш-2 требует новых протоколов, то есть обновленнойBIOS. В процессореPentiumIIIоптимизирована схема внутренней буферизации (4 буфера с обратной записью; 6 буферов заполнения; 8 входов очереди шины). Оптимизация привела к сокращению времени ожидания данных из кэш-2 и увеличению производительности МП на той же частоте на 10 – 20 %. Повышение тактовой частоты до 1000 МГц достигнуто за счет уменьшения технологических норм, добавления 6 слоя алюминиевой металлизации и улучшения внутренней разводки цепей МП. Согласующие резисторы и конденсаторы, которые ранее устанавливались на плате процессорного модуля дляSlot1, перенесены в кристалл СБИС. Напряжение питания ядра понижено до 1.1 – 1.65 В.

Таким образом, начиная с 1999 г. фирма Intelосуществляет серийный выпуск процессора PentiumIIIразных модификаций по 0.25 и 0.13 мкм технологии с внутренней частотой синхронизации от 450 до 1400 МГц. PentiumIIIв зависимости от модификации ядра изготавливается на кристалле, содержащем от 9.5 до 42 млн транзисторов. Он ориентирован на применение в настольных (PentiumIII450/500/533ЕВ/…/1400), портативных (MobillPentiumIII400/500/600) ПК, а также для работы в серверах (PentiumIIIXeon600B/667B//1000B). С индексом ”В” процессоры используются в материнских платах с частотой системной процессорной шины FSB 133 МГц. Процессоры Pentium III с индексом ”Е” имеют напряжение питания 1.6 В и изготовлены по 0.18 мкм технологии с внутренним кэш-2 емкостью 256 Кб, размещённым в кристалле процессора. В связи с этим Pentium III Е выпускается как в виде картриджа S.E.C.C.2 с разъёмом Slot 1, так и в виде одной СБИС в новом корпусе FCPGA с разъёмом Socket 370. С появлением Celeron, а затем Pentium III и Xeon осуществлялся переход спецификации процессорной шины и стандарта разъёма МП Slot 1 на Socket 370, а затем на Socket FCPGA. Для Xeon был разработан свой стандарт разъёма Slot 2.

Mobill Pentium III питается от источника с пониженным напряжением 1.35 В и тактового генератора с частотой 100 МГц. Он оснащен встроенным в МП кэш-2 емкостью 256 Кб и блоком SSE.

У Pentium III 0.25 мкм технологии кэш-2 емкостью 512 Кб размещается на процессорной плате. Обычный Pentium III поддерживает двухпроцессорную конфигурацию, а Хеоn до 4 МП. Хеоn может взаимодействовать с внешним тыльным кэш-2 емкостью до 2 Мб, работающим на частоте процессора, что позволяет намного увеличить его быстродействие вычислений по сравнению с обычным Pentium III .

Новый картридж процессора Pentium III, заключенный в корпус с односторонним расположением контактов SECC2, упрощает конструкцию системных плат, предназначенных для работы с этим процессором, облегчает массовое их производство, безопасность при использовании и обеспечивает единый форм-фактор процессоров будущего. SECC2 – некое промежуточное звено между стандартным SECC и его полным отсутствием. В нём радиатор, обдуваемый вентилятором, соприкасается не с железной пластиной, прижатой к ядру, а непосредственно с микросхемой, обеспечивая лучший отвод тепла от кристалла, помещенного в новый органический сплав на основе меди OLGA.

Pentium III имеет следующие особенности:

1.Обеспечивает одновременно технологии потоковых SIMD-расширений SSE для Internet, динамического исполнения команд и технологию MMX.

2.Имеет архитектуру независимой двойной шины DIB, что увеличивает пропускную способность и производительность его по сравнению с процессорами с единственной шиной данных.

3.Содержит функцию серийного номера процессора для расширения степени управляемости ЭВМ.

4.Имеет неблокируемую кэш-1 первого уровня емкостью 32 Kб (16 Кб/16 Кб) и унифицированную неблокируемую кэш-2 второго уровня емкостью 512 Кб, что обеспечивает ускоренный доступ к часто используемым данным.

5.Поддерживает кэширование памяти с объемом адресного пространства 4 Гб.

6.Позволяет создавать масштабируемые системы с двумя процессорами и физической памятью объемом до 64 Гб.

7.Поддерживает тестирование и мониторинг производительности.

8.Совместим по кодам с существующим программным обеспечением и процессорами предшествующих поколений на базе архитектуры Intel.

Потоковые SIMD-расширения SSE для Internet (MMX2) представляют собой 70 новых команд, сгруппированных в следующие категории:

1.Команды копирования данных movaps ,…, movss . Команды этой группы выполняют операции параллельного копирования упакованных элементов данных (PS), а также скалярного (SS) копирования только младшего элемента операнда. Действия производятся над операндами, расположенными в XMM‑регистрах или в памяти.

2.Арифметические команды SIMD выполняют сложение (addps ,addss ), вычитание, умножение (mulps ,mulss ), деление (divps ,divss ) и другие операцииданных одинарной точности с плавающей точкой. Входной (второй) операнд этих команд может располагаться либо в SIMD‑регистре, либо в памяти. Выходной (первый) операнд должен находиться в SIMD-регистре. Арифметические команды поддерживают как параллельные, так и скалярные операции.

3.Команды сравнения cmpps , cmpss и другие попарно сравнивают все четыре соответствующих FP‑элемента двух операндов (для скалярного (SS) варианта команд – только младшие элементы), устанавливают соответствующие флаги в регистре EFLAGS и проверяют выполнение арифметического условия, специфичного для каждой команды. Если для сравниваемой пары условие выполняется, то в соответствующие 32 разряда выходного операнда записывается маска из всех единиц. В противном случае – маска из нулей. Получаемая в результате двоичная маска обычно используется при логических операциях с объектами.

4.Команды преобразования типов данных выполняют преобразования данных из 32-разрядного целочисленного представления со знаком в FP-представление и обратно. Эти команды производят преобразование упакованных и скалярных данных между 128‑битными SIMD регистрами с плавающей точкой и также с 64-битными целыми MMX регистрами или 32-битными целыми регистрами IA-32.

5.Логические команды andps, andnps, orps иxorps часто используются для вычисления абсолютной величины (модуля) чисел; изменения знакового разряда (инверсии знака); действий с маской из нулей и единиц.

6.Дополнительные целочисленные SIMD-команды, команды перестановки, управления состоянием, управления кэшированием.

В Pentium III введён еще один блок, подобный MMX, только оперирующий с вещественными числами. Основной тип данных SSE это 128-разрядное значение, содержащее 4 последовательно расположенных (“упакованных”) 32-разрядных числа одинарной точности с плавающей точкой SPFP, как показано на рис. 2.14.

Рис. 2.14. Упакованное простое число с плавающей точкой

Каждое 32-разрядное число с плавающей точкой (см. рис. 1.2.) имеет 1 знаковый бит, 8 битов порядка и 23 бита мантиссы, что соответствует стандарту IEEE-754 на формат представления чисел одинарной точности с плавающей запятой. SIMD-инструкции оперируют в новом модуле SSE со специальными 128-битными регистрами XMM0-XMM7 и улучшают работу с приложениями трехмерной графики, потокового аудио, видео и распознавания речи. Каждый из этих регистров хранит 4 вещественных числа одинарной точности (ОТ). Потоковое расширение SIMD архитектуры Intel поддерживает 2 типа операций над упакованными данными с плавающей точкой – параллельные и скалярные.

Параллельные операции (ОР), как правило, действуют одновременно на все четыре 32-разрядных элемента данных в каждом из 128-разрядных операндов, как показано на рис. 2.15. В именах команд, выполняющих параллельные операции, присутствует суффикс ps . Например, командаaddps складывает 4 пары элементов данных и записывает полученные 4 суммы в соответствующие элементы первого операнда.

Скалярные операции действуют на младшие (занимающие разряды (31,0)) элементы данных двух операндов, как это показано на рис. 2.16. Остальные 3 элемента данных в выходном операнде не изменяются (исключение составляет команда скалярного копирования movss ). В имени команд, выполняющих скалярные операции, присутствует суффиксss (например, командаaddss ).

Рис. 2.15. Упакованные (параллельные) операции

Большинство команд двухадресные и оперируют с двумя операндами. Данные, содержащиеся в первом операнде, могут использоваться командой, а после ее выполнения, как правило, замещаются результатами. Данные второго операнда в команде после ее выполнения не изменяются. Для всех команд адрес операнда в памяти должен быть выровнен по 16-байтной границе, кроме невыровненных команд сохранения и загрузки.

Рис. 2.16. Скалярные операции

Таким образом, выполняя операцию над двумя регистрами, блок SSE фактически оперирует с четырьмя парами чисел. Благодаря этому процессор может выполнять до 4 одинаковых операций одновременно. Однако для выполнения четырех параллельных операций программист должен использовать специальные команды, а также позаботиться о помещении и извлечении данных из 128-битных регистров. Поэтому для использования всех вычислительных мощностей Pentium III необходима целенаправленная оптимизация.

Внедрение потоковых SIMD-расширений позволяет существенно увеличить скорость и качество работы в реальном времени приложений, использующих:

Трехмерную графику и 3D-моделирование, расчет освещенности с использованием вычислений с плавающей запятой;

Обработку сигналов и моделирование процессов с широким диапазоном изменения параметров (вычисления с плавающей запятой);

Генерацию трехмерных изображений в программах реального времени, не использующих целочисленный код;

Алгоритмы кодирования и декодирования видеосигнала, обрабатывающие данные блоками;

Численные алгоритмы фильтрации, работающие с потоками данных.

Использование потоковых SIMD-расширений позволяет получить более высокое разрешение и качество изображений на дисплее, более высокое качество звука, видео и возможности параллельного кодирования и декодирования в формате сжатия цифровых кодов на оптический диск MPEG2, а также снизить загрузки процессора при распознавании речи и увеличить точность и быстродействие вычислений.

Как указывалось выше, технология динамического исполнения команд в архитектуре Р6 обеспечивает предсказание ветвлений и прогнозирует исполнение программы по нескольким ветвям, позволяет осуществить анализ потока данных, оптимизацию и реорганизацию последовательности исполнения команд на основе используемых в них данных. Допускает спекулятивное исполнение команд на основе оптимизированной последовательности, которая увеличивает загрузку РОН и блоков процессора, что ведет к повышению общей производительности PentiumIII. Кроме того, технология MMX обеспечивается вPentiumIIIнабором 57 команд общего назначения для целочисленных операций, легко применимых к широкому спектру мультимедийных и коммуникационных приложений. Здесь также используются SIMD-инструкции, которые исполняются в восьми 64-разрядных регистрах MMX0-ММХ7.

Серийный номер процессора – это электронный номер, позволяющий идентифицировать конкретную систему в больших компьютерных сетях.

Тестирование и мониторинг производительности в Pentium III содержит следующие функции:

Встроенный механизм самотестирования BIST обеспечивает постоянный контроль зависаний и сбоев в микрокоде и больших логических матрицах, а также тестирование кэш команд и кэш данных, буферов TLB и сегментов памяти ROM;

Механизм стандартного порта доступа к тестированию и периферийному сканированию IEEE 1149.1 дает возможность осуществлять проверку каналов связи между процессором Pentium III и системой через стандартный интерфейс;

Встроенные счетные устройства следят за показателями производительности и ведут подсчет событий.

История

Intel Pentium 60, первая модель Pentium

В процессорах Pentium второго поколения используется умножение тактовой частоты, он работает быстрее системной шины. Для указания, во сколько раз тактовая частота ядра процессора больше частоты системной шины, используется множитель. Во всех процессорах, основанных на ядре P54C, множитель равен 1,5.

P54CS

Первые процессоры, основанные на данном ядре, были выпущены 27 марта 1995 года . По сути, это ядро представляет собой ядро P54C, изготовленное с использованием 350-нанометровой биполярной BiCMOS-технологии, что позволило уменьшить размер кристалла ядра до 91 мм² (процессоры Pentium 120 и 133), однако вскоре, в результате оптимизации ядра, его размер удалось уменьшить до 83 мм² при том же количестве транзисторов. При этом Pentium 200 потреблял ток в 4,6 А, а его максимальная рассеиваемая энергия (тепловыделение) составляло 15,5 Вт.

P55C

Процессор Pentium MMX. Вид сверху

8 января 1997 года были выпущены процессоры Pentium, основанные на ядре P5 третьего поколения (P55C). Центром разработок и исследований Intel в Хайфе (Израиль) в ядро P55C был добавлен новый набор инструкций, названный MMX (MultiMedia eXtension), существенно увеличивающий (от 10 до 60 %, в зависимости от оптимизации) производительность компьютера в мультимедиа-приложениях. В результате, эти процессоры именуются Pentium w/MMX technology (обычно сокращается до Pentium MMX). Новый процессор включает в себя устройство MMX с конвейерной обработкой команд, кеш L1 увеличен до 32 Кб (16 Кб для данных и 16 Кб для инструкций). Состоит новый процессор из 4,5 млн транзисторов и производится по усовершенствованной 280-нанометровой CMOS-технологии с использованием кремниевых полупроводников, работает на напряжении 2,8 В. Максимальный потребляемый ток равен 6,5 А, тепловыделение равно 17 Вт (для Pentium 233 MMX). Площадь кристалла у процессоров Pentium MMX равна 141 мм². Процессоры выпускались в 296-контактном корпусе типа CPGA или PPGA для Socket 7.

Pentium OverDrive

Было выпущено несколько поколений Pentium OverDrive.

  • В 1995 году вышел первый Pentium OverDrive (на ядре P24T). Он был предназначен для установки в гнёзда типа Socket 2 или Socket 3 и работал с напряжением питания 5 В, то есть служил для модернизации систем, использующих процессор 486 без замены материнской платы. При этом данный процессор обладал всеми функциями процессора Pentium первого поколения (на ядре P5). Было выпущено две модели, работающие на частотах 63 и 83 МГц, старшая потребляла ток в 2,8 А и обладала рассеиваемой мощностью 14 Вт. Из-за высокой стоимости данный процессор ушёл, не успев появиться. И хотя через некоторое время (4 марта 1996 года) на смену этим процессорам пришли Pentium ODP5V с частотами 120 и 133 МГц, основанные на ядре P5T (по сути, представляет собой ядро P54CS), они также не стали популярны.
  • 4 марта 1996 года выходит следующая версия Pentium OverDrive - Pentium ODP3V - на ядре P54CT. Данное ядро основано на ядре P54CS. Процессор выпускался в 320-контактном корпусе CPGA для Socket 5 или Socket 7.
  • 3 марта 1997 года выходят две модели Pentium ODPMT (с частотами 150 и 166 МГц), построенные на ядре P54CTB (аналог P55C). Позже, 4 августа 1997 года, выходят ещё две модели на том же ядре (с частотами 180 и 200 МГц). Они выпускались в 320-контактных корпусах CPGA и были предназначены для Socket 5 или Socket 7 (Pentium ODPMT-200 MMX - только для Socket 7).

Tillamook

Процессоры, основанные на данном ядре, предназначались для портативных компьютеров, использовались в т.н. "мобильном модуле" MMC-1 Mobile Module Connector с 280 пинами работали вместе с чипсетом Intel 430 TX и имея при этом 512 КБ кэш-памяти на системной плате. Ядро Tillamook (названо в честь города в штате Орегон , США), представляет собой ядро P55C с пониженным напряжением питания - модель с частотой 300 МГц работала с напряжением 2,0 В, потребляя при этом ток в 4,5 А и обладала тепловыделением в 8,4 Вт. Старшие модели (с частотой 233, 266 и 300 МГц) выпускались с использованием 250-нм техпроцесса и имели кристалл площадью 90 мм², также существовали версии со 166 МГц частотой ядра Модели 200 и 233 выпускались с августа 1997 г., модель 266 с января 1998, а старшая в линейке модель была представлена в январе 1999 г.

Другие процессоры, использующие марку Pentium

Процессоры Intel Pentium пользовались огромной популярностью, и Intel решила не отказываться от марки Pentium, называя так и последующие процессоры, хотя они сильно отличались от первых Pentium’ов и не относились к пятому поколению. Таковыми являются:

  • Pentium G

Технические характеристики различных ядер

P5 P54C P54CS P55C
Дата анонса первой модели 23 марта 1993 7 марта 1994 27 марта 1995 8 января 1997
Тактовые частоты, МГц 60, 66 75, 90, 100 120, 133, 150, 166, 200 166, 200, 233
Частота системной шины (FSB), МГц 60, 66 50, 60, 66 60, 66 66
Кеш , Кбайт 8 (для данных)+8 (для инструкций) 16+16
Кеш , Кбайт внешний до 1 Мбайт
Напряжение питания, В 5 3,3 2,8/3,3
Количество транзисторов , млн 3,1 3,2 3,3 4,5
Площадь кристалла, мм² 294 148 90 141
Максимальное тепловыделение, Вт 16 10,1 15,5 16
Техпроцесс, нм 800 600 350 280
Разъём Socket 4 Socket 5 , Socket 7 Socket 5, Socket 7 (150-200 - только Socket 7) Socket 7
Корпус 273-контактный PGA 296-контактный CPGA 296-контактный CPGA/PPGA
Адресуемая память 4 Гбайт
Разрядность

ВведениеЕщё в прошлом году компания Intel говорила о грядущей смене приоритетов в создании новых процессоров. Ввиду возникших трудностей на пути наращивания тактовых частот процессоров Pentium 4, компания решила сосредоточить основные усилия не на увеличении их производительности, а на расширении функциональности. В течение прошлого года были сделаны первые подвижки в этом направлении: например, CPU стали маркироваться при помощи процессорного рейтинга, а тактовая частота в маркировке была отодвинута на второй план. Однако, реальные шаги, направленные на придание процессорам новых функций, были запланированы на этот, 2005 год. Поэтому, первых в этом году анонсов процессоров мы ждали с особым нетерпением.
И вот, свершилось. Сегодня компания Intel представляет на суд потребителей новые процессоры в семействе Pentium 4, в основе которых лежит обновлённое ядро, известное под кодовым именем Prescott 2M. Хотя, взятый Intel курс на внедрение в настольные системы двуядерных процессоров пока никак не отразился в новинках, новые Pentium 4, обладающие рейтингами вида 6XX, наделены рядом новых и интересных возможностей. Именно поэтому процессоры Pentium 4 6XX на базе ядра Prescott 2M и являются столь интересными объектами для изучения: в этих CPU мы сталкиваемся с увеличенной кеш-памятью второго уровня и с новыми для сектора настольных компьютеров технологиями Enhanced Memory 64 Technology и Enhanced Intel SpeedStep.
Параллельно с линейкой Pentium 4 6XX Intel выводит на рынок и ещё один процессор, нацеленный на энтузиастов. Этот CPU, входящий в семейство Pentium 4 Extreme Edition, в отличие от линейки Pentium 4 6XX, призван поднять планку производительности и стать наиболее быстрым CPU от Intel на сегодняшний день. А потому, новый Pentium 4 Extreme Edition, хотя и лишён некоторой функциональности Pentium 4 6XX, имеет большую тактовую частоту и работает при более высокой частоте шины.
Впрочем, подходить к новым продуктам Intel можно и с другой стороны. На фоне несомненных успехов основного конкурента, компании AMD, процессоры Pentium 4 смотрелись до сегодняшнего дня не лучшим образом. Старшие модели Athlon 64 превосходили аналогичные продукты Intel как по быстродействию, так и по поддерживаемым функциям. Теперь же, очевидно, Intel предпринимает очередную попытку настичь конкурента. Увеличение кеш-памяти второго уровня в процессорах на новом ядре Prescott 2M имеет под собой цель поднять их производительность. А внедрение в Pentium 4 6XX новых технологий Enhanced Memory 64 Technology и Enhanced Intel SpeedStep можно рассматривать как ответ Intel на имеющиеся в процессорах Athlon 64 технологии AMD64 и Cool"n"Quiet.
В данном обзоре мы попробуем оценить новинки от Intel со всех сторон. Мы посмотрим как на то, какие новые возможности способны привнести новые технологии, появившееся в процессорах с ядром Prescott 2M, так и на то, насколько изменилась производительность новых CPU семейств Pentium 4 6XX и Pentium 4 Extreme Edition, и смогут ли они составить достойную конкуренцию старшим моделям процессоров Athlon 64 и Athlon 64 FX. Однако, по традиции, практическое исследование новинок предваряет небольшая теоретическая часть.

Новые процессоры Pentium 4 6XX и Pentium 4 Extreme Edition 3.73 ГГц

Итак, сегодня, 20 февраля 2005 года компания Intel официально объявила новые процессоры Pentium 4 Extreme Edition 3.73 ГГц и Pentium 4 серии 6XX. Все эти процессоры основываются на одном и том же процессорном ядре Prescott 2M, основным отличительным признаком является увеличенная кеш-память второго уровня, которая имеет объём 2 Мбайта. В остальном же, включая и 90 нм технологический процесс с использованием растянутого кремния, ядро Prescott 2M подобно своему предшественнику, ядру Prescott, которое уже давно используется в процессорах Pentium 4 серии 5XX.
Сходство между Prescott и Prescott 2M видно даже на фотографиях этих ядер:

PrescottPrescott 2M


Как видим, кеш память у Prescott 2M действительно стала в два раза больше. В остальном, видимых отличий между ядрами не наблюдается.
Семейство процессоров Pentium 4 6XX состоит на сегодняшний день из нескольких моделей с частотами от 3.0 до 3.6 ГГц. Все эти процессоры, как и их предшественники, используют шину Quad Pumped Bus с частотой 800 МГц. Младшая модель имеет процессорный номер 630, модель с частотой 3.2 ГГц – 640, 3.4-гигагерцовый процессор – 650 и CPU с частотой 3.6 ГГц – 660. Следует заметить, что частота старшего процессора в линейке "шестисотых", Pentium 4 660, меньше частоты старшего процессора на базе обычного ядра Prescott, Pentium 4 570, составляющей 3.8 ГГц. Однако при этом Pentium 4 6XX имеют по сравнению со своими младшими братьями ряд преимуществ.
Во-первых, процессоры семейства Pentium 4 6XX поддерживают технологию Enhanced Memory 64 Technology (EM64T) – 64-битные расширения архитектуры x86, являющиеся аналогом расширений AMD64. Благодаря этому все процессоры Pentium 4 6XX совместимы с операционной системой Windows XP Professional x64 Edition, которой немногим ранее мы посвятили отдельную статью . Благодаря совместимости с этой операционной системой, Pentium 4 6XX теперь могут похвастаться целым рядом преимуществ, знакомым нам по процессорам Athlon 64. В числе оных в первую очередь следует отметить одновременную совместимость с 32-битным и 64-битным программным обеспечением, а также поддержку объёмов памяти, превышающих 4 Гбайта.
Второй плюс процессоров Pentium 4 6XX - это поддержка ими технологии Enhanced Intel SpeedStep (EIST). Данная технология является полным аналогом аналогичного механизма, реализованного в мобильных процессорах Intel. Суть данного механизма заключается в том, что процессоры Pentium 4 6XX могут снижать свою частоту в моменты, когда от них не требуется высокая производительность. При помощи данного метода достигается существенное снижение тепловыделения и энергопотребления.
При этом все CPU семейства Pentium 4 6XX поддерживают технологию Execute Disable Bit (XD bit), появившуюся в Pentium 4 5XX с выходом старшей модели с частотой 3.8 ГГц и процессорным номером 570.
Таким образом, несмотря на свою более низкую тактовую частоту, процессоры Pentium 4 семейства 6XX по числу поддерживаемых функций превосходят своих предшественников, Pentium 4 5XX.
Следует напомнить, что Intel отказался от выпуска процессоров на базе ядра Prescott с частотами 4 ГГц и выше. Это относится и к CPU, в основе которых лежит ядро Prescott 2M. То есть, старшая модель в линейке 5XX, Pentium 4 570 с частотой 3.8 ГГц так и останется самой быстрой моделью CPU на базе ядра Prescott. В линейке же 6XX на сегодня старшая модель процессора с номером 660 имеет частоту 3.6 ГГц. Соответственно, более быстрые процессоры в этом семействе появляться могут. Так, во втором квартале текущего года Intel собирается объявить Pentium 4 670 с тактовой частотой 3.8 ГГц.
Впрочем, вопрос относительно того, какой из процессоров Intel является самым быстрым на сегодняшний день, решается не в пользу ни Pentium 4 660, не в пользу Pentium 4 570. На эту роль претендует ещё один процессор на базе ядра Prescott 2M, анонсированный сегодня и отнесённый к семейству Pentium 4 Extreme Edition. Данная новинка обладает тактовой частотой 3.73 ГГц и рассчитана на работу при частоте шины 1066 МГц. При этом, хотя большинство характеристик Pentium 4 Extreme Edition 3.73 ГГц повторяет характеристики серии Pentium 4 6XX, этот процессор не поддерживает технологию EIST. Технологии же XD bit и EM64T в этом CPU включены.
А вот какую информацию выдаёт о новых процессорах Pentium 4 Extreme Edition 3.73 ГГц и Pentium 4 660 диагностическая утилита CPU-Z:


Intel Pentium 4 660


Intel Pentium 4 Extreme Edition 3.73 ГГц


Подводя итог, приведём формальные характеристики анонсированных сегодня процессоров Pentium 4 6XX и Pentium 4 Extreme Edition. В таблице ниже для сравнения также приведены характеристики процессоров Pentium 4 5XX.


Что касается теплового пакета новых процессоров, то их тепловыделение укладывается в те же самые рамки, что и у процессоров серии 5XX. Соответственно Pentium 4 6XX c частотами до 3.4 ГГц включительно вписываются в TDP в 84 Вт, старшие же модели, а также новый Pentium 4 Extreme Edition 3.73 ГГц имеют TDP в 115 Вт.
Таким образом, новые процессоры могут использоваться в тех же самых материнских платах, что и предшествующие LGA775 Pentium 4. Единственное требование: поддержка новых CPU со стороны BIOS материнской платы.
А вот как выглядят новые процессоры:






Слева-направо: Pentium 4 570, Pentium 4 660,
Pentium 4 Extreme Edition 3.73 ГГц

Ядро Prescott 2M: изменения в кеш-памяти

Так как одним из основных нововведений, произошедших с процессорами Pentium 4 при их переводе на использование нового ядра Prescott 2M, стало увеличение кеш-памяти второго уровня, следует уделить немного внимания организации L2 кеш-памяти в новом ядре. Чтобы понять, как же устроена кеш-память второго уровня в новом ядре Prescott 2M, мы вновь воспользовались диагностической утилитой CPU-Z. Для сравнения, мы приводим и аналогичную информацию, относящуюся к более старому ядру, Prescott:

Как видим, у Prescott 2M и Prescott кеш-память второго уровня (да и первого тоже) организована совершенно одинаково. Различие только в размере. Кеш второго уровня у обоих ядер имеет 8 зон ассоциативности и оперирует строками длиной 64 байт. Однако наличие одинакового количества зон ассоциативности у кеш-памяти разного объёма автоматически означает, что поиск данных в более ёмком кеше должен выполняться дольше. Соответственно, L2 кеш процессоров на базе ядра Prescott 2M должен быть более медленным, чем L2 кеш процессоров, в основе которых лежит обычное ядро Prescott.
Чтобы проверить эту гипотезу, мы вооружились утилитой Cache Burst 32. Тестовая система, на которой мы проводили измерения, основывалась на материнской плате Intel Desktop Board D925XECV2 на чипсете i925XE Express и была снабжена двухканальной DDR2-533 SDRAM с таймингами 4-4-4-11. Для опытов мы использовали процессоры Pentium 4 560 и Pentium 4 660 на ядрах Prescott и Prescott 2M соответственно.












Как показывают результаты теста, действительно, скорость чтения из кеш-памяти второго уровня у нового процессора Pentium 4 660 ниже, чем у аналогичного Pentium 4 560 с меньшим объёмом кеш-памяти. При этом скорость записи и латентность кешей у этих CPU совпадает. Однако при копировании данных мы видим, что кеш-память процессора на ядре Prescott 2M работает несколько быстрее, чем кеш-память CPU с ядром Prescott.
Таким образом, мы вынуждены констатировать, что увеличение кеш-памяти второго уровня у процессоров Pentium 4 6XX повлекло за собой и некоторые глубинные изменения, в результате которых скорость работы с данными в L2 кеше изменилась. Причём, не в лучшую сторону. Отметим, что подобное же явление уже один раз происходило с NetBurst архитектурой при переходе от ядра Northwood к ядру Prescott. Так что мы вновь должны заметить, что увеличение объёма кеш-памяти второго уровня не лучшим образом отражается на её быстродействии.

Подробности о Demand Based Switching

С вводом в процессорах Pentium 4 6XX технологии Enhanced Intel SpeedStep (EIST) эти процессоры стали обладателями сразу трёх технологий, попадающих под собирательное название Demand Based Switching (переключение по потребностям). Первые две технологии мы уже рассматривали, обзирая процессор Pentium 4 570J, который был основан на ядре Prescott степпинга E0. С появлением этого степпинга ядра процессоры Pentium 4 получили в свое распоряжение новый механизм термального мониторинга TM2 и новый режим для снижения энергопотребления C1E. EIST дополнила эти технологии в новом ядре Prescott 2M и теперь новые процессоры Pentium 4 6XX могут похвастать ещё более низким средневзвешенным энергопотреблением и тепловыделением.
Технология EIST предназначается для управления частотой процессора и его напряжением в зависимости от степени загрузки, как это делается в мобильных компьютерах. В настольном сегменте аналогом EIST является технология Cool"n"Quiet от AMD, реализованная в процессорах семейства Athlon 64. Можно сказать, что EIST позволяет более рационально использовать ресурсы процессора: при работе в приложениях, не загружающих процессор на 100% его максимальная тактовая частота никому не нужна, в такие моменты её можно спокойно снизить, параллельно уменьшив тепловыделение и энергопотребление CPU. Если же приложение требует от процессора максимальной производительности, то он увеличит частоту до номинальной отметки, попутно подняв напряжение на ядре до нужной величины.
Включается технология EIST абсолютно также, как и Cool"n"Quiet. В Windows XP, например, на закладке Power Option Properties необходимо изменить схему питания компьютера со стандартной Home/Office Desk на Minimal Power Management. После этой установки процессор начнёт снижать свою частоту в моменты низкой загрузки. Необходимый для работы этой технологии процессорный драйвер входит в Service Pack 2, поэтому технология EIST становится совместимой с Windows XP после установки SP2.
На первый взгляд, EIST не вызывает никаких вопросов, однако эта достаточно интересная технология таит в себе и немало сюрпризов. Дело в том, что все три технологии семейства Demand Based Switching, C1E, TM2 и EIST используют один и тот же механизм. Именно поэтому мы решили ещё раз вернуться к рассказу о том, как же на самом деле работают эти технологии.
Функционирование C1E, TM2 и EIST основано на том факте, что процессоры Pentium 4 с ядром Prescott, начиная со степпинга E0, умеют изменять свой коэффициент умножения и Vid "на лету". Конкретнее, процессоры с ядрами Prescott и Prescott 2M при необходимости могут снижать свой множитель до 14x (а это – минимальное значение для ядра Prescott), уменьшая при этом своё напряжение питания примерно на 0.25В. Сочетание этих характеристик и определяет повсеместно эксплуатируемый "режим пониженного энергопотребления", при котором процессор работает на частоте 2.8 ГГц со сниженным напряжением питания. Вот, например, какую информацию выдаёт утилита CPU-Z про процессор Pentium 4 660 (штатная частота 3.6 ГГц), находящийся в этом "режиме пониженного энергопотребления":


Ещё одна интересная деталь заключается в том, что для всех процессоров серии Pentium 4 6XX с разными тактовыми частотами режим пониженного энергопотребления одинаков: все они в этом режиме работают на частоте 2.8 ГГц вне зависимости от их номинальной частоты.
Важно заметить, что для обеспечения стабильности работы переход в этот режим и выход из него происходит не скачкообразно, а постепенно. Так, при входе в "режим пониженного энергопотребления" процессор сначала понижает свой множитель до 14x, а лишь потом постепенно снижет напряжение питания. Выход из этого режима происходит в обратном порядке: сначала постепенно увеличивается напряжение, а только потом устанавливается штатный множитель.


Все три технологии из серии Demand Based Switching, C1E, TM2 и EIST, используют этот режим пониженного энергопотребления. Различие же между C1E, TM2 и EIST заключается лишь в том, в какие моменты включается данный режим.
Технология C1E (Enhanced Halt State) активизирует режим пониженного энергопотребления при поступлении на процессор команды Halt, говорящей о переводе процессора в режим ожидания. Эта команда отдаётся процессору операционной системой в моменты, когда для исполнения нет никаких других инструкций. То есть, если ранее процессоры Pentium 4 при поступлении команды Halt просто переводили часть своих исполнительных устройств в режим бездействия, режим C1E позволяет ещё сильнее снизить тепловыделение и энергопотребление благодаря дополнительному уменьшению тактовой частоты, на которой работает активная часть CPU в режиме ожидания.
Технология TM2 (Thermal Monitor 2) , хотя и предназначается для защиты процессора от перегрева, использует тот же самый 2.8-гигагерцовый режим пониженного энергопотребления. TM2 переводит CPU в этот режим по команде, поступающей от встроенного в ядро процессора термодатчика. Если температура процессора превышает некоторое предельно допустимое значение температуры (а это значение калибруется индивидуально для каждого экземпляра CPU), частота процессора снижается до 2.8 ГГц и одновременно понижается напряжение питания процессорного ядра. Этот механизм позволяет снизить температуру процессора до допустимых пределов примерно на 40% быстрее, нежели при используемом раньше механизме TM1, основанном на модуляции несущей частоты.
Технология EIST (Enhanced Intel SpeedStep) , как это не покажется странным, также переводит процессор в 2.8-гигагерцовый режим пониженного энергопотребления. В рамках этой технологии переход в данное состояние инициируется операционной системой. Если драйвер процессора рапортует о низкой загрузке CPU в конкретный момент времени, операционная система через соответствующую команду ACPI переводит процессор в режим пониженного энергопотребления. То есть, благодаря EIST удаётся снизить тепловыделение процессора не только в моменты его полного простоя, но и при небольшой загрузке.
Теперь о неприятном. Поскольку минимально возможным коэффициентом умножения для процессоров на базе ядра Prescott (и его производной Prescott 2M) является 14x, использование технологий C1E, TM2 и EIST возможно только для CPU, имеющих больший множитель. Например, именно поэтому новым процессором Pentium 4 Extreme Edition 3.73 ГГц технологии C1E, TM2 и EIST не поддерживаются: штатный множитель этого CPU равен 14x. Соответственно, чем выше штатный множитель у процессора, тем больший эффект способны принести технологии семейства Demand Based Switching.

Температурный режим и энергопотребление

После того, как мы разобрались, какие новые технологии для снижения энергопотребления применил Intel в своих процессорах семейства Pentium 4 6XX, самое время посмотреть, как они проявляются на практике. Поэтому, мы изучили температурный режим и энергопотребление новых процессоров во время их реальной работы.
Для целей тестирования мы собрали тестовую систему, состоящую из следующего набора комплектующих:


Память: 1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11);


В первую очередь в этой тестовой системе мы провели измерение температурного режима LGA775 процессоров Pentium 4 6XX и Pentium 4 5XX. В качестве процессоров линейки Pentium 4 5XX использовались CPU, в основе которых лежат ядра Prescott степпинга E0, то есть поддерживающие C1E и TM2. Pentium 6XX были представлены процессорами с ядром Prescott 2M степпинга N0, эти CPU поддерживали C1E, TM2 и EIST. Частоты испытуемых процессоров устанавливались в 2.8, 3.0, 3.2, 3.4, 3.6 ГГц, а для процессора на ядре Prescott со степпингом ядра E0 – и в 3.8 ГГц. Частота шины во всех случаях была номинальной, напряжение питания ядра – тоже. Во всех опытах использовался штатный боксовый LGA775 кулер. Показания температуры процессоров снимались с встроенного в ядро CPU датчика. Измерения температуры процессорных ядер мы выполняли в двух состояниях: в режиме ожидания (idle) и при максимальной загрузке CPU, создаваемой специальной утилитой S&M версии 0.3.2, являющейся на сегодняшний день лучшим инструментом для прогрева процессоров.
Помимо результатов измерений температур Pentium 4 "пятисотой" и "шестисотой" серий, на итоговые графики мы добавили и данные, полученные при испытании процессора Pentium 4 Extreme Edition 3.73 ГГц. Хотя этот процессор и основывается на том же самом ядре Prescott 2M степпинга N0, как и все Pentium 4 6XX, он не поддерживает технологии C1E, TM2 и EIST. Поэтому, его температурный режим и энергопотребление вызывает особый интерес.






Как видим, при максимальной нагрузке на процессоры Pentium 4 5XX и Pentium 4 6XX они прогреваются примерно до одинаковой температуры при равной тактовой частоте. То есть, увеличение кеш-памяти второго уровня не привело к какому сколько-нибудь заметному изменению температурной картины. Зато работа процессоров в состоянии покоя заслуживает определённого внимания. В первую очередь заметим, что вне зависимости от частоты Pentium 4 5XX и Pentium 4 6XX показывают совершенно одинаковую температуру. Это объясняется тем, что в состоянии бездействия эти процессоры, фактически, работают в "состоянии пониженного энергопотребления" на частоте 2.8 ГГц, независимо от их номинальной частоты. Например, Pentium 4 XE 3.73 ГГц, который технологии C1E, TM2 и EIST не поддерживает, в состоянии покоя прогревается гораздо сильнее. Это неудивительно: в этом состоянии, в отличие от процессоров Pentium 4 5XX и 6XX, он продолжает работать на своей штатной частоте.
Также, помимо температуры, мы оценили и энергопотребление процессоров с ядрами Prescott и Prescott 2M. Для этого при помощи токовых клещей мы измерили ток, проходящий по 12-вольтовой цепи, по которой осуществляется питание процессора. То есть, приводимые ниже данные не учитывают КПД конвертера питания процессора, поэтому, по сравнению с реальным энергопотреблением процессоров они слегка завышены (примерно на 10%).






Качественно картина получается такая же, как и при измерении температуры. Однако мы должны отметить, что новые процессоры на базе ядра Prescott 2M, несмотря на увеличившееся количество транзисторов, обладают более низким энергопотреблением, чем процессоры на базе обычного ядра Prescott. Таким образом, резервы для наращивания тактовых частот процессоров Pentium 4 6XX ещё есть.

Разгон

Чтобы оценить эти резервы, а также понять, насколько новое процессорное ядро Prescott 2M степпинга N0 может понравиться энтузиастам-оверклокерам, мы решили провести испытания CPU Intel Pentium 4 660 со штатной частотой 3.6 ГГц на разгон. Тестовая система, используемая в этом случае, была составлена из следующего набора комплектующих:

Процессор: Intel Pentium 4 660 (3.6 ГГц);
Материнская плата: ASUS P5AD2-E Premium (LGA775, i925XE Express);
Память: 1024MB DDR2-667 SDRAM (Corsair XMS2-5300, 2 x 512MB, 4-4-4-12).
Графическая карта: PowerColor RADEON X800 XT (PCI-E x16);
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).

Для охлаждения Pentium 4 660 во время наших разгонных экспериментов мы воспользовались самым производительным воздушным кулером для LGA775 процессоров, имеющимся в нашей лаборатории: Zalman CNPS7700Cu. Напряжение питания процессора при разгоне мы не увеличивали: на старшие модели CPU с ядром Prescott 2M, как и на их предшественников, данный трюк не производит практически никакого впечатления. Разгон мы выполняли путём повышения частоты FSB свыше штатных 200 МГц, частоты шины PCI Express и PCI фиксировались при этом на номинальных значениях 100 и 33 МГц.
Перед тем, как перейти непосредственно к результатам нашего разгона, напомним, что максимальная частота, которую нам удалось достичь при оверклокинге Pentium 4 570, основанного на ядре Prescott степпинга E0, составила 4.3 ГГц. Подобных успехов от Pentium 4 660, ядро которого имеет большее число транзисторов, мы не ожидали. Однако, практика показала, что зря.
Ниже мы приводим скриншот CPU-Z, являющийся отражением наших успехов:


То есть, Pentium 4 660 со штатной частотой 3.6 ГГц разогнался до 4.33 ГГц. Это – достаточно хороший результат, подтверждающий значительный оверклокерский потенциал ядра Prescott 2M. Таким образом, младшие процессоры линейки Pentium 4 6XX могут стать весьма интересными объектами для разгона.
Мы же в очередной раз должны констатировать, что решение Intel не выпускать по 90 нм технологии процессоры с частотами 4 ГГц и более, обусловлено не достижением технологического предела, а скорее маркетинговыми причинами. Как мы вновь убеждаемся, существующие ядра Prescott и Prescott 2M степпингов E0 и N0 могут легко работать на частотах свыше 4 ГГц.

Как мы тестировали

Целью данного тестирования являлось определение уровня производительности, обеспечиваемого новыми процессорами серии Intel Pentium 4 6XX и процессором Intel Pentium 4 Extreme Edition 3.73 ГГц, а также сопоставление этого уровня с быстродействием предшествующих и конкурирующих CPU. Для наших тестовых испытаний мы выбрали две старших модели "шестисотой" серии, Pentium 4 660 со штатной частотой 3.6 ГГц и Pentium 4 650 с частотой 3.4 ГГц.

В составе тестовых систем мы использовали следующее оборудование:

Процессоры:

AMD Athlon 64 FX-55 (Socket 939, 1024KB L2, 2.6GHz);
AMD Athlon 64 4000+ (Socket 939, 1024KB L2, 2.4GHz);
AMD Athlon 64 3800+ (Socket 939, 512KB L2, 2.4GHz);
AMD Athlon 64 3500+ (Socket 939, 512KB L2, 2.2GHz);
Intel Pentium 4 570 (LGA775, 1024KB L2, 3.8 GHz);
Intel Pentium 4 560 (LGA775, 1024KB L2, 3.6 GHz);
Intel Pentium 4 550 (LGA775, 1024KB L2, 3.4 GHz);
Intel Pentium 4 660 (LGA775, 2048KB L2, 3.6 GHz);
Intel Pentium 4 650 (LGA775, 2048KB L2, 3.4 GHz);
Intel Pentium 4 Extreme Edition 3.46GHz (LGA775, 2048KB L3, FSB 1066MHz);
Intel Pentium 4 Extreme Edition 3.73GHz (LGA775, 2048KB L2, FSB 1066MHz);


Материнские платы:

EPoX 9NPA Ultra (Socket 939, NVIDIA nForce4 Ultra);
Intel Desktop Board D925XECV2 (LGA775, i925XE Express).


Память:

1024MB DDR400 SDRAM (Corsair CMX512-3200XLPRO, 2 x 512MB, 2-2-2-10);
1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11).


Графическая карта: PowerColor RADEON X800 XT (PCI-E x16).
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).

Тестирование выполнялось в операционной системе MS Windows XP SP2 с установленным пакетом DirectX 9.0c. Тестовые системы настраивались на максимальную производительность. Заметим, что в Athlon 64 мы увеличивали тайминг Cycle Time (Tras) до 10, поскольку, как показывает практика, в таком режиме контроллер памяти Athlon 64 работает более эффективно, нежели при установке этой задержки в минимально возможное значение 5.
В рамках данного тестирования мы существенно расширили набор тестовых приложений. Произошло это благодаря тому, что мы решили задействовать набор стандартных скриптов PC WorldBench 5, широко используемый в индустрии для бенчмаркинга.

Производительность

FutureMark PCMark04, 3DMark2001 SE и 3DMark05

В первую очередь мы решили привести результаты, полученные нами в популярных синтетических тестах компании FutureMark.









Тест PCMark04 активно использует технологию Hyper-Threading, благодаря чему процессоры производства компании Intel показывают лучшие результаты. Что же касается соотношения сил между различными линейками процессоров Pentium 4, то процессоры "шестисотой" серии с увеличенной до 2 Мбайт кеш-памятью лишь незначительно превосходят CPU линейки Pentium 4 5XX. Зато процессор Pentium 4 Extreme Edition 3.73 ГГц, благодаря значительному росту тактовой частоты и более новому процессорному ядру, ощутимо обгоняет своего предшественника, Pentium 4 Extreme Edition 3.46 ГГц, в основе которого использовалось ядро Gallatin.
Достаточно интересные результаты получаются и в подтесте, измеряющем скорость работы подсистемы памяти. Увеличение L2 кеша в процессорах Pentium 4 6XX увеличило скорость их работы с данными, благодаря чему этим CPU в данном бенчмарке удаётся теперь выступать на равных с процессорами Athlon 64, сильной стороной которых является интегрированный контроллер памяти. То есть, увеличенная до 2 Мбайт кеш-память второго уровня нивелирует высокие задержки DDR2 SDRAM, используемой в составе современных Pentium 4 систем.


Старый тест 3DMark2001 SE никак не теряет своей популярности, однако на сегодня он уже гораздо сильнее показывает скорость центральных процессоров, нежели современных видеокарт. Раньше в этом тесте неизменно верхние места занимали CPU семейства Athlon 64, однако теперь ситуация несколько изменилась. Увеличение в новых процессорах Pentium 4 с ядром Prescott 2M кеш-памяти второго уровня позволило этим CPU несколько нарастить свои показатели в данном тесте. Благодаря этому Pentium 4 660 удалось обогнать Athlon 64 3500+, а Pentium 4 Extreme Edition 3.73 ГГц выступает на равных с Athlon 64 3800+. Конечно, назвать такие результаты успехом для Intel явно нельзя, однако этот факт является явным предвестником того, что в игровых приложениях увеличенный кеш процессоров с ядром Prescott 2M должен сказаться положительным образом.






Результаты, полученные в самом новом тестовом пакете от Futuremark, 3DMark05 также говорят нам о том, что увеличенная кеш-память новых процессоров Pentium 4 даёт определённый эффект при работе с игровой 3D графикой. Однако индекс производительности CPU из этого теста не позволяет Pentium 4 660 опередить Pentium 4 570, работающий на 200 МГц более высокой тактовой частоте. Впрочем, это не мешает при этом выставить на первое место по данному индексу процессор Pentium 4 Extreme Edition 3.73 ГГц, которому удаётся обогнать даже Athlon 64 FX-55.

Игровые приложения















С самого момента появления процессоров Athlon 64, CPU этого типа наголову побеждают своих конкурентов семейства Pentium 4 в игровых приложениях. Появление процессоров Pentium 4 6XX и Pentium 4 Extreme Edition 3.73 ГГц эту ситуацию не изменило. Несмотря на то, что увеличение кеш-памяти второго уровня привело к росту скорости Pentium 4 в играх примерно на 3-6%, Athlon 64 в 3D играх вновь оказываются значительно более быстрыми CPU. Положение не спасает и новый Pentium 4 Extreme Edition, уступающий в приложениях этого типа по скорости даже Athlon 64 3500+.

Офисные приложения


При работе в Microsoft Office скорость процессора оказывает небольшое влияние на производительность системы в целом.


Зато рендеринг веб-страниц в одном из самых популярных броузеров Mozilla (движок которого используется и в ещё более распространенном FireFox) на процессорах семейства Athlon 64 выполняется значительно быстрее, чем на конкурирующих CPU от Intel.


Впрочем, если во время работы с броузером в фоновом режиме выполняется какой-либо другой процесс, сильно загружающий ресурсы компьютера, результаты Pentium 4 оказываются несколько лучше, благодаря поддержке этими процессорами технологии Hyper-Threading.


Как видим, производительность ещё одного распространённого приложения, Nero, предназначенного для записи CD и DVD дисков также мало зависит от производительности центрального процессора.

Сжатие данных






Скорость работы приложений для сжатия данных напрямую зависит от тех алгоритмов, которые используются в этих приложениях. Как видим, WinZip несколько лучше оптимизирован для процессоров Intel, зато в WinRAR чудеса быстродействия показывают CPU семейства Athlon 64.
Кстати, по данным WinRAR, очень чутко реагирующего на любые изменения в архитектуре системы, увеличение кеш-памяти второго уровня даёт очень небольшой эффект: всего лишь порядка 3%.

Кодирование аудио и видео















В задачах кодирования видео традиционно выигрывают процессоры семейства Pentium 4. Приложения, используемые для сжатия видео контента, хорошо оптимизированы для NetBurst архитектуры и зачатую используют набор инструкций SSE3, который реально может увеличить производительность в программах этого рода. Поэтому, мы вновь вынуждены констатировать тот факт, что равных Pentium 4 при кодировании видео нет.
Что же касается кодирования аудио в формат mp3, то с этим процессом CPU от Intel и AMD справляются примерно с одинаковой скоростью.
Хочется отметить, что в задачах кодирования аудио и видео контента процессоры Pentium 4 6XX оказываются лишь немного быстрее, чем Pentium 4 5XX. Двукратное увеличение объёма кеш-памяти второго уровня в приложениях такого рода даёт прирост производительности менее 1%.

Редактирование изображений






Соотношение производительности между процессорами и в ACDSee, обладающем простейшими пакетными функциями для редактирования изображений, и в полновесном Adobe Photoshop примерно одинакова. Работа с изображениями на процессорах семейства Athlon 64 выполняется несколько быстрее, нежели на конкурирующих продуктах от Intel.
При этом мы вновь должны констатировать, что CPU семейства Pentium 4 6XX в приложениях этого типа опережают процессоры серии Pentium 4 5XX лишь на десятые доли процента. То есть, и в графических редакторах эффект от увеличения кеш-памяти в процессорах с ядром Prescott 2M проявляется весьма слабо.

Редактирование видео

Процессоры семейства Athlon 64 сильны именно благодаря своей вычислительной мощности. Поэтому их победа в специализированных пакетах для математических расчётов вполне закономерна.
Интересно же в этих тестах другое. Во-первых, Mathematica оказывается одним из немногих приложений, в котором размер кеш-памяти второго уровня имеет большое значение. Так преимущество процессоров с ядром Prescott 2M над процессорами с ядром Prescott, работающими на одинаковой тактовой частоте, оказывается порядка 7%, а это чуть ли не максимальное значение, наблюдаемое нами в данном тестировании. Во-вторых, Matematica очень лояльно отнеслась к процессору Pentium 4 Extreme Edition 3.46 ГГц, основанному на устаревшем 130 нм ядре Gallatin. Как видим, этот процессор, несмотря на свою относительно невысокую тактовую частоту, является в данном приложении лидером среди всех CPU от Intel.
Что же касается пакета MATLAB, то наблюдаемая в нём картина вполне привычна, поэтому полученные здесь результаты вряд ли нуждаются в дополнительных комментариях.
Производительность при финальном рендеринге в Lightwave очень сильно зависит от типа стоящегося изображения. В зависимости от этого в лидерах могут быть как процессоры Athlon 64, так и Pentium 4.
При этом заметим, что в любых задачах 3D рендеринга объём кеш-памяти второго уровня оказывает небольшое влияние на конечный результат. Этот относится как к процессорам Pentium 4 6XX, так и к Athlon 64 с мегабайтным L2 кешем.
Кроме того, обратите внимание на то, что в Lightwave процессоры Pentium 4 6XX проигрывают Pentium 4 5XX, работающим на аналогичной частоте. Скорее всего, этот факт объясняется именно большей медлительностью кеш-памяти второго уровня, реализованной в ядре Prescott 2M.

Выводы

В рамках данного обзора мы познакомились с семейством новых процессоров Intel, использующих в своей основе ядро Prescott 2M. Хотя на первый взгляд основным преимуществом этого ядра является увеличенный до 2 Мбайт L2 кеш, на деле процессоры на базе этого ядра содержат гораздо больше интересных нововведений, чем это кажется на первый взгляд. CPU линейки Pentium 4 6XX, являющиеся основными носителями ядра Prescott 2M на сегодняшний день, обладают не просто большей кеш-памятью, чем их предшественники, они снабжены рядом новых технологий, расширяющих их функциональность.
Тут в первую очередь следует отметить, что Pentium 4 6XX стали первыми массовыми CPU от Intel для настольных компьютеров, поддерживающими 64-битные расширения архитектуры x86. В свете скорого появления 64-битных пользовательских операционных систем, и в первую очередь Windows XP Professional x64 Edition, Intel поддержал инициативу AMD по внедрению архитектуры x86-64 и снабдил свои CPU соответствующими расширениями. Таким образом, теперь поддержка x86-64 прекращает быть прерогативой исключительно процессоров Athlon 64: конкурирующие продукты от Intel, процессоры Pentium 4 6XX теперь также имеют возможность работать с 64-битными приложениями и поддерживать более 4 Гбайт оперативной памяти.
Аналогичные 64-битные расширения архитектуры x86 получили и процессоры Pentium 4 Extreme Edition. Новая модель в этом семействе, Pentium 4 Extreme Edition 3.73 ГГц, которая основывается на новом ядре Prescott 2M, также поддерживает x86-64.
Нельзя обойти вниманием и тот факт, что новые процессоры Pentium 4 6XX получили в свое распоряжение набор технологий Demand Based Switching, благодаря которым снижается тепловыделение и энергопотребление этих процессоров в те моменты, когда от CPU не требуется работа "на пике своих возможностей". В процессорах семейства Pentium 4 6XX реализованы технологии C1E, TM2 и EIST и благодаря этому набору CPU данного типа большинство времени работают на частоте 2.8 ГГц при пониженном напряжении питания, разгоняясь до номинальной частоты лишь в те моменты, когда от системы необходима максимальная производительность.
Именно такой набор новых возможностей, реализованных в процессорах Pentium 4 6XX, позволил Intel установить на них достаточно высокие цены по сравнению с их предшественниками, Pentium 4 5XX с обычным ядром Prescott. Вот выдержка из нового официального прайс-листа (цены процессоров за 1 тыс. шт.):

Intel Pentium 4 Extreme Edition 3.73 GHz (3.73 GHz, 1066 MHz FSB, 2 MB L2) - $999;
Intel Pentium 4 660 (3.60 GHz, 800 MHz FSB, 2 MB L2) - $605;
Intel Pentium 4 650 (3.40 GHz, 800 MHz FSB, 2 MB L2) - $401;
Intel Pentium 4 640 (3.20 GHz, 800 MHz FSB, 2 MB L2) - $273;
Intel Pentium 4 630 (3.00 GHz, 800 MHz FSB, 2 MB L2) - $224.

Что же касается традиционного восприятия новых CPU, а именно их производительности, то нельзя сказать, что появление Pentium 4 "шестисотой серии" как-то повлияло на расстановку сил на процессорном рынке. Пока тактовая частота этих CPU уступает тактовой частоте старших процессоров Pentium 4 5XX, а увеличенный кеш второго уровня лишь незначительно позволяет поднять быстродействие. На графике ниже мы приводим относительную производительность Pentium 4 660 по сравнению с производительностью аналогичного по тактовой частоте процессора Pentium 4 560, основанного на обычном ядре Prescott с кеш-памятью второго уровня объёмом 1 Мбайт:


Как видим, в большинстве случаев эффект от увеличенной в два раза кеш-памяти второго уровня не превосходит 5%. Именно поэтому на сегодняшний день Pentium 4 570 с тактовой частотой 3.8 ГГц и кеш-памятью второго уровня 1 Мбайт следует считать более производительным CPU, нежели Pentium 4 660 с тактовой частотой 3.6 ГГц и 2-мегабайтной кеш-памятью. Сильные же стороны Pentium 4 6XX заключаются в первую очередь в поддержке EM64T и в наборе технологий C1E, TM2 и EIST.
Что же касается процессора Pentium 4 Extreme Edition 3.73 ГГц, то он приходит на смену Pentium 4 Extreme Edition 3.46 ГГц, основанному на ядре Gallatin. Смена ядра, перенос 2 Мбайт кеша с третьего уровня на второй и ощутимое увеличение тактовой частоты возымели своё дело и в целом, новый Extreme Edition стал побыстрее старого:


Однако данная картина наблюдается далеко не всегда и, более того, в игровых приложениях, на работу в которых в первую очередь и нацелены процессоры серии Extreme Edition, новый Pentium 4 Extreme Edition 3.73 ГГц не обгоняет своего предшественника. Все-таки 130 нм ядро Northwood и его производная Gallatin, использовавшаяся в Pentium 4 Extreme Edition 3.46 ГГц, в игровых приложениях работает более эффективно, нежели любой из Prescott.
Впрочем, вновь не следует забывать о том, что неоспоримым преимуществом Pentium 4 Extreme Edition 3.73 ГГц является поддержка 64-битных расширений EM64T.
Что же касается общей расстановки сил "AMD против Intel", то теперь мы можем констатировать, что по своим возможностям процессоры на ядре Prescott 2M уровнялись с процессорами Athlon 64. Так, взамен 64-битных расширений AMD64 у Athlon 64, в процессорах Pentium 4 6XX появились расширения EM64T. Аналогом технологии Cool"n"Quiet от AMD стала технология EIST от Intel, а кроме того процессоры Intel получили поддержку NX-бита (в терминах Intel XD-бита).
Производительность же старших моделей процессоров от Intel при этом пока всё ещё уступает скорости старших процессоров Athlon 64. Хотя, Pentium 4 продолжают лидировать в традиционных для себя областях, как то кодирование видео данных или финальный рендеринг, в большинстве приложений, а в первую очередь в играх, CPU от AMD показывают более высокое быстродействие.


© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows