Pentium 4 – новый этап развития архитектуры высокопроизводительных компьютеров

Евгений Рудометов, Виктор Рудометов.
authors@rudometov.com

Статья основана на материалах книг "Устройство мультимедийного компьютера" и "Материнские платы и чипсеты"

Разработка и выпуск процессоров нового поколения Pentium 4 потребовали соответствующего изменения архитектуры систем, что позволило не только увеличить рабочую частоту процессоров, но и существенно повысить производительность компьютеров в мультимедийных задачах.

В последние годы достаточно часто раздаются критические замечания в адрес лидера компьютерной индустрии фирмы Intel. Проблемы, конечно, имеются, но иногда эта критика становится модной и носит оттенок некоторого снобизма. Отмечается принципиальная отсталость и бесперспективность архитектуры i440BX и недостаточная производительность систем, созданных на основе чипсета i810, в задачах с 3D-графикой. Досталось и решениям, предусматривающим использование i820 c MTH. При этом критики нередко ссылаются на признание разработчиками фактов нестабильности подобных систем. Не остались незамеченными и процессоры, долгое время выпускаемые без изменения архитектуры ядра. Но пути внедрения передовых технологий и перспективных решений никогда не являются легкими. И всегда ли правы оппоненты? Всегда ли их критика основана на реальных фактах?

Действительно, прославленный чипсет i440BX не поддерживает ряда новейших функций и спецификаций, таких как, например, PC133, AGP 4X, ATA/66/100, AC'97, Hardware monitoring и т. д. Однако производители материнских плат совместно с данным чипсетом используют дополнительные специализированные микросхемы, обеспечивая реализацию необходимых возможностей, включая даже RAID. И все это по приемлемым ценам.

Кстати, о ценах и методах их снижения. Именно с этой целью и был создан вариант i820 c MTH, предоставляющий возможность использования SDRAM. Неустойчивость же работы проявлялась только в ряде изделий при некоторых комплектующих. А что касается систем с i810, то данный чипсет совместно с недорогими процессорами ориентирован на применение в дешевых офисных системах, где использование 3D-графики является неактуальным. Не следует сравнивать подобные системы с более дорогими вариантами, ориентированными на иную область применения. Однако об этом нередко забывают не только потенциальные пользователи, но и специалисты. К сожалению, они часто неспособны по достоинству оценить потенциальные возможности доступных им изделий и комплектующих, созданных с ориентацией на вполне конкретные области применения. Сегментация же рынка является общепризнанным явлением, нашедшим свое отражение в архитектуре как процессоров и чипсетов, так и других компьютерных элементов. Именно сегментация позволяет осуществить оптимальный выбор комплектующих с учетом области применения компьютеров и эффективного выполнения ими поставленных задач. При этом требования рынка постоянно меняются, что приводит к постепенному смещению изделий High-End класса к нижней границе, освобождая место более производительным образцам, к числу которых бесспорно относятся новейшие процессоры Pentium 4. Процессор Pentium 4, ранее известный как процессор Willamette, является изделием с принципиально новой архитектурой. Он построен на основе микроархитектуры Intel NetBurst. Содержит 42 млн транзисторов. Создан с использованием хорошо отлаженной и проверенной на процессорах предыдущего поколения технологии 0,18 мкм, хотя специалисты утверждают, что достоинства новой архитектуры проявятся в наибольшей степени после перехода к технологии 0,13 мкм (2001 г.) и еще больше при использовании технологии 0,1 мкм (2002 г.). По некоторым оценкам, с учетом совершенствования технологии рабочие frequency будущих моделей процессоров Pentium 4 могут превысить 4 ГГц с соответствующим ростом их производительности. В то же время необходимо подчеркнуть, что предшественники этих процессоров практически достигли верхнего предела frequency, определяемой их архитектурой и технологией. Использование в архитектуре Pentium 4 технологии гиперконвейерной обработки позволило значительно увеличить рабочую частоту, и первые варианты новых процессоров были выпущены на частотах 1,4 и 1,5 МГц.

Для обеспечения безостановочного функционирования конвейера большой длины на большой частоте потребовалось значительное изменение внутренней архитектуры ядра. Прежде всего, это касается алгоритмов предсказания переходов. Использование улучшенной технологии динамического исполнения (Advanced Dynamic Execution Engine) улучшает предсказание ветвлений, повышая производительность за счет оптимизации последовательности выполнения команд. При этом для повышения скорости работы арифметико-логические блоки (Arithmetic Logic Unit — ALU) работают на удвоенной по сравнению с ядром частоте. Для процессора с внутренней частотой 1,5 ГГц ALU функционируют на частоте 3 ГГц. Это позволяет выполнять некоторые целочисленные команды за период, равный 1/2 такта.

Высокая производительность определяется эффективной работой кэш-памяти первого (L1) и второго (L2) уровней, интегрированных в состав кристалла ядра. Как и у процессоров предыдущей разработки Pentium III с ядром Coppermine, кэш-память второго уровня L2 подключена посредством 256-разрядной шины (Advanced Transfer Cache). Эта кэш-память имеет традиционный объем 256 Кбайт и работает на частоте ядра процессора, обеспечивая высокую его производительность.

С целью оптимизации работы внутренних узлов ядра расширен набор команд. В процессоре Pentium 4 использовано второе поколение команд, относящихся к расширенному набору. Этот набор, представляющий собой дальнейшее развитие технологий MMX и SSE, получил наименование SSE2 (Streaming SIMD Extensions 2). Набор команд SSE2 — это потоковые SIMD-расширения, включающие 144 новых инструкции, обеспечивающих еще больший уровень производительности на задачах мультимедиа по сравнению со своими предшественниками Pentium MMX, Pentium II, Pentium III.

Продолжение статьи >>

Перейти к разрелу Процессоры