Технологии оптимизации работы PC

Евгений Рудометов

www.rudometov.com

Производительность и энергопотребление компьютера зависит как от встроенных внутрь чипов элементов управления производительностью, так и от технологий реализованных в архитектуре материнской платы

Средства управления производительностью и энергопотреблением находят все большее распространение. Встроенные цепи, обеспечивающие уменьшение тактовой частоты при снижении вычислительной нагрузки, позволяет уменьшить напряжение питания, а уменьшение обоих этих параметров способствует значительному снижению теплообразования.

В качестве примера эффективных средств управления производительностью и оптимизации энергопотребления (а, следовательно, и снижения теплообразования) можно привести процессоры Intel. В их составе реализованы следующие средства:

·         Детектор аварийного перегрева (catastrophic shutdown detector);

·         Механизм автоматического термального мониторинга (automatic thermal monitoring mechanism) — Thermal Monitor 1 и Thermal Monitor 2;

·         Модуляция тактовой частоты по запросу (software controlled on-demand clock modulation);

·         Технология Enhanced Intel SpeedStep.

Детектор аварийного перегрева — полностью автоматический  механизм, впервые появившийся в процессорах семейства P6 и реализованный также в процессорах Intel Pentium 4, Xeon и Pentium M. По достижению определенного температурного порога, устанавливаемого при изготовлении процессора, работа приостанавливается до поступления специального сигнала RESET#.

Thermal Monitor 1 (TM1) — механизм, получивший  распространенное наименование «троттлинг» (Throttling или Thermal Throttling, а также Thermal Trip). Реализован в процессорах Intel Pentium 4, Xeon и Pentium M. Представляет собой сочетание второго температурного сенсора (первый служит механизму аварийного отключения), также калибруемого на этапе изготовления процессора, и механизма модуляции тактовой частоты процессора.

Модуляция тактового сигнала, подаваемого на процессор системой термоконтроля, приведена на Рис. 1.

Рис. 1. Модуляция тактового сигнала, подаваемого на процессор системой термоконтроля

В отличие от детектора аварийного перегрева, механизм TM1 является как определяемым, так и контролируемым с помощью специальных инструкций. Согласно рекомендациям Intel, механизм TM1 должен включаться в BIOS при инициализации процессора и не изменяться впоследствии операционной системой. В случае внештатной ситуации, например, остановке кулера, механизм обеспечивает поддержание температуры процессора на максимально безопасном уровне посредством снижения его производительности.

Thermal Monitor 2 (TM2) — более совершенный механизм защиты процессора от перегрева, реализованный в процессорах Intel Pentium M, а также в улучшенных моделях Intel Pentium 4 и Xeon. Существенным отличием от TM1 является управлением частотой (точнее, FID — множителем частоты системной шины) и питающим напряжением (VID) процессора. За счет снижения питающего напряжения, TM2 позволяет сохранить большую производительность процессора в ситуации перегрева при одинаковом снижении уровня потребляемой им электроэнергии. Ответственность за использование TM2 возлагается на BIOS.

Включение механизма TM2 рекомендовано для старших моделей процессоров, например, для моделей не менее 2.8 ГГц при тактовой частоте шины 166 МГц и не менее 3.6 ГГц при тактовой частоте шины 200 МГц. Для младших моделей рекомендуется использовать TM1. Одновременное включение или выключение TM1 и TM2 является внештатным режимом работы процессора и не рекомендуется производителем. Установка целевых значений FID и VID должна происходить BIOS на этапе инициализации процессора.

Модуляция тактовой частоты по запросу (ODCM) обеспечивает программное уменьшение тепловой нагрузки на процессор во время его простоя. Обеспечивается программное задание минимального уровня цикла полезного действия процессора за счет технологии программной модуляции тактовой частоты процессора (троттлинга).

Технология Enhanced SpeedStep (EIST) обеспечивает энергосбережение, а, следовательно, и низкое теплообразование. Изначально она появилась в процессорах Intel Pentium M. Пришла на смену технологии Intel SpeedStep, использумой в мобильных процессорах Intel Pentium III и Pentium 4. Более совершенная технология обеспечивает более эффективное управления энергопотреблением процессора посредством динамического изменения дискретных состояний производительности процессора (P-state transitions, каждое P-state задается комбинацией значений FID и VID).

Не оставлены разработчиками указанных средств и современные многоядерные процессоры, большинство из которых создаются по архитектуре Intel Core. К ним относятся двухъядерные Intel Core 2 Duo и четырехъядерные модели. К слову сказать, верхние двух- (Рис. 2) и четырехядерные модели поддерживают все ранее рассмотренные технологии управления производительностью и энергопотреблением. К ним относятся: технология управления производительностью процессора по запросу Enhanced Intel SpeedStep (EIST), функции защиты процессора от перегрева Thermal Monitor 1 (TM1) и Thermal Monitor 2 (TM2), технология модуляции тактовой частоты процессора по запросу On-Demand Clock Modulation (ODCM), а также улучшенные режимы простоя Enhanced C States (CxE).

Рис. 2. Процессор Intel Core 2 Extreme X6800

В многоядерных процессорах линеек Intel Core 2, а также в мобильных процессорах Intel Core Solo/Duo, последняя функция была расширена на случай всех возможных состояний бездействия процессора, включая режимы Stop Grant (C2), Deep Sleep (C3) и Deeper Sleep (C4). Для десктопных процессоров Intel Core 2 по умолчанию включен лишь режим Enhanced Halt (C1) State — C1E. Связано это с тем, что более глубокие режимы «сна» процессора, как правило, не используются в десктопных платформах. Так, например, благодаря использованию режима C1E номинальная частота ядра процессора «сбрасывается» до минимального уровня — 1600 МГц (тактовая частота шины 266 МГц, минимальный множитель 6x).

Оценивая перечисленные технологии, необходимо отметить,  что к средствам управления производительностью следует отнести и, например, разгон (overclocking). Идея разгона, как сравнительно простого и относительно дешевого метода повышения производительности ранее купленного или нового компьютера, довольна проста. В ее основе лежит реальная возможность эксплуатации комплектующих в форсированных частотных режимах. А, как известно, повышение тактовых частот позволяет решать задачи за меньшее время или обрабатывать большие объемы информации за единицу времени.

Действительно:

Производительность = (Количество инструкций) / (Время выполнения).

Это выражение можно переписать в виде произведения количества инструкций, выполняемых за один такт (Instruction Per Clock, IPC), на  количество тактов за единицу времени (тактовая частота, F):

                                                Кол-во инструкций               К-во тактов
Производительность         =              --------------------------  х  ------------------------   =
IPC x F                                                                   К-во тактов                   Время выполнения

Таким образом, производительность пропорциональна частоте. Правда, в реальности зависимость не является строго линейной, поскольку из-за высоких частот часть переданной информации искажается и поэтому передачи  приходится повторять. Кроме того, есть еще и проблема синхронизации работы отдельных узлов и подсистем, что порождает задержки. Тем не менее, с ростом тактовых частот растет и производительность, по крайней мере, пока доля искаженных посылок и суммарный объем задержек не остановят этот рост.

Для поддержания роста тактовых частот чипов выше номинала, как следует из физики, приходится увеличивать и уровни питающих напряжений, что приводит к росту теплообразования:

P = C x V x V x F  

Здесь, P – мощность теплообразования; С – коэффициент, учитывающий особенности архитектуры чипов; V – напряжение питания; F – тактовая частота.

Кстати, уменьшение тактовой частоты позволяет снизить напряжение питания, а уменьшение обоих этих параметров согласно приведенной формуле способствует снижению теплообразования. А это в свою очередь, снижает нагрузку на средства охлаждения, что позволяет уменьшить скорость вращения вентиляторов, снизить шум, экономить электроэнергию (существенно в ноутбуках и серверах).    

Справедливости ради следует отметить, что далеко не все специалисты разделяют энтузиазм приверженцев форсированных режимов, хотя число любителей разгона довольно высоко.

Возможность разгона процессора основана на том, что большинство процессоров имеют достаточно большой технологический запас, обеспечивающий гарантированный уровень производительности всей выпущенной серии.

Соответствующие технологические резервы производительности часто имеют и элементы видеоадаптеров (видеочипы и микросхемы видеопамяти), оперативной памяти и жестких дисков. Этот запас может быть реализован в процессе индивидуального подбора оптимальных режимов эксплуатации разгоняемых элементов.

Несмотря на неприятие многими специалистами и компьютерными фирмами такого явления, как разгон, возможности управления производительностью продолжает завоевывать популярность, увеличивая число своих сторонников. Фирмы-производители материнских плат, осуществляя свою деятельность в жесткой конкурентной борьбе, не смогли проигнорировать мнение потенциальных покупателей. Именно поэтому соответствующие функции поддерживаются большинством их изделий.

Выбирая оптимальную материнскую плату по критерию наличия функций разгона, необходимо оценивать ряд особенностей, обеспечивающих реализацию данных специфических режимов.

Прежде всего, это касается диапазона рабочих частот шин процессора (FSB) и памяти, а также шага их изменения. Дело в том, что, как правило, современные процессоры имеют фиксированный частотный коэффициент, определяющий внутреннюю частоту работы ядра (ядер) процессора через частоту шины FSB. Поэтому разгон обычно осуществляется увеличением частоты шины процессора FSB. При этом необходимо учитывать, что увеличение частоты шины процессора нередко сопровождается соответствующим изменением частотных режимов работы остальных комплектующих.

А еще разгону подвергаются модули оперативной памяти и видеоадаптеры. Действительно, некоторые экземпляры допускают значительное увеличение тактовых частот, например на 20–50 %. В экстремальных режимах рост может быть существенно выше. Так, например, в экспериментах глубокого охлаждения работающих чипов не является редкостью и удвоение тактовых частот.

Что же касается традиционных режимов разгона центрального процессора компьютера, то, как отмечалось выше, это достигается обычно увеличением частоты шины процессора FSB. Однако ее рост в ряде случаев сопровождается изменением режимов других компонентов системы. Это могут быть, например, накопители на жестких магнитных дисков. Для обеспечения надежной работы и сохранения информации для него не следует значительно (более 10%) увеличивать тактовую частоту шины подключения.

Кстати, современные качественные материнские платы, выпущенные производителями верхнего уровня, позволяют оперировать шинами процессора, видеоадаптера и жестких дисков независимо друг от друга. Это повышает гибкость настройки и позволяет оптимизировать работу каждой из подсистем. Осуществляется это индивидуальным подбором соответствующих параметров при использовании всех доступных средств.

Говоря о частотных настройках, необходимо отметить, что важными характеристиками, определяющим разгонный потенциал материнской платы, является плавное изменение напряжения ядра процессора, а также питания модулей DRAM и видеошин типа PCI Express или AGP. При этом считается допустимым увеличение уровня напряжения ядра процессора на 5–10 % (в качественных изделиях) при обеспечении контроля над температурными режимами эксплуатации элементов.

Необходимо отметить, что для экстремальных режимов, при которых достигается максимальный прирост производительности, требуется значительно большее увеличение питающих напряжений, нередко достигающее 20 %. Тем не менее, для обеспечения максимальных уровней надежности и безопасной эксплуатаций целесообразно воздерживаться от режимов с повышенными уровнями энергопитания.

Изменение частоты и напряжений может осуществляться как с помощью соответствующих переключателей и перемычек в материнских платах предыдущих поколений, так и программно — в BIOS Setup. Конечно, разгон, осуществляемый программными средствами, намного удобнее, так как упрощает процедуру выбора режимов, обеспечивающих максимальную производительность компьютера. При этом, используя возможности технологий типа SoftMenu в BIOS Setup, не требуется даже открывать системный блок компьютера. Все операции по разгону и контролю за установленными параметрами осуществляются в соответствующих пунктах меню BIOS Setup.

Аппаратную поддержку данных возможностей осуществляют специальные цепи, задающие частотные режимы основных подсистем.

Для целей гибкого управления производительностью конструкторы создают разные варианты, позволяющие изменение возможностей изменения коэффициентов, задающих соотношение частот шин процессора, памяти и, возможно, видеоадаптера.

Изменение частотных режимов осуществляется с помощью встроенных в архитектуру материнских плат специальных средств. К их числу относятся чипы PLL (phase-locked loop), реализующие в своем составе управляемых током или напряжением генераторов (VCO — Voltage Controlled Oscillator), осуществляющих постоянное отслеживание фазы входного сигнала. Такие генераторы используются для управления частотой. На материнской плате чипы PLL используется для формирования нескольких частот.

Один из примеров реализации PLL, используемый, кстати, в материнских платах такого известного производителя как Gigabyte, приведен на Рис. 3.

Рис. 3. Вариант реализации схемы чипа PLL

Электронные цепи с аппаратно-программным изменением частот, подаваемых на основные подсистемы компьютера, обеспечивают широкие возможности для управления производительностью и энергопотреблением.

Изменяемые по частоте тактовые сигналы подаются на компоненту чипсета, выполняющую функции North Bridge, через которую осуществляется управление скоростными параметрами процессора, модулей оперативной памяти, видеоадаптера.

Наиболее совершенные комплексные варианты аппаратно-программного управления позволяют еще и сравнительно плавное изменение уровней питающих напряжений и временных параметров, определяющие работу модулей подсистемы оперативной памяти.

В качестве примера можно привести ряд технологий, используемых в материнских платах компании Gigabyte, являющейся одним из лидеров данного сектора рынка.

Говоря о средствах управления нельзя не отметить такое нововведение как динамический разгон, обеспечивающий автоматическое изменение тактовых частот в зависимости от изменения вычислительной нагрузки. Такие средства обеспечивают рост тактовых частот при увеличении нагрузки и уменьшение — при ее снижении, что улучшает тепловые режимы эксплуатации комплектующих. В качестве примера можно привести технологию C.I.A. 2.

Технология C.I.A. 2 (CPU Intelligent Accelerator) осуществляет динамическое изменение частоты процессора (точнее, FSB) и напряжения питания в зависимости от текущей загрузки. Возможен выбор одного из режимов разгона: Disable, Cruise, Sports, Racing, Turbo, Full Thrust. Каждый из режимов определяет диапазон прироста тактовой частоты.

Еще одним инструментом повышения производительности компьютера являются фирменные средства улучшения работы подсистемы памяти. В качестве примера может рассматриваться M.I.B. 2 (Memory Intelligent Booster 2), созданная Gigabyte и позволяющая оптимизировать работу с оперативной памятью за счет учета характеристик известных чипов/модулей. Как показывают результаты тестирования, помимо увеличения тактовых частот технология Memory Intelligent Booster 2, действительно, задействует механизмы, способствующие увеличению пропускной способности шины памяти.

Остается добавить, что указанные технологии дополняет набор фирменных утилит от того же производителя материнских плат. В их состав входит программа EasyTune 5 (и/или новейшая EasyTune Center) для мониторинга системных параметров и осуществления разгона (Рис. 4). Для пользователей доступно изменение частоты и множителя процессора, множителя для памяти, частоты шины PCI Express и напряжения питания процессора, памяти и южного моста чипсета, но в меньших пределах, нежели доступно из BIOS. А еще следует отметить настройку режимов в SmartFan: можно выбрать диапазон частоты вращения от 0 до 100% и соответствующую граничным значениям температуру.

Рис. 4. Выбор параметров C.I.A. 2 и пример работы EasyTune 5

Конечно, во многих моделях Gigabyte имеются еще и соответствующие средства повышения тактовых частот видеоподсистем. Например, в BIOS Setup ряда моделей имеются параметры, определяющие эффективность технологии Robust Graphics Booster. Суть этой технологии сводится к тому, что посредством выбора одного из трех режимов — Auto, Fast, Turbo — пользователь имеет возможность увеличить частоту работы графического ядра и графической памяти видеокарты.

И конечно, в  BIOS Setup предусмотрены многочисленные параметры грубой и/или тонкой настройки эффективной работы основных подсистем. К ним относятся изменение частотных режимов, напряжений питания, таймингов модулей памяти, управление вентиляторами и т. п.

Рассматривая фирменные аппаратно-программные средства, нельзя не вспомнить и о некоторых особенностях архитектуры материнских плат. Они позволяют расширить диапазоны управления и увеличить функциональные возможности. Действительно, специализированные чипы вместе с чипсетом обеспечивают поддержку фирменных технологий. А в ряде случаев за счет тщательной проработки архитектуры и дизайна платы удается ослабить ограничения, накладываемые чипсетами, являющимися, по сути, основой материнских плат.

В качестве примера можно привести Intel P965, рассчитанный на процессорную шину 533/800/1066 МГц. Однако на этом чипсете компания Gigabyte выпустила модели материнских плат не только корректно работающих с процессорами, шина которых имеет частоту 1333 МГц, но и поддерживающих для них еще и функции разгона. В дополнение к этому с чипсетом Intel P965 удалось даже расширить возможности видеоподсистемы.

Развивая свой успех, полученный с наборами Intel P965, компания выпустила ряд моделей материнских плат, созданных на основе чипсетов IntelP35. Новые изделия поддерживают многоядерные процессоры, работающие на более высоких частотах. Однако, как и в случае с Intel P965, разработчики материнских плат столкнулись с ограничениями видеоподситем. Дело в том, что IntelP35 не предуспматривают многоплатных конфигураций, реализующих технологии типа SLI и CrossFire.

Однако и в этом случае удалось найти соответствующие решения, аналогичные тем, что были реализованы в материнских платах, созданных на основе IntelP35. Действительно, в новых моделях поддержка видеоподсистемы, как и ранее, осуществлена наличием двух разъемов конструктива PCI Express х16 и соответствующими интерфейсами (Рис. 5). Переключение линий осуществляется при помощи двух специальных чипов (PCI Express Switch), интегрированных в состав архитектуры материнской платы.

Рис.5. Реализация конфигурации с двумя видеокартами в системах, созданных на чипсете IntelP35

Именно так организована работа видеоподсистемы, например, в материнской плате GA-P35-DS3P. В конфигурации с двумя видеокартами обеспечена поддержка технологии ATI CrossFire — аналога технологии SLI. Это позволяет существенно расширить возможности видеоподсистемы.

Первый слот поддерживает скоростной режим х16. Второй — не выше х4. Этот слот является разделяемым. Он делит общие линии со слотами PCI Express x1. В результате его использование исключает возможность работы устройств PCI Express x1, что часто не является критичным, большое количество контроллеров уже интегрировано в состав материнской платы. Меняя же число видеокарт и параметры их настройки, можно изменять производительность видеоподсистемы в широком диапазоне значений.

Оценивая приведенные решения, необходимо отметить, что данный обзор не претендует на полноту. Спектр фирменных технологий, ориентированных на оптимизацию компьютерных возможностей, конечно, существенно шире.

В заключение следует в очередной раз напомнить, что выбор оптимальной материнской платы является очень важным этапом. Именно на этом этапе нередко закладываются возможности будущего компьютера. И в их расширении могут существенно помочь фирменные аппаратные и программные средства.

При подготовке статьи были использованы материалы книги
«Материнские платы и чипсеты. 4-е изд. Анатомия ПК». — СПб.: Питер, 2007. — 368с.