Технологии управления производительностью

Евгений Рудометов

Rudometov@rudometov.com

Производительность компьютера зависит от режимов работы комплектующих. Эти режимы зависят как от встроенных внутрь чипов элементов управления производительностью и энергопотреблением, так и от внешних, работа которых определяется аппаратно-программных средств материнской платы

Многоядерные процессоры, созданные по архитектуре Intel Core, к которым относятся верхние модели двухъядерного Intel Core 2 Extreme (Conroe) и четырехъядерного Intel Core 2 Extreme (Kentsfield), поддерживают ряд технологий управления производительностью и энергопотреблением. К ним относятся: технология управления производительностью процессора по запросу Enhanced Intel SpeedStep (EIST), функции защиты процессора от перегрева Thermal Monitor 1 (TM1) и Thermal Monitor 2 (TM2), технология модуляции тактовой частоты процессора по запросу On-Demand Clock Modulation (ODCM), а также улучшенные режимы простоя Enhanced C States (CxE).

В многоядерных процессорах линеек Intel Core 2, а также в мобильных процессорах Intel Core Solo/Duo, последняя функция была расширена на случай всех возможных состояний бездействия процессора, включая режимы Stop Grant (C2), Deep Sleep (C3) и Deeper Sleep (C4). Для десктопных процессоров Intel Core 2 по умолчанию включен лишь режим Enhanced Halt (C1) State — C1E. Связано это с тем, что более глубокие режимы «сна» процессора, как правило, не используются в десктопных платформах. Так, например, благодаря использованию режима C1E номинальная частота ядра процессора «сбрасывается» до минимального уровня — 1600 МГц (тактовая частота шины 266 МГц, минимальный множитель 6x).

Оценивая перечисленные технологии, необходимо отметить,  что к средствам управления производительностью следует отнести и, например, разгон (overclocking). Идея разгона, как сравнительно простого и относительно дешевого метода повышения производительности ранее купленного или нового компьютера, довольна проста. В ее основе лежит реальная возможность эксплуатации комплектующих в форсированных частотных режимах. А, как известно, повышение тактовых частот позволяет решать задачи за меньшее время или обрабатывать большие объемы информации за единицу времени.

Действительно:

Производительность = (Количество инструкций) / (Время выполнения).

Это выражение можно переписать в виде произведения количества инструкций, выполняемых за один такт (Instruction Per Clock, IPC), на  количество тактов за единицу времени (тактовая частота, F):

                                                Кол-во инструкций               К-во тактов
Производительность         =              --------------------------  х  ------------------------   =
IPC x F                                                                   К-во тактов                   Время выполнения

Таким образом, производительность пропорциональна частоте. Правда, в реальности зависимость не является строго линейной, поскольку из-за высоких частот часть переданной информации искажается и поэтому передачи  приходится повторять. Кроме того, есть еще и проблема синхронизации работы отдельных узлов и подсистем, что порождает задержки. Тем не менее, с ростом тактовых частот растет и производительность, по крайней мере, пока доля искаженных посылок и суммарный объем задержек не остановят этот рост.

Для поддержания роста тактовых частот чипов выше номинала, как следует из физики, приходится увеличивать и уровни питающих напряжений, что приводит к росту теплообразования:

P = C x V x V x F  

Здесь, P – мощность теплообразования; С – коэффициент, учитывающий особенности архитектуры чипов; V – напряжение питания; F – тактовая частота.

Кстати, уменьшение тактовой частоты позволяет снизить напряжение питания, а уменьшение обоих этих параметров согласно приведенной формуле способствует снижению теплообразования. А это в свою очередь, снижает нагрузку на средства охлаждения, что позволяет уменьшить скорость вращения вентиляторов, снизить шум, экономить электроэнергию (существенно в ноутбуках и серверах).    

Справедливости ради следует отметить, что далеко не все специалисты разделяют энтузиазм приверженцев форсированных режимов, хотя число любителей разгона довольно высоко.

Возможность разгона процессора основана на том, что большинство процессоров имеют достаточно большой технологический запас, обеспечивающий гарантированный уровень производительности всей выпущенной серии.

Соответствующие технологические резервы производительности часто имеют и элементы видеоадаптеров (видеочипы и микросхемы видеопамяти), оперативной памяти и жестких дисков. Этот запас может быть реализован в процессе индивидуального подбора оптимальных режимов эксплуатации разгоняемых элементов.

Несмотря на неприятие многими специалистами и компьютерными фирмами такого явления, как разгон, возможности управления производительностью продолжает завоевывать популярность, увеличивая число своих сторонников. Фирмы-производители материнских плат, осуществляя свою деятельность в жесткой конкурентной борьбе, не смогли проигнорировать мнение потенциальных покупателей. Именно поэтому соответствующие функции поддерживаются большинством их изделий.

Выбирая оптимальную материнскую плату по критерию наличия функций разгона, необходимо оценивать ряд особенностей, обеспечивающих реализацию данных специфических режимов.

Прежде всего, это касается диапазона рабочих частот шин процессора (FSB) и памяти, а также шага их изменения. Дело в том, что, как правило, современные процессоры имеют фиксированный частотный коэффициент, определяющий внутреннюю частоту работы ядра (ядер) процессора через частоту шины FSB. Поэтому разгон обычно осуществляется увеличением частоты шины процессора FSB. При этом необходимо учитывать, что увеличение частоты шины процессора нередко сопровождается соответствующим изменением частотных режимов работы остальных комплектующих.

А еще разгону подвергаются модули оперативной памяти и видеоадаптеры. Действительно, некоторые экземпляры допускают значительное увеличение тактовых частот, например на 20–50 %.

Что же касается разгона процессора, то, как отмечалось выше, это достигается обычно увеличением частоты шины процессора FSB. Однако ее рост в ряде случаев сопровождается изменением режима работы жесткого диска. Для обеспечения надежной работы и сохранения информации для него не следует значительно (более 10%) увеличивать тактовую частоту шины подключения.

Кстати, современные качественные материнские платы, выпущенные производителями верхнего уровня, позволяют оперировать шинами процессора, видеоадаптера и жестких дисков независимо друг от друга. Это повышает гибкость настройки и позволяет оптимизировать работу каждой из подсистем. Осуществляется это индивидуальным подбором соответствующих параметров при использовании всех доступных средств.

Говоря о частотных настройках, необходимо отметить, что важными характеристиками, определяющим разгонный потенциал материнской платы, является плавное изменение напряжения ядра процессора, а также питания модулей DRAM и видеошин типа PCI Express или AGP. При этом считается допустимым увеличение уровня напряжения ядра процессора на 5–10 % (в качественных изделиях) при обеспечении контроля над температурными режимами эксплуатации элементов.

Необходимо отметить, что для экстремальных режимов, при которых достигается максимальный прирост производительности, требуется значительно большее увеличение питающих напряжений, нередко достигающее 20 %. Тем не менее, для обеспечения максимальных уровней надежности и безопасной эксплуатаций целесообразно воздерживаться от режимов с повышенными уровнями энергопитания.

Изменение частоты и напряжений может осуществляться как с помощью соответствующих переключателей и перемычек в материнских платах предыдущих поколений, так и программно — в BIOS Setup. Конечно, разгон, осуществляемый программными средствами, намного удобнее, так как упрощает процедуру выбора режимов, обеспечивающих максимальную производительность компьютера. При этом, используя возможности технологий типа SoftMenu в BIOS Setup, не требуется даже открывать системный блок компьютера. Все операции по разгону и контролю за установленными параметрами осуществляются в соответствующих пунктах меню BIOS Setup.

Аппаратную поддержку данных возможностей осуществляют специальные цепи, задающие частотные режимы основных подсистем. Одна из схем формирования тактовых частот для основных подсистем компьютера приведена на Рис. 1.

Рис. 1. Вариант схемы формирования тактовых частот для основных подсистем компьютера

Для целей гибкого управления производительностью конструкторы создают разные варианты, позволяющие изменение возможностей изменения коэффициентов, задающих соотношение частот шин процессора, памяти и, возможно, видеоадаптера.

Изменение частотных режимов осуществляется с помощью встроенных в архитектуру материнских плат специальных средств. К их числу относятся чипы PLL (phase-locked loop), реализующие в своем составе управляемых током или напряжением генераторов (VCO — Voltage Controlled Oscillator), осуществляющих постоянное отслеживание фазы входного сигнала. Такие генераторы используются для управления частотой. На материнской плате чипы PLL используется для формирования нескольких частот.

Один из примеров реализации PLL, используемый, кстати, в материнских платах такого известного производителя как Gigabyte, приведен на Рис. 2.

Рис. 2. Вариант реализации схемы чипа PLL

Электронные цепи с аппаратно-программным изменением частот, подаваемых на основные подсистемы компьютера, обеспечивают широкие возможности для управления производительностью и энергопотреблением.

Изменяемые по частоте тактовые сигналы подаются на компоненту чипсета, выполняющую функции North Bridge, через которую осуществляется управление скоростными параметрами процессора, модулей оперативной памяти, видеоадаптера.

Наиболее совершенные комплексные варианты аппаратно-программного управления позволяют еще и сравнительно плавное изменение уровней питающих напряжений и временных параметров, определяющие работу модулей подсистемы оперативной памяти.

В качестве примера можно привести ряд технологий, используемых в материнских платах компании Gigabyte, являющейся одним из лидеров данного сектора рынка.

Говоря о средствах управления нельзя не отметить такое нововведение как динамический разгон, обеспечивающий автоматическое изменение тактовых частот в зависимости от изменения вычислительной нагрузки. Такие средства обеспечивают рост тактовых частот при увеличении нагрузки и уменьшение — при ее снижении, что улучшает тепловые режимы эксплуатации комплектующих. В качестве примера можно привести технологию C.I.A. 2.

Технология C.I.A. 2 (CPU Intelligent Accelerator) осуществляет динамическое изменение частоты процессора (точнее, FSB) и напряжения питания в зависимости от текущей загрузки. Возможен выбор одного из режимов разгона: Disable, Cruise, Sports, Racing, Turbo, Full Thrust. Каждый из режимов определяет диапазон прироста тактовой частоты.

Еще одним инструментом повышения производительности компьютера являются фирменные средства улучшения работы подсистемы памяти. В качестве примера может рассматриваться M.I.B. 2 (Memory Intelligent Booster 2), созданная Gigabyte и позволяющая оптимизировать работу с оперативной памятью за счет учета характеристик известных чипов/модулей. Как показывают результаты тестирования, помимо увеличения тактовых частот технология Memory Intelligent Booster 2, действительно, задействует механизмы, способствующие увеличению пропускной способности шины памяти.

Остается добавить, что указанные технологии дополняет набор фирменных утилит от того же производителя материнских плат. В их состав входит программа EasyTune 5 (и/или новейшая EasyTune Center) для мониторинга системных параметров и осуществления разгона (Рис. 3). Для пользователей доступно изменение частоты и множителя процессора, множителя для памяти, частоты шины PCI Express и напряжения питания процессора, памяти и южного моста чипсета, но в меньших пределах, нежели доступно из BIOS. А еще следует отметить настройку режимов в SmartFan: можно выбрать диапазон частоты вращения от 0 до 100% и соответствующую граничным значениям температуру.

Рис. 3. Выбор параметров C.I.A. 2 и пример работы EasyTune 5

Конечно, во многих моделях Gigabyte имеются еще и соответствующие средства повышения тактовых частот видеоподсистем. Например, в BIOS Setup ряда моделей имеются параметры, определяющие эффективность технологии Robust Graphics Booster. Суть этой технологии сводится к тому, что посредством выбора одного из трех режимов — Auto, Fast, Turbo — пользователь имеет возможность увеличить частоту работы графического ядра и графической памяти видеокарты.

И конечно, в  BIOS Setup предусмотрены многочисленные параметры грубой и/или тонкой настройки эффективной работы основных подсистем. К ним относятся изменение частотных режимов, напряжений питания, таймингов модулей памяти, управление вентиляторами и т. п.

Рассматривая фирменные аппаратно-программные средства, нельзя не вспомнить и о некоторых особенностях архитектуры материнских плат. Они позволяют расширить диапазоны управления и увеличить функциональные возможности. Действительно, специализированные чипы вместе с чипсетом обеспечивают поддержку фирменных технологий. А в ряде случаев за счет тщательной проработки архитектуры и дизайна платы удается ослабить ограничения, накладываемые чипсетами, являющимися, по сути, основой материнских плат.

В качестве примера можно привести Intel P965, рассчитанный на процессорную шину 533/800/1066 МГц. Однако на этом чипсете компания Gigabyte выпустила модели материнских плат не только корректно работающих с процессорами, шина которых имеет частоту 1333 МГц, но и поддерживающих для них еще и функции разгона. В дополнение к этому с чипсетом Intel P965 удалось даже расширить возможности видеоподсистемы.

Поддержка видеоподсистемы осуществлена наличием двух разъемов конструктива PCI Express х16 и соответствующими интерфейсами (Рис. 4). Переключение линий осуществляется при помощи двух специальных чипов (PCI Express Switch), интегрированных в состав архитектуры материнской платы.

Рис.4. Реализация конфигурации с двумя видеокартами в системах, созданных на чипсете IntelP965

В конфигурации с двумя видеокартами обеспечена поддержка технологии ATI CrossFire — аналога технологии SLI. Это позволяет существенно расширить возможности видеоподсистемы.

Первый слот поддерживает скоростной режим х16. Второй — не выше х4. Этот слот является разделяемым. Он делит общие линии со слотами PCI Express x1. В результате его использование исключает возможность работы устройств PCI Express x1., что часто не является критичным, большое количество контроллеров уже интегрировано в состав материнской платы. Меняя же число видеокарт и параметры их настройки, можно изменять производительность видеоподсистемы в широком диапазоне значений.

Оценивая приведенные решения, необходимо отметить, что данный обзор не претендует на полноту. Спектр фирменных технологий, ориентированных на оптимизацию компьютерных возможностей, конечно, существенно шире.

В заключение следует в очередной раз напомнить, что выбор оптимальной материнской платы является очень важным этапом. Именно на этом этапе нередко закладываются возможности будущего компьютера. И в их расширении могут существенно помочь фирменные аппаратные и программные средства.

При подготовке статьи были использованы материалы книги
«Материнские платы и чипсеты. 4-е изд. Анатомия ПК». — СПб.: Питер, 2007. — 368с.