 |
содержит 1.2 миллиона транзисторов ) создающих раздельное
внутреннее кэширование программного кода и данных. Это улучша-
ет производительность посредством исключения конфликтов на ши-
не и делает двойное кэширование доступным чаще, чем это было
возможно ранее. Например, во время фазы предварительной подго-
товки, используется код команды, полученный из кэша команд. В
случае наличия одного блока кэш-памяти, возможен конфликт меж-
ду процессом предварительной подготовки команды и доступом к
данным. Выполнение раздельного кэширования для команд и данных
исключает такие конфликты, давая возможность обеим командам
выполняться одновременно. Кэш-память программного кода и дан-
ных Pentium процессора содержит по 8 KB информации каждая, и
каждая организована как набор двухканального ассоциативного
кэша - предназначенная для записи только предварительно
просмотренного специфицированного 32-байтного сегмента, причем
быстрее, чем внешний кэш. Все эти особенности расширения про-
изводительности потребовали использования 64-битовой внутрен-
ней шины данных, которая обеспечивает возможность двойного кэ-
ширования и суперскалярной конвеерной обработки одновременно с
загрузкой следующих данных. Кэш данных имеет два интерфейса,
по одному для каждого из конвееров, что позволяет ему обеспе-
чивать данными две одельные инструкции в течение одного машин-
ного цикла. После того, как данные достаются из кэша, они за-
писываются в главную память в режиме обратной записи. Такая
техника кэширования дает лучшую производительность, чем
простое кэширование с непосредственной записью, при котором
процессор записывает данные одновременно в кэш и основную па-
мять. Тем не менне, Pentium процессор способен динамически
конфигурироваться для поддержки кэширования с непосредственной
записью.
Таким образом, кэширование данных использует два различ-
ных великолепных решения: кэш с обратной записью и алгоритм,
названный MESI ( модификация, исключение, распределение, осво-
бождение) протокол. Кэш с обратной записью позволяет записы-
вать в кэш без обращения к основной памяти в отличие от
используемого до этого непосредственного простого кэширования.
Эти решения увеличивают производитльность посредством исполь-
зования преобразованной шины и предупредительного исключения
самого узкого места в системе. В свою очередь MESI-протокол
позволяет данным в кэш-памяти и внешней памяти совпадать - ве-
ликолепное решение в усовершенствованных мультипроцессорных
системах, где различные процессоры могут использовать для ра-
боты одни и те же данные.
Рекомендуемый объем общей кэш-памяти для настольных
систем, основанных на Pentium процессоре, равен 128-256 K, а
для серверов - 256 K и выше.
Блок предсказания правильного адреса перехода.
ЪДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДВДДДДДДДДДДДДДДДДДДДДДДї
і ЪДДДДДДДДї ЪДДДДДДДДї і і
і ЪДґ ГДДДДДДґ°°°°°°°°і і і
і і АДДДВДДДДЩ АДДДДВДДДЩ і і
і і і ЪДДДДДДДДДДДДДЩ і і
і і ЪДДДБДДБДї ЪДДДДДДДДї і і
і ЪДДДї і і ГДДДДДДґ і і і
і ґ ГДґ АДВДДДДВДЩ і і і Предсказание і
і АДДДЩ і ЪДБДїЪДБДї і і і правильного і
і і і іі і ЪДДґ і і адреса і
і і АДВДЩАДВДЩ і і і і перехода і
і і ЪДБДДДДБДї і ГДДДДДДДДґ і і
і і і і і і і і і
і і АДВДДДДВДЩ і ГДДДДДДДДґ і і
і і ГДДДДЕДДДДДЩ і і і і
і і ЪДБДДДДБДї ГДДДДДДДДґ і і
і АДґ і і і і і
і АДДДДДДДДЩ АДДДДДДДДЩ і і
АДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДБДДДДДДДДДДДДДДДДДДДДДДЩ
Блок предсказания правильного адреса перехода - это сле-
дующее великолепное решение для вычисленй, увеличивающее про-
изводительность посредством полного заполнения конвееров ко-
мандами, основанное на предварительном определении правильного
набора команд, которые должны быть выполнены. Pentium про-
цессор - это первый и единственный PC-совместимый процессор,
использующий блок предсказания, который до этого традиционно
был связан с вычислительными платформами больших ЭВМ.
Для лучшего понимания этой концепции, рассмотрим типичное
программное приложение. После выполнения каждого программного
цикла, программа выполняет соответствующую проверку для опре-
деления, необходимо ли возвратиться в начало цикла или выйти и
продолжить выполнение следующего шага. Эти два решения, или
пути, называют предсказанием адреса перехода. Блок предсказа-
ния правильного адреса перехода прогнозирует, какая ветвь
программы будет затребована, основываясь на допущении, что
предыдущая ветвь, которая была пройдена, будет использоваться
снова. Pentium процессор выполняет предсказание правильного
адреса перехода, используя специальный буфер предсказания пе-
рехода (BTB). В отличие от альтернативной архитектуры, это
программно-шаблонное нововведение дает возможность для пере-
компилирования программного кода, увеличивая при этом скорость
и производительность существующего прикладного программного
обеспечения. Если команда управляет ветвлением программы, бу-
фер BTB запоминает команду и адрес, на который необходимо пе-
рейти, и предсказывает, какая ветвь команд в следующий момент
будет использоваться. Когда буфер содержит правильное предска-
зание, переход выполняется без задержки.
Высокопроизводительный блок вычислений с плавающей запятой.
ЪДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДВДДДДДДДДДДДДДДДДДДДДДДї
і ЪДДДДДДДДї ЪДДДДДДДДї і і
і ЪДґ ГДДДДДДґ і і Блок конвеерных і
і і АДДДВДДДДЩ АДДДДВДДДЩ і вычислений с і
і і і ЪДДДДДДДДДДДДДЩ і плавающей запятой і
і і ЪДДДБДДБДї ЪДДДДДДДДї і і
і ЪДДДї і і ГДДДДДДґ°°°°°°°°і і і
і ґ ГДґ АДВДДДДВДЩ і°°°°°°°°і і і
і АДДДЩ і ЪДБДїЪДБДї і°°°°°°°°і і і
і і і іі і ЪДДґ°°°°°°°°і і і
і і АДВДЩАДВДЩ і і°°°°°°°°і і і
і і ЪДБДДДДБДї і ГДДДДДДДДґ і і
і і і і і і°°°°°°°°і і Умножитель і
і і АДВДДДДВДЩ і ГДДДДДДДДґ і і
і і ГДДДДЕДДДДДЩ і°°°°°°°°і і Сумматор і
і і ЪДБДДДДБДї ГДДДДДДДДґ і і
і АДґ і і°°°°°°°°і і Делитель і
і АДДДДДДДДЩ АДДДДДДДДЩ і і
АДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДБДДДДДДДДДДДДДДДДДДДДДДЩ
Наростающая волна 32-разрядных программных приложений
включает много интенсивно вычисляющих, графически ориентиро-
программ, которые занимают много процессорных ресурсов на вы-
полнение операций с плавающей запятой, обеспечивающих матема-
тические вычисления. Поскольку требования к персональным
компьютерам со стороны программного обеспечения по вычислениям
с плавающей запятой постоянно возрастают, удовлетворить эти
потребности могут усовершенствования в микропроцессорной тех-
нологии. Процессор Intel486 DX, например, был первым микропро-
цессором, интегрированным на одной подложке с математическим
сопроцессором. Предыдущие семейства процессоров фирмы INTEL,
при необходимости использования вычислений с плавающей запя-
той, использовали внешний математический сопроцессор.
Pentium процессор позволяет выполнять математические вы-
числения на более высоком уровне благодаря использованию усо-
вершенствованного встроенного блока вычислений с плавающей за-
пятой, который включает восьмитактовый конвеер и аппаратно ре-
ализованные основные математические функции. Четырехтактовые
конвеерные команды вычислений с плавающей запятой дополняют
четырехтактовую целочисленную конвееризацмю. Большая часть ко-
манд вычислений с плавающей запятой могут выполняться в одном
целочисленном конвеере, после чего подаются в конвеер вычисле-
ний с плавающей запятой. Обычные функции вычислений с плаваю-
щей запятой, такие как сложение, умножение и деление, реализо-
ваны аппаратно с целью ускорения вычислений.
В результате этих инноваций, Pentium процессор выполняет
команды вычислений с плавающей запятой в пять раз быстрее, чем
33-МГц Intel486 DX, оптимизируя их для высокоскоростных
численных вычислений, являющихся неотъемлемой частью таких
усовершенствованных видеоприложений, как CAD и 3D-графика.
Pentium процессор на тактовой частоте 66 МГц работает как
"числодробилка" с рейтингом 64.5 по тесту SPECint92, практи-
чески не уступая RISC-процессору Alpha компании Digital, но с
тактовой частотой вдвое более высокой.
Общая производительность Pentium процессора превосходит в
6 раз 25 МГц Intel486 SX и в 2.6 раз - 66 МГц Intel486 DX2.
Индекс по рейтингу iCOMP для 66 МГц Pentium процессора, кото-
рый выполняет 112 миллионов операций в секунду, составляет
567. Индекс по iCOMP ( Intel COmparative Microprocessor
Peformance ) выполняет относительное сравнение производитель-
ности 32-битовых процессоров фирмы INTEL.
Расширенная 64-битовая шина данных.
ЪДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДВДДДДДДДДДДДДДДДДДДДДДДї
і ЪДДДДДДДДї ЪДДДДДДДДї і і
і ЪДґ ГДДДДДДґ і і і
і і АДДДВДДДДЩ АДДДДВДДДЩ і і
і і і ЪДДДДДДДДДДДДДЩ і і
і і ЪДДДБДДБДї ЪДДДДДДДДї і і
і ЪДДДї і і ГДДДДДДґ і і і
і ґ°°°ГДґ АДВДДДДВДЩ і і і і
і АДДДЩ і ЪДБДїЪДБДї і і і і
і і і іі і ЪДДґ і і і
і і АДВДЩАДВДЩ і і і і і
і і ЪДБДДДДБДї і ГДДДДДДДДґ і і
і і і і і і і і і
і і АДВДДДДВДЩ і ГДДДДДДДДґ і і
і і ГДДДДЕДДДДДЩ і і і і
і і ЪДБДДДДБДї ГДДДДДДДДґ і і
і АДґ і і і і і
і АДДДДДДДДЩ АДДДДДДДДЩ і і
АДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДДБДДДДДДДДДДДДДДДДДДДДДДЩ
Pentium процессор снаружи представляет собой 32-битовое
устройство. Внешняя шина данных к памяти является 64-битовой,
удваивая количество данных, передаваемых в течение одного шин-
ного цикла. Pentium процессор поддерживает несколько типов
шинных циклов, включая пакетный режим, в течение которого про-
исходит порция данных из 256 бит в кэш данных и в течение од-
ного шинного цикла.
Шина данных является главной магистралью, которая переда-
ет информацию между процессором и подсистемой памяти. Благода-
ря этой 64-битовой шине данных, Pentium процессор существенно
повышает скорость передачи по сравнению с процессором Intel486
DX - 528 MB/сек для 66 МГц, по сравнению со 160 MB/сек для 50
МГц процессора Intel486 DX. Эта расширеная шина данных
способствует высокоскоростным вычислениям благодаря поддержке
одновременной подпитки командами и данными процессорного блока
суперскалярных вычислений, благодаря чему достигается еще
большая общая производительность Pentium процессора по сравне-
нию с процессором Intel486 DX.
В общем, имея более широкую шину данных, Pentium про-
|