ПредишенСледващото

Колко важно L3 кеш за AMD?

Наистина, има смисъл да се оборудва многоядрени процесори, посветена паметта, която се използва съвместно от всички налични ядра. В тази си роля, бърз кеш трето ниво (L3) може значително да ускори достъпа до данните, които се изискват най-често. След това ядрата, ако има такава възможност, не трябва да имат достъп до бавно основната памет (RAM, RAM).

Поне на теория. Наскоро AMD обяви X4 процесор Athlon II, която е модел Phenom II X4 без L3 кеш, визирайки факта, че това не е така и нужда. Решихме да се сравни директно два процесора (с и без L3 кеш), за да се провери на кеша се отразява на ефективността.

Как кеша?

Преди да се потопите в тестовете, е важно да се разбере някои основи. Принципът на работа е съвсем проста кеш. Cache буферира данните възможно най-близо до ядрата на компютърни процесори за намаляване на исканията на процесора в по-дълъг и по-бавна памет. Модерен десктоп платформа йерархия на кеша включва най-много три нива, които предшестват достъп до RAM. И второ кеш и по-специално, висше служат не само за буфериране на данни. Тяхната цел е да се избегне претоварването на автобуса на процесора, когато ядрата трябва да обменят информация.

Посещения и пропуска

Ефективността на кеш архитектура се измерва с процента на хитове. Заявка за информация, която може да се задоволи с кеша се считат хитове. Ако на кеш паметта не съдържа необходимата информация, заявката се предава паметта на тръбопровод и реализира за мис. Разбира се, фишове за да доведат до повече време е необходимо, за да получат. В резултат на това обучение конвейер се появи "балони" (празен ход) и забавяне. Хит, а напротив, позволява да се поддържа максимална ефективност.

Напиши Cache, изключителност, съгласуваност

политики за замяна диктуват как кеша се освобождава място за нови записи. Тъй като данните се записват в кеш паметта, рано или късно трябва да се яви в основната памет, системата може да го направи едновременно с влизането в кеша (запис чрез), или да маркирате тези области като "мръсни" (запис-назад), и записва в паметта когато тя ще бъде изместена от кеша.

Тези различни нива на кеш паметта може да се съхраняват изключително, т.е. без съкращения. Тогава няма да намерите същите линии за данни в две различни йерархии на кеш. Или кеш могат да работят inclusively, тоест, по-ниските нива на кеш паметта е гарантирано, че съдържат данни, които са налични в по-горните нива на кеш (по-близо до ядрото на процесора). В AMD Phenom използва ексклузивно L3 кеш, докато Intel следва включително стратегията кеш. съгласуваност протоколи следват целостта и приложимостта на данни между различни ядра нива на кеш и дори процесори.

По-големият обем на кеш паметта може да побере повече данни, но в същото време е налице тенденция към увеличаване на закъснения. В допълнение, голям обем на кеш консумира значително количество процесорни транзистори, така че е важно да се намери баланс между "бюджет" на транзистори, размер кристал, консумацията на мощност и производителност / латентност.

Записване в паметта може да бъде прикрепен към кеша директно (пряко картирани), а именно, за копие на данните, има само един елемент в кеш паметта от основната памет, или те могат да бъдат свързани в п-ниво (п-начин асоциативен), което означава, че има н възможни места в кеша, което може да съдържа данните. По-висока степен на асоциативност (до напълно асоциативен кеш) осигурява най-добрата гъвкавост кеширане, защото съществуващите данни в кеш паметта не е необходимо да се пренапише. С други думи, високо п-асоциативност осигурява по-висок процент на попадения, но забавянето се увеличава, тъй като се нуждае от повече време, за да се покажат всички тези сдружения да се удари. Като правило, най-голяма степен на сдружаване е разумно за кеша последно ниво, тъй като максималният капацитет е достъпно там, и данни за търсене извън кеша ще доведат до лечение на бавен процесор RAM.

Ето някои примери: у Core i5 и i7 употреба 32KB L1 кеш с 8 посоки на определени асоциативни данни и 32 Kbyte L1 кеш 4-начин за документа. В Intel разбирам желанието, че указанията са били на разположение по-бързо и най-L1 кеш за данни е максималният процент на хитове. L2 кеш, Intel процесори имат 8-лентов асоциативен и L3 кеш, Intel по- "интелигентна", защото тя има 16-начин асоциативност постигане на максимални резултати.

Въпреки това, AMD следва различна стратегия за процесори Phenom II X4, който използва кеш L1 с 2-лентови настроен асоциативен да се намалят закъсненията. За да се компенсира възможна кеш пропуска капацитет се удвоява: 64 KB за данни и 64 KB за инструкции. Кешът на L2 е с 8 посоки на асоциативен, като дизайн на Intel, но L3 кеш, AMD работи с 48-начин асоциативност. Но решението на избора на конкретен кеш архитектура не може да се оцени, без да се има предвид цялата архитектура на процесора. Съвсем естествено, практическото значение са резултатите от теста, а нашата цел е само практически изпит на всичко това комплекс кеш структура на много нива.

Свързани статии

Подкрепете проекта - споделете линка, благодаря!