Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 14 
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Advanced member
Статус: Не в сети
Регистрация: 10.04.2003
Откуда: Москва
Barton реально еще нет и его в расчет пока не стоит брать, а для T-bred и P4 ...
Емкость L2 для K7 = 256K, Р4 = 512К. Первое впечатление, что Р4 в 2 раза 'круче' ... а вот и нет.
Емкость cache 2 level измеряется в 'строках'(блоках), и для процессоров составляет:
К7 = 64byts
P4 = 128byts (эти ублюдки кокетничают и говорят, что 64 .... но спариваются
по две. Sorry, но не терплю подлость в любом виде!)
{Если кому интересно, существует очень простой способ узнать емкость
строки L2}
Сие влечет емкость в блоках:
К7 = 256К/64 = 4К блоков
Р4 = 512К/128 = 4К блоков.
Т.о., емкость L2 у обоих процессоров одинакова.
Если учесть особенность системы кеширования K7, где cache 1 и 2 level складываются, получается даже больше, чем у P4.

Теперь о емкости =блока= (строки cache)
Дело в том, что операции обмена с памятью ведутся блоками этой самой длины.
Вот тут и вылезают грязные ноги RIMM с сверхдлинным блоком в 128 байт.

Зачем нужен L2? При потоковой записи/чтения L2 вообще не нужен, только вредит, его главная функция - хранить доступ к разным адресам.
Для последнего случая об'ем строки L2 не важен, как правило pointer вряд-ли больше dword, важно их количество .... а в К7 и в Р4 это будет одно и то-же число в 4096.

p.s.
Надо отдать должное Intel - его cache 2 level ближе к процессору, чем у К7.


Последний раз редактировалось serj 27.05.2003 16:41, всего редактировалось 1 раз.


Партнер
 

Member
Статус: Не в сети
Регистрация: 29.04.2003
Откуда: MSK-Kaliningrad
serj_
как это бартона реально еще нет, бартон реально есть, лично удостаивался поюзать


 

Advanced member
Статус: Не в сети
Регистрация: 10.04.2003
Откуда: Москва
mks81 писал(а):
serj_
как это бартона реально еще нет, бартон реально есть, лично удостаивался поюзать


first: Ты цену видел? ... а цена T-bred 1700+? :(
second: ну так .... тем более! :)


 

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават
serj_
Цитата:
Barton реально еще нет и его в расчет пока не стоит брать, а для T-bred и P4 ...
Емкость L2 для K7 = 256K, Р4 = 512К. Первое впечатление, что Р4 в 2 раза 'круче' ... а вот и нет.


Однако для Northwood 512KB открыли второе дыхание, а для Barton - фиг целых пять десятых процента эффекта.

Цитата:
P4 = 128byts (эти ублюдки кокетничают и говорят, что 64 .... но стариваются
по две.


Они назвали это sectored. Хотя я до сих пор не понял, как это работает.

Цитата:
Если кому интересно, существует очень простой способ узнать емкость
строки L2


Мне интересно. Можно в почту.

Цитата:
Зачем нужен L2? При потоковой записи/чтения L2 вообще не нужен, только вредит, его главная функция - хранить доступ к разным адресам.


Вообще потоковое чтение/запись это нетипичное применение процессора. Обычно процессор чего-то считает. И у P4 L2 не вредит, в отличие от Athlon!

Цитата:
Надо отдать должное Intel - его cache 2 level ближе к процессору, чем у К7.


Ага, данные за семь тактов отдаёт, тогда как у Athlon от 11 и вплоть до 36.
Так что это ещё как посмотреть, кто проигрывает...


 

Junior
Статус: Не в сети
Регистрация: 26.02.2003
Откуда: Москва
imxo ne tak :)
y pnya 4 kawdiy lain moshet bit podelen na 2 ravnix bloka po 8byte a nomer ego vibiraetsya odnim bitom v adrese
(et ya predpolagau) => y nego obem bol'we

_________________
Не E2k, так E3m всех победит


 

Advanced member
Статус: Не в сети
Регистрация: 10.04.2003
Откуда: Москва
GReY писал(а):
Цитата:
Цитата:
P4 = 128byts (эти ублюдки кокетничают и говорят, что 64 .... но стариваются
по две.


Они назвали это sectored. Хотя я до сих пор не понял, как это работает.


... [вырезано цензурой] эту [вырезано цензурой] фирму!
Ну, не люблю я ее теперь. Мда ... прочтение sheets по DEC добром не кончилось.
:)

Цитата:
Цитата:
Если кому интересно, существует очень простой способ узнать емкость
строки L2

Мне интересно. Можно в почту.


Все просто, что почту гонять?
Думаю, ты догадываешься как измерять скорость L2? :)
... а теперь попробуй читать блоками по NN байт, но только
1(один) байт-word-dword(не важно).
При изменении NN больше или = строке L2 скорость будет рости,
а при NN<L2string - привет, константа.
.... сказывается блоковый режим.
[или я ошибся? :) ]

Ты знаешь ... оригинал фразы звучал так:
"Если кому интересно, а именно GReY, существует очень простой...."


Цитата:
Зачем нужен L2? При потоковой записи/чтения L2 вообще не нужен, только вредит, его главная функция - хранить доступ к разным адресам.


Цитата:
Вообще потоковое чтение/запись это нетипичное применение процессора.


Потокое чтение или запись или перезапись - так этт 90%.
Мелкие расчеты не в счет.
:)

Цитата:
Обычно процессор чего-то считает. И у P4 L2 не вредит, в отличие от Athlon!


ой, не надо. Когда я пытался (честно?) измерить cache latency такого насмотрелся - чур меня! .... DEC'овский процессор очень мощный,
готов с'есть шляпу! .... просто не ждал такого.
Там многие вещи делаются параллельно.... впрочем, если интересно - пиши,
кроме тебя сие нюансы никого 'не трясут' ... так что тут флудить?


 

Member
Статус: Не в сети
Регистрация: 31.01.2003
Откуда: Донецк
serj_
Цитата:
Зачем нужен L2? При потоковой записи/чтения L2 вообще не нужен, только вредит, его главная функция - хранить доступ к разным адресам.

А я вот всю жизнь считал, что кэш должен хранить именно последовательный блок адресов, а в алгоритмах с большим кол-вом переходов он неэффективен.

_________________
Я не гоню...я разгоняю!


 

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават
serj_
Цитата:
прочтение sheets по DEC добром не кончилось


Дай почитать ;)

Цитата:
При изменении NN больше или = строке L2 скорость будет рости,
а при NN<L2string - привет, константа.


Вообще-то если читать словами с неким шагом, то мы всегда будем упираться в латентность... Или я чего не понял? Если у тебя получилось померять, дай код!

Цитата:
оригинал фразы звучал так:
"Если кому интересно, а именно GReY, существует очень простой...."


:)

Цитата:
Когда я пытался (честно?) измерить cache latency такого насмотрелся - чур меня!


У P4 спекулятивное получение данных. Т.е. он пытается считать ещё не довычисляв точного адреса, авось попаду...

Кстати, тебе удалось получить 11 тактов на Атлоне?

Цитата:
DEC'овский процессор очень мощный,
готов с'есть шляпу! .... просто не ждал такого.


А какая связь между DEC и P4?


 

Advanced member
Статус: Не в сети
Регистрация: 10.04.2003
Откуда: Москва
GReY писал(а):
serj_
Цитата:
прочтение sheets по DEC добром не кончилось


Дай почитать ;)


мда ... пол гига pdf? ....
DEC'овские описания лежат в свободном доступе, в чем проблема сгрузить нужное? :?

Цитата:
Цитата:
При изменении NN больше или = строке L2 скорость будет рости,
а при NN<L2string - привет, константа.


Вообще-то если читать словами с неким шагом, то мы всегда будем упираться в латентность... Или я чего не понял? Если у тебя получилось померять, дай код!

С L2 обмен исключительно блочный, не важно сколько ты считываешь, транзакция на блок. {Я могу заблуждаться}

Код? ... слушай, ты меня расстроил .... от тебя я этого не ждал! :(
src на BM32/64 лежит в свободном доступе.
И потом .... неужто трудно написать затычку для измерения L2-bench? ... даже без gui?? Мне кажется, тебе будет проще самому, чем в моем src разбираться.

Цитата:
Кстати, тебе удалось получить 11 тактов на Атлоне?


и 11 и 13 и 17 и 0, сколько угодно.
У К7 очень мощный блок формирования запросов к памяти, его просто невозможно обойти. Очень сильный процессор!

Цитата:
Цитата:
DEC'овский процессор очень мощный,
готов с'есть шляпу! .... просто не ждал такого.


А какая связь между DEC и P4?


Ну так ... а кто делал К7? .... неужто ты продолжаешь думать, что AMD???
:roll:

p.s.
Слушай, никому это 'не нать', давай сворачивать тему.
2 mail


 

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават
serj_
Цитата:
DEC'овские описания лежат в свободном доступе, в чем проблема сгрузить нужное?


Плиз дай линк!

Цитата:
ты меня расстроил .... от тебя я этого не ждал!


Ну лень мне ;) Просто приведи кусочек кода, который, по-твоему должен показать переход через границу строки L2

Цитата:
и 11 и 13 и 17 и 0, сколько угодно.


11 и 13 и 20 могу объяснить. Остальное - нет ;)

Цитата:
сворачивать тему.
2 mail


Давай. Похоже народ тут действительно не желает участвовать.


 

Member
Статус: Не в сети
Регистрация: 13.05.2003
Откуда: горловка
да кстати.у интела кеш последовательный,а у амд паралельный.
это даёт немалые преимущества в прозводительности амд.

_________________
Я вообще не теоретик,мне бы потрогать,я бы сказал. :-) пошлые вещи не предлагать.


 

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават
alex10
Вы о чем?


 

Member
Статус: Не в сети
Регистрация: 13.05.2003
Откуда: горловка
о том что написано в теме статьи насчё пентиум их большим кэшем

_________________
Я вообще не теоретик,мне бы потрогать,я бы сказал. :-) пошлые вещи не предлагать.


 

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават
alex10
Боюсь вы что-то напутали. Или не так выразились.


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 14 
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: Aomine, CHiCHo и гости: 19


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan