Advanced member
Статус: Не в сети Регистрация: 10.04.2003 Откуда: Москва
Barton реально еще нет и его в расчет пока не стоит брать, а для T-bred и P4 ...
Емкость L2 для K7 = 256K, Р4 = 512К. Первое впечатление, что Р4 в 2 раза 'круче' ... а вот и нет.
Емкость cache 2 level измеряется в 'строках'(блоках), и для процессоров составляет:
К7 = 64byts
P4 = 128byts (эти ублюдки кокетничают и говорят, что 64 .... но спариваются
по две. Sorry, но не терплю подлость в любом виде!)
{Если кому интересно, существует очень простой способ узнать емкость
строки L2}
Сие влечет емкость в блоках:
К7 = 256К/64 = 4К блоков
Р4 = 512К/128 = 4К блоков.
Т.о., емкость L2 у обоих процессоров одинакова.
Если учесть особенность системы кеширования K7, где cache 1 и 2 level складываются, получается даже больше, чем у P4.
Теперь о емкости =блока= (строки cache)
Дело в том, что операции обмена с памятью ведутся блоками этой самой длины.
Вот тут и вылезают грязные ноги RIMM с сверхдлинным блоком в 128 байт.
Зачем нужен L2? При потоковой записи/чтения L2 вообще не нужен, только вредит, его главная функция - хранить доступ к разным адресам.
Для последнего случая об'ем строки L2 не важен, как правило pointer вряд-ли больше dword, важно их количество .... а в К7 и в Р4 это будет одно и то-же число в 4096.
p.s.
Надо отдать должное Intel - его cache 2 level ближе к процессору, чем у К7.
Последний раз редактировалось serj 27.05.2003 16:41, всего редактировалось 1 раз.
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
serj_
Цитата:
Barton реально еще нет и его в расчет пока не стоит брать, а для T-bred и P4 ... Емкость L2 для K7 = 256K, Р4 = 512К. Первое впечатление, что Р4 в 2 раза 'круче' ... а вот и нет.
Однако для Northwood 512KB открыли второе дыхание, а для Barton - фиг целых пять десятых процента эффекта.
Цитата:
P4 = 128byts (эти ублюдки кокетничают и говорят, что 64 .... но стариваются по две.
Они назвали это sectored. Хотя я до сих пор не понял, как это работает.
Цитата:
Если кому интересно, существует очень простой способ узнать емкость строки L2
Мне интересно. Можно в почту.
Цитата:
Зачем нужен L2? При потоковой записи/чтения L2 вообще не нужен, только вредит, его главная функция - хранить доступ к разным адресам.
Вообще потоковое чтение/запись это нетипичное применение процессора. Обычно процессор чего-то считает. И у P4 L2 не вредит, в отличие от Athlon!
Цитата:
Надо отдать должное Intel - его cache 2 level ближе к процессору, чем у К7.
Ага, данные за семь тактов отдаёт, тогда как у Athlon от 11 и вплоть до 36.
Так что это ещё как посмотреть, кто проигрывает...
Junior
Статус: Не в сети Регистрация: 26.02.2003 Откуда: Москва
imxo ne tak y pnya 4 kawdiy lain moshet bit podelen na 2 ravnix bloka po 8byte a nomer ego vibiraetsya odnim bitom v adrese
(et ya predpolagau) => y nego obem bol'we
Advanced member
Статус: Не в сети Регистрация: 10.04.2003 Откуда: Москва
GReY писал(а):
Цитата:
Цитата:
P4 = 128byts (эти ублюдки кокетничают и говорят, что 64 .... но стариваются по две.
Они назвали это sectored. Хотя я до сих пор не понял, как это работает.
... [вырезано цензурой] эту [вырезано цензурой] фирму! Ну, не люблю я ее теперь. Мда ... прочтение sheets по DEC добром не кончилось.
Цитата:
Цитата:
Если кому интересно, существует очень простой способ узнать емкость строки L2
Мне интересно. Можно в почту.
Все просто, что почту гонять? Думаю, ты догадываешься как измерять скорость L2? ... а теперь попробуй читать блоками по NN байт, но только 1(один) байт-word-dword(не важно). При изменении NN больше или = строке L2 скорость будет рости, а при NN<L2string - привет, константа. .... сказывается блоковый режим. [или я ошибся? ]
Ты знаешь ... оригинал фразы звучал так: "Если кому интересно, а именно GReY, существует очень простой...."
Цитата:
Зачем нужен L2? При потоковой записи/чтения L2 вообще не нужен, только вредит, его главная функция - хранить доступ к разным адресам.
Цитата:
Вообще потоковое чтение/запись это нетипичное применение процессора.
Потокое чтение или запись или перезапись - так этт 90%. Мелкие расчеты не в счет.
Цитата:
Обычно процессор чего-то считает. И у P4 L2 не вредит, в отличие от Athlon!
ой, не надо. Когда я пытался (честно?) измерить cache latency такого насмотрелся - чур меня! .... DEC'овский процессор очень мощный,
готов с'есть шляпу! .... просто не ждал такого.
Там многие вещи делаются параллельно.... впрочем, если интересно - пиши,
кроме тебя сие нюансы никого 'не трясут' ... так что тут флудить?
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
serj_
Цитата:
прочтение sheets по DEC добром не кончилось
Дай почитать
Цитата:
При изменении NN больше или = строке L2 скорость будет рости, а при NN<L2string - привет, константа.
Вообще-то если читать словами с неким шагом, то мы всегда будем упираться в латентность... Или я чего не понял? Если у тебя получилось померять, дай код!
Цитата:
оригинал фразы звучал так: "Если кому интересно, а именно GReY, существует очень простой...."
Цитата:
Когда я пытался (честно?) измерить cache latency такого насмотрелся - чур меня!
У P4 спекулятивное получение данных. Т.е. он пытается считать ещё не довычисляв точного адреса, авось попаду...
Кстати, тебе удалось получить 11 тактов на Атлоне?
Цитата:
DEC'овский процессор очень мощный, готов с'есть шляпу! .... просто не ждал такого.
Advanced member
Статус: Не в сети Регистрация: 10.04.2003 Откуда: Москва
GReY писал(а):
serj_
Цитата:
прочтение sheets по DEC добром не кончилось
Дай почитать
мда ... пол гига pdf? .... DEC'овские описания лежат в свободном доступе, в чем проблема сгрузить нужное? :?
Цитата:
Цитата:
При изменении NN больше или = строке L2 скорость будет рости, а при NN<L2string - привет, константа.
Вообще-то если читать словами с неким шагом, то мы всегда будем упираться в латентность... Или я чего не понял? Если у тебя получилось померять, дай код!
С L2 обмен исключительно блочный, не важно сколько ты считываешь, транзакция на блок. {Я могу заблуждаться}
Код? ... слушай, ты меня расстроил .... от тебя я этого не ждал! src на BM32/64 лежит в свободном доступе. И потом .... неужто трудно написать затычку для измерения L2-bench? ... даже без gui?? Мне кажется, тебе будет проще самому, чем в моем src разбираться.
Цитата:
Кстати, тебе удалось получить 11 тактов на Атлоне?
и 11 и 13 и 17 и 0, сколько угодно. У К7 очень мощный блок формирования запросов к памяти, его просто невозможно обойти. Очень сильный процессор!
Цитата:
Цитата:
DEC'овский процессор очень мощный, готов с'есть шляпу! .... просто не ждал такого.
А какая связь между DEC и P4?
Ну так ... а кто делал К7? .... неужто ты продолжаешь думать, что AMD???
p.s.
Слушай, никому это 'не нать', давай сворачивать тему.
2 mail
Сейчас этот форум просматривают: Aomine, CHiCHo и гости: 19
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения