CPU Multi-Dimensional Branch Prediction Memory Test

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 08.12.2025 20:37

Сообщения без ответов | Активные темы

Список форумов » Специализированные форумы » Бенчмаркинг

Часовой пояс: UTC + 3 часа

Новая тема /

Ответить

Сообщений: 238 • Страница 3 из 12 • < 1 2 3 4 5 6 ... 12 >

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Lev Dymchenko

Добавлено: 22.02.2006 20:44

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Ну например, v1 - показатель производительности чисто FPU(SSE) v2-производительность при работе с ветвлениями, тогда суммарная производительность процессора, если принебречь остальным, будет a=a1*v1+a2*v2. Если есть программа b, которая на b1 носит счетный характер, на b2 - производительность ограничена потерями от ветвлений, то производительность программы будет (a,b)=a1*b1+a2*b2. Это идея, иметь показатели производительности в выраженных случаях, чтобы можно было прикинуть.
Добавлено спустя 4 минуты, 18 секунд

Цитата:

Примерно то чем оно тут пытается заниматься можно увидеть в более практическом виде в sciencemark2 - ознакомьтесь.

Ха, у того теста совсем другая идеология, там просто собрали кучу задач и реализовали, и он в ней порочен, к тому же. Если вы такой знаток ScienceMark, скажите, его создатели учли советы по оптимизации, которые были даны интеловскими специалистами?
Добавлено спустя 2 минуты, 53 секунды
Идея теста - дать оценку производительности процессора в тех частях программы, скорость которых зависит от операций со случайнми ветвлениями.
Добавлено спустя 4 минуты, 25 секунд

Цитата:

Что значит ожидаемыми? Я не говорило такого нигде. Что значит желаемы?

Ну вот, увидить неожиданные результаты и сказать о неправдоподобности теста.
Добавлено спустя 3 минуты, 9 секунд

Может, у кого-нибудь есть PentiumM? Интересно сравнить.

Реклама
Партнер

T2VOVIK

Добавлено: 22.02.2006 21:07

[профиль]

Member
Статус: Не в сети
Регистрация: 14.10.2005
Откуда: РОССИЯ

A64 x2 3800+@2686MHz
PC4000@268MHz 3-4-3-8 1T
CPU Multi-Dimensional Branch Prediction Memory Test Ver 1.0

Код:

Date : 22.02.2006 20:48:28
CPU clock : 2676MHz
Test system : This system
Reference system : Pentium4 2400C DDR400 sc

Results, test time

     n       Quick Sort  Merge Sort  Heap Sort
      1000         71         95         78
      5000        418        583        472
     10000        888       1260       1010
     50000       5060       7390       6310
    100000      10600      15600      13900
    500000      60100      90800     106000
   1000000     126000     193000     279000
   5000000     696000    1070000    2000000
  10000000    1450000    2250000    4560000
  30000000    4600000    7240000   16200000

Relative results

     n       Quick Sort  Merge Sort  Heap Sort
      1000       1,89       1,75       1,92
      5000       1,87       1,63       1,99
     10000       1,87       1,60       1,97
     50000       1,86       1,55       1,87
    100000       1,87       1,57       1,83
    500000       1,83       1,61       1,95
   1000000       1,84       1,56       1,95
   5000000       1,82       1,58       2,13
  10000000       1,82       1,57       2,26
  30000000       1,81       1,56       2,39

Relative perofmance index

Harmonic mean : 1,80
Geometric mean : 1,81
Arithmetic mean : 1,82
Square mean : 1,84

*****************************************************

#77

Последний раз редактировалось T2VOVIK 22.02.2006 21:17, всего редактировалось 1 раз.

Lev Dymchenko

Добавлено: 22.02.2006 21:08

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

T2VOVIK

Спасибо.
Добавлено спустя 3 минуты, 16 секунд

Кстати, подтест heapsort при больших n >500000, когда данные не помещаются в КЭШ, критичен к скорости памяти, так как доступ к данным носит не локальный характер. Поэтому процессоры с интегрированным контролеллорм памяти, просто быстрой памятью или большим КЭШ имеют в этом подтесте относительное преимущество.
Не могли бы вы использовать тег code?
Добавлено спустя 3 минуты, 56 секунд

А подтест mergesort при больших n, видимо, все меньше зависит от скорости случайных ветвлений, и относительная производительность по сравнению с Pentium4 снижается.
Добавлено спустя 6 минут, 12 секунд

Tasselhof писал(а):

Lev Dymchenko, тест должен хотя бы более или менее реально отображать производительность системы, а не показывать забавную ерунду

Моё замечание в основном не об однопоточности, а об ерунда в результатах, да и вообще смысле тестировать то, что тестирует он

А вы знаете, что есть сложные алгоритмы, причем, работающие с большим объемом данных, на котрых Pentium4 Prescott показывает производительность, как гипотетический равночастотный Аthlon64?
Добавлено спустя 1 минуту, 2 секунды
Не понимаю, почему тест должен показывать среднюю производительность по всем приложениям? Кстати, этот интеграл не сходится.

T2VOVIK

Добавлено: 22.02.2006 21:53

[профиль]

Member
Статус: Не в сети
Регистрация: 14.10.2005
Откуда: РОССИЯ

A64 x2 3800+@2755MHz
PC4000@275MHz 3-4-3-8 1T
CPU Multi-Dimensional Branch Prediction Memory Test Ver 1.0

Код:

Date : 22.02.2006 21:36:05
CPU clock : 2750MHz
Test system : This system
Reference system : Pentium4 2400C DDR400 sc

Results, test time

     n       Quick Sort  Merge Sort  Heap Sort
      1000         69         93         76
      5000        406        568        460
     10000        864       1230        991
     50000       4930       7190       6140
    100000      10300      15200      13500
    500000      58500      88300     103000
   1000000     122000     187000     273000
   5000000     677000    1040000    1950000
  10000000    1410000    2190000    4470000
  30000000    4470000    7050000   15800000

Relative results

     n       Quick Sort  Merge Sort  Heap Sort
      1000       1,94       1,78       1,97
      5000       1,92       1,67       2,04
     10000       1,92       1,65       2,03
     50000       1,92       1,60       1,92
    100000       1,92       1,61       1,88
    500000       1,88       1,65       2,00
   1000000       1,89       1,61       2,00
   5000000       1,87       1,62       2,18
  10000000       1,87       1,61       2,30
  30000000       1,86       1,60       2,45

Relative perofmance index

Harmonic mean : 1,85
Geometric mean : 1,86
Arithmetic mean : 1,87
Square mean : 1,88

*****************************************************

#77

White

Добавлено: 22.02.2006 22:01

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko
Учитесь читать чужие посты. Если несколько раз прочесть что я писал, то может дойдёт наконец...

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Lev Dymchenko

Добавлено: 22.02.2006 22:34

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

T2VOVIK

Наблюдается масшабируемость результатов, согласно небольшому приросту частоты.
Добавлено спустя 3 минуты, 29 секунд

white писал(а):

Lev Dymchenko
Учитесь читать чужие посты. Если несколько раз прочесть что я писал, то может дойдёт наконец...

Вы призывали не переходить на личности, а, я кстати, не переходил, я говорил "вы" не конкретно к вам, а в целом.
Добавлено спустя 1 минуту, 17 секунд
Считаейте, что я вам ответил, что следует.

T2VOVIK

Добавлено: 23.02.2006 10:18

[профиль]

Member
Статус: Не в сети
Регистрация: 14.10.2005
Откуда: РОССИЯ

A64 x2 3800+@2620MHz
PC4000@262MHz 3-4-3-8 1T

Два теста одновременно,каждому тесту назначено своё ядро

CPU Multi-Dimensional Branch Prediction Memory Test Ver 1.0

Код:

Date : 23.02.2006 10:02:33
CPU clock : 2620MHz
Test system : This system
Reference system : Pentium4 2400C DDR400 sc

Results, test time

     n       Quick Sort  Merge Sort  Heap Sort  
      1000         73         98         80
      5000        429        603        485
     10000        912       1300       1050
     50000       5200       7500       6470
    100000      10900      16000      14200
    500000      61900      93700     113000
   1000000     130000     199000     316000
   5000000     719000    1110000    2310000
  10000000    1490000    2370000    6480000
  30000000    4750000    7570000   24800000

Relative results

     n       Quick Sort  Merge Sort  Heap Sort  
      1000       1,84       1,69       1,88
      5000       1,82       1,58       1,93
     10000       1,82       1,55       1,91
     50000       1,81       1,53       1,82
    100000       1,82       1,53       1,78
    500000       1,78       1,56       1,83
   1000000       1,78       1,51       1,72
   5000000       1,77       1,52       1,84
  10000000       1,77       1,49       1,59
  30000000       1,75       1,49       1,56

Relative perofmance index

Harmonic mean : 1,70
Geometric mean : 1,70
Arithmetic mean : 1,71
Square mean : 1,71

*****************************************************

CPU Multi-Dimensional Branch Prediction Memory Test Ver 1.0

Date : 23.02.2006 10:02:33
CPU clock : 2620MHz
Test system : This system
Reference system : Pentium4 2400C DDR400 sc

Results, test time

     n       Quick Sort  Merge Sort  Heap Sort  
      1000         73         98         80
      5000        429        603        485
     10000        912       1310       1040
     50000       5200       7480       6470
    100000      10900      16000      14400
    500000      61800      93700     111000
   1000000     129000     200000     313000
   5000000     716000    1120000    2420000
  10000000    1490000    2350000    6420000
  30000000    4730000    7570000   23900000

Relative results

     n       Quick Sort  Merge Sort  Heap Sort  
      1000       1,84       1,69       1,88
      5000       1,82       1,58       1,93
     10000       1,82       1,54       1,92
     50000       1,82       1,54       1,82
    100000       1,82       1,53       1,76
    500000       1,78       1,56       1,85
   1000000       1,79       1,51       1,74
   5000000       1,77       1,51       1,76
  10000000       1,77       1,51       1,60
  30000000       1,76       1,49       1,62

Relative perofmance index

Harmonic mean : 1,70
Geometric mean : 1,70
Arithmetic mean : 1,71
Square mean : 1,72

*****************************************************

#77

Locki

Добавлено: 23.02.2006 11:19

[профиль]

Member
Статус: Не в сети
Регистрация: 31.01.2004
Откуда: moskow

CPU Multi-Dimensional Branch Prediction Memory Test Ver 1.0

Date : 23.02.2006 11:14:34
CPU clock : 2005MHz
Test system : This system
Reference system : Pentium4 2400C DDR400 sc

Results, test time

n Quick Sort Merge Sort Heap Sort
1000 96 129 104
5000 562 784 632
10000 1180 1710 1360
50000 6810 9830 8440
100000 14300 21200 18500
500000 81300 125000 147000
1000000 170000 266000 419000
5000000 940000 1520000 3160000
10000000 1950000 3180000 7600000
30000000 6220000 44600000 27300000

Relative results

n Quick Sort Merge Sort Heap Sort
1000 1,40 1,29 1,44
5000 1,39 1,21 1,48
10000 1,40 1,18 1,47
50000 1,39 1,17 1,40
100000 1,39 1,16 1,37
500000 1,35 1,17 1,40
1000000 1,36 1,13 1,30
5000000 1,35 1,12 1,35
10000000 1,35 1,11 1,35
30000000 1,34 0,25 1,42

Relative perofmance index

Harmonic mean : 1,15
Geometric mean : 1,24
Arithmetic mean : 1,28
Square mean : 1,30

*****************************************************
Вывод: если коротко, то ниочем, т. е. очень интересени познователен, НО в узких кругах.
То же самое что расчитывать полет снежинки - дико познавательно, увлекательно для автора и соучастников, но абсолютно неинтересно и ненужно для остальных.

Lev Dymchenko

Добавлено: 23.02.2006 12:35

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

T2VOVIK

Спасибо за эксперимент. Он оказался довольно интересен. Два первых подтеста (Quicksort и Mergesort) с хорошей локальностью данных показали весьма неплохое масштабирование по количесу ядер, а вот последний тест HeapSort при больших n уже, видимо, сильно зависит от памяти. Очень серьезная потеря производительности. Наверное, общий контроллер памяти тут себя плохо проявляет. Вот как может быть. А то говорили, что dualcore, это как настоящий дуальник, это не так.
Добавлено спустя 1 минуту, 14 секунд
Какое падение в худшем случае, было 2.3, стало 1.5, вот примерная цена общего контроллера памяти.
Добавлено спустя 5 минут, 21 секунду
Locki

Не могли бы вы использовать тег code и писать название системы вместе с КЭШ?

Цитата:

Вывод: если коротко, то ниочем, т. е. очень интересени познователен, НО в узких кругах.
То же самое что расчитывать полет снежинки - дико познавательно, увлекательно для автора и соучастников, но абсолютно неинтересно и ненужно для остальных.

Не забудьте добавить, что это - ваш вывод. Я бы сказал, наоборот, потому что тест некоторой программы на некотором наборе данных никому, кроме пользователей этой программы особенно не нужен. Бывает, например, что в зависимости от выбора игрового уровня, процессоры показывают различные результаты. Так было с UnrealTournament. А этот тест дает ориентировочную оценку для класса алгоритмов.
Добавлено спустя 6 минут, 39 секунд
А по поводу полета снежинки, если обладать теорией, то на основе наблюдения за её полетом можно сделать важные и ценные выводы.

Ксати, может быть, стоит сделать мульипоточную версию теста, типа SpecRate, хотя это несколько идеологически неправильно, так как не все алгоритмы параллелятся, но просто для интереса, вот выловили, как может проседать производительность dual core.

Навуходоносор

Добавлено: 23.02.2006 13:02

[профиль]

Member
Статус: Не в сети
Регистрация: 21.01.2006
Откуда: Тюмень

Торик-b @~2100 mhz
512 ram

Цитата:

CPU Multi-Dimensional Branch Prediction Memory Test Ver 1.0

Date : 23.02.2006 14:57:17
CPU clock : 2094MHz
Test system : This system
Reference system : Pentium4 2400C DDR400 sc

Results, test time

n Quick Sort Merge Sort Heap Sort
1000 97 126 111
5000 565 776 678
10000 1200 1680 1450
50000 6940 10100 9320
100000 15000 22100 24200
500000 87900 132000 236000
1000000 187000 284000 588000
5000000 1040000 1640000 5000000
10000000 2190000 3440000 12000000
30000000 7090000 11200000 55400000

Relative results

n Quick Sort Merge Sort Heap Sort
1000 1,38 1,32 1,35
5000 1,38 1,22 1,38
10000 1,38 1,20 1,38
50000 1,36 1,14 1,27
100000 1,33 1,11 1,05
500000 1,25 1,10 0,87
1000000 1,24 1,06 0,93
5000000 1,21 1,03 0,85
10000000 1,21 1,03 0,86
30000000 1,17 1,00 0,70

Relative perofmance index

Harmonic mean : 1,12
Geometric mean : 1,14
Arithmetic mean : 1,16
Square mean : 1,17

_________________
Ин биг фэмили фэйсом дон`т клик.

Lev Dymchenko

Добавлено: 23.02.2006 18:38

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Навуходоносор

Не могли бы вы использовать тег code? В критичном к памяти последнем подтесте видно, как с увеличением объема данных процессор того, затыкается производительностью шины.

T2VOVIK

Добавлено: 23.02.2006 19:12

[профиль]

Member
Статус: Не в сети
Регистрация: 14.10.2005
Откуда: РОССИЯ

A64 x2 3800+@2620MHz
PC4000@262MHz 3-4-3-8 1T

Два теста одновременно,каждому тесту назначено своё ядро

Код:

CPU Multi-Dimensional Branch Prediction Memory Test Ver 1.0

Date : 23.02.2006 13:18:42
CPU clock : 2620MHz
Test system : This system
Reference system : Pentium4 2400C DDR400 sc

Results, test time

     n       Quick Sort  Merge Sort  Heap Sort
      1000         73         97         80
      5000        426        596        482
     10000        907       1290       1040
     50000       5170       7580       6450
    100000      10900      16000      14200
    500000      61400      93000     110000
   1000000     129000     198000     299000
   5000000     712000    1120000    2200000
  10000000    1480000    2350000    5720000
  30000000    4700000    7490000   21300000

Relative results

     n       Quick Sort  Merge Sort  Heap Sort
      1000       1,84       1,71       1,88
      5000       1,83       1,59       1,94
     10000       1,83       1,57       1,93
     50000       1,83       1,52       1,83
    100000       1,83       1,54       1,79
    500000       1,79       1,57       1,88
   1000000       1,80       1,52       1,83
   5000000       1,78       1,52       1,93
  10000000       1,78       1,51       1,80
  30000000       1,77       1,51       1,82

Relative perofmance index

Harmonic mean : 1,73
Geometric mean : 1,74
Arithmetic mean : 1,74
Square mean : 1,75

*****************************************************

CPU Multi-Dimensional Branch Prediction Memory Test Ver 1.0

Date : 23.02.2006 13:18:42
CPU clock : 2617MHz
Test system : This system
Reference system : Pentium4 2400C DDR400 sc

Results, test time

     n       Quick Sort  Merge Sort  Heap Sort
      1000         73         97         80
      5000        427        596        483
     10000        908       1290       1040
     50000       5180       7510       6450
    100000      10900      16000      14100
    500000      61500      92800     110000
   1000000     129000     197000     299000
   5000000     714000    1100000    2080000
  10000000    1480000    2340000    5790000
  30000000    4710000    7480000   22000000

Relative results

     n       Quick Sort  Merge Sort  Heap Sort
      1000       1,84       1,71       1,88
      5000       1,83       1,59       1,94
     10000       1,83       1,57       1,93
     50000       1,82       1,53       1,83
    100000       1,83       1,53       1,79
    500000       1,79       1,57       1,87
   1000000       1,79       1,53       1,82
   5000000       1,78       1,54       2,04
  10000000       1,78       1,51       1,78
  30000000       1,77       1,51       1,76

Relative perofmance index

Harmonic mean : 1,73
Geometric mean : 1,74
Arithmetic mean : 1,74
Square mean : 1,75

*****************************************************

#77

PS Большой разброс показаний:)

Lev Dymchenko

Добавлено: 23.02.2006 20:06

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Цитата:

PS Большой разброс показаний:)

Не такой уж и большой, 1.6-1.75, видна качественная картина. Возможно, в этот раз тесты были запущены чуть менее одновременно.

White

Добавлено: 23.02.2006 23:17

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Цитата:

Harmonic mean : 1,12
Geometric mean : 1,12
Arithmetic mean : 1,13
Square mean : 1,14

Вот мой резалт.

А вот торик...

Цитата:

Harmonic mean : 1,12
Geometric mean : 1,14
Arithmetic mean : 1,16
Square mean : 1,17

Классный тест.... Мандель марк ему пара :-)

Цитата:

Ксати, может быть, стоит сделать мульипоточную версию теста, типа SpecRate, хотя это несколько идеологически неправильно, так как не все алгоритмы параллелятся, но просто для интереса, вот выловили, как может проседать производительность dual core.

Может и стоет... :-D

Наверное это идеологически неправильно, если что-то нераспарраллеливается или нет способностей распарралелить, то не надо этого делать вообще :lol:

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Lev Dymchenko

Добавлено: 23.02.2006 23:21

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

white
А что вы удивляетесь результатам, какая частота у вашего процессора, и какая-у торика, и какова длина конвейереа и, может, латентность КЭШ.

White

Добавлено: 23.02.2006 23:23

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko Какая частота у торика? 2100МГц. У меня 3,6ГГц. Судя по вашему тесту торик быстрей? Так? Теперь покажите где торик на 2,1ГГц быстрей моего камня.

Сразу скажу. Я не говорю что ваш тест не прав сам в себе, он не прав по сути -> он является синтетикой.

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Последний раз редактировалось White 23.02.2006 23:24, всего редактировалось 1 раз.

Lev Dymchenko

Добавлено: 23.02.2006 23:24

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

В некотором классе приложений, аналогичная производительность.

White

Добавлено: 23.02.2006 23:24

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko В каком?

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Lev Dymchenko

Добавлено: 23.02.2006 23:27

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Ну вот, тут видно, когда частота шины не сказывается, то есть, либо данные помещаются в КЭШ, либо достаточно локальные, и приложение ограничено скоростью исполнения ветвлений. Ну например, если взять шахматную программу, которая пользует только 256KB КЭШ, то можно ожидать напряженной борьбы между вашими процессорами.
Добавлено спустя 1 минуту, 23 секунды
собственно, такой класс сам по себе не очень велик, но если приложение имеет части, подподающие под этот класс, то скос производительности будет в пользу торика. Например, AI и игровая логика компьютерных игр.

White

Добавлено: 23.02.2006 23:30

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko
Какие наборы инструкций использует Ваша программа?

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Новая тема /

Ответить

Сообщений: 238 • Страница 3 из 12 • < 1 2 3 4 5 6 ... 12 >

Список форумов » Специализированные форумы » Бенчмаркинг

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: murkok5 и гости: 4

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти: