Member
Статус: Не в сети Регистрация: 27.02.2007 Откуда: Москва Фото: 114
Для 9700Х повышенная loaded latency это обычное поведение. 3D кэш затем и придумали, чтобы её понижать.
Добавлено спустя 2 минуты 43 секунды: Это ещё неплохо, ведь могло быть и так:
Код:
Intel(R) Memory Latency Checker - v3.11 Measuring idle latencies for random access (in ns)... Numa node Numa node 0 0 79.1
Measuring Peak Injection Memory Bandwidths for the system Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec) Using all the threads from each core if Hyper-threading is enabled Using traffic with the following read-write ratios ALL Reads : 68881.5 3:1 Reads-Writes : 64170.7 2:1 Reads-Writes : 64692.2 1:1 Reads-Writes : 67074.9 Stream-triad like: 64843.0
Measuring Memory Bandwidths between nodes within system Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec) Using all the threads from each core if Hyper-threading is enabled Using Read-only traffic type Numa node Numa node 0 0 68947.5
Measuring Loaded Latencies for the system Using all the threads from each core if Hyper-threading is enabled Using Read-only traffic type Inject Latency Bandwidth Delay (ns) MB/sec ========================== 00000 678.07 69132.5 00002 670.16 69133.2 00008 667.78 68979.1 00015 655.99 69073.0 00050 683.45 68986.4 00100 657.38 69120.3 00200 737.23 68891.2 00300 259.54 66848.2 00400 106.51 57618.5 00500 102.19 48377.3 00700 92.63 37114.8 01000 87.20 27584.2 01300 83.82 21986.8 01700 81.14 17380.3 02500 80.49 12338.2 03500 80.18 9171.6 05000 80.14 6726.1 09000 80.90 4119.1 20000 80.93 2300.3
Measuring cache-to-cache transfer latency (in ns)... Local Socket L2->L2 HIT latency 16.7 Local Socket L2->L2 HITM latency 17.0
Это стоковый 7900Х с 2х48 Gb @ 6000 на типичных таймингах. Гипервизор не выключен если что.
Member
Статус: Не в сети Регистрация: 23.06.2019 Фото: 0
HertZ Ага, то-то я и смотрю, что странновое. В общем понял, с X3D вообще нельзя сравнивать — там своя тема. Но почему у меня показывает такой высокий BW 85+-? А у тебя начинается с 69... Хотя у тебя память тоже настроена.
Member
Статус: Не в сети Регистрация: 27.02.2007 Откуда: Москва Фото: 114
Phenomenum писал(а):
HertZ Ага, то-то я и смотрю, что странновое. В общем понял, с X3D вообще нельзя сравнивать — там своя тема. Но почему у меня показывает такой высокий BW 85+-? А у тебя начинается с 69...
Тут без магии, тайминги и фабрика. Чем выше фабрика и тем жестче тайминги, тем выше будет ПСП. А при удачном стечении обстоятельств и латентность тоже будет ниже.
Member
Статус: Не в сети Регистрация: 23.06.2019 Фото: 0
HertZ Так это понятно. почему тебя ПСП показывается только 69 +-? А у меня 85 (но с конскими задержками). А если сравнить наши задержки при ПСП 69, то у меня сильно меньше. Этот тест точно всё правильно интерпретирует? Чет у меня сомнения...
Member
Статус: Не в сети Регистрация: 27.02.2007 Откуда: Москва Фото: 114
Phenomenum
Частота фабрики у тебя 2166 МГц. За один цикл у тебя получается:
32 байта на чтение то есть 2166000000 х 32 ~= 69.31 GB/s 16 байт на запись то есть 2166000000 х 16 ~= 34.66 GB/s
Поскольку оно умеет читать и писать одновременно, то теоретический максимум пропускной способности в идеальных условиях с нагрузкой 2:1 будет 69.31 + 34.66 ~= 104 GB/s. Вот этот теоретический максимум у тебя примерно и получается. Насколько это возможно с памятью на 6200. На 8000 гарантированно был бы упор в 100 Гб/с или очень близко к нему.
А почему у меня не получился тогда, хрен его знает. Я даже настройки не помню. Возможно, в конкретный момент эта 6000 была немножко не 6000, а очень даже 4800.
Стоп, два чиплета же. Шел вечер вторника. Ну и тупизм написал же. Тогда теоретическую удваиваем. Будет 138 на чтение, 70 на запись и 208 в сумме. До теоретического максимума ещё далеко, под вечер ввел тебя в заблуждение. Но в данном случае неважно, потому что упор всё равно в память на 6200, которая не может дать выше 100 GB/s в идеальных условиях, а их в данном случае у нас нет.
Phenomenum писал(а):
почему тебя ПСП показывается только 69 +-? А у меня 85 (но с конскими задержками). А если сравнить наши задержки при ПСП 69, то у меня сильно меньше. Этот тест точно всё правильно интерпретирует? Чет у меня сомнения...
Ну так ПСП к латентности относится, как говорят, «примерно где-то рядом». Высокая латентность понизит тебе ПСП на мелкоблочныхи конкурентных операциях, да, но предполагать обратное некорректно. Низкая латентность никак ПСП поднимет, если её уже некуда поднимать. 🤷♂️ Тут как с SSD, можно иметь очень плохое время доступа и очень высокую теоретическую ПСП, как на модных QLC дисках с PCIE 5.0. А можно на «медленном» PCIE 3.0 диске иметь очень малое время доступа. Это низкое время доступа диск до уровня PCIE 5.0 всё равно не поднимет в бенчах по ПСП, чем маркетологи успешно и пользуются для впаривания последних.
Member
Статус: Не в сети Регистрация: 23.06.2019 Фото: 0
HertZ писал(а):
104 GB/s. Вот этот теоретический максимум у тебя примерно и получается.
Давай по порядку:
1. Не теоретический, а 85 Гб/сек. 1.1. Почему у тебя этот тест выдаёт 69? Это неправильно. Или ты хочешь сказать, что У меня ПСП в полтора раза выше? Этого не может быть.
HertZ Блин, ты просто сравни наши скрины. У тебя есть этому какое-то логическое объяснение? У меня тест начинается с гораздо большей ПСП, но с бОльшей задержкой. Когда доходит до сравнимого ПСП, то у тебя задержка +-90, у меня меньше. Хотя ОЗУ и там и там настроена. Причем, у тебя она настроена на большую пропускную способность. Это факт. Воткактак?
Member
Статус: Не в сети Регистрация: 27.02.2007 Откуда: Москва Фото: 114
Phenomenum, не совсем понял, что показалось странным. На этом скрине память, несмотря на частоту 7200, благодаря конским таймингам работает как раз на уровне самого дохлого джедек-4800. Там же CAS и RCD выкручены на 58, про остальные можно и не вспоминать. Как раз такая разница и будет.
Member
Статус: Не в сети Регистрация: 27.02.2007 Откуда: Москва Фото: 114
По сути, такой конфиг от судьбы вечного тормоза спасает только 3д кэш. Иначе быть ему целероном 16-ядерным. А так даже игрульки играет. Не особо быстро, медленнее ультры 5, но играет)
Добавлено спустя 14 минут 16 секунд:
Phenomenum писал(а):
HertZ Блин, не увидел CL.
Бывает.
Phenomenum писал(а):
А с нормальными таймингами у тебя как получается? Можешь сделать тест/скрин? Меня что-то беспокоит конская задержка на первых 6-ти итерациях.
Получаться-то получится, но тут ребус с вольтажами ещё надо решить, иначе это клоунада.
Сама эта память на интеле может на 7000-7200 CL32-CL34 работать на Vdd 1.35-1.45V и очень низких VDDQ:
7000
#77
#77
#77
7200
#77
#77
#77
Но беда в том, что если такие напряжения на AMD поставить, то оно не будет проходить никакие тесты вообще. А если поставить одинаковые 1.35 или 1.45, то будут работать только игрульки и лёгкие тесты, а для тяжелых надо сидеть и подбирать импедансы и бороться с «отражениями сигнала».
Реальная стабильность 24/7 пока на 6800 только, потенциально ещё возможно 7000. Покопаю 7200 конечно, но это сильно не приоритет и очень сильно в режиме хобби, там надо в memtest86+ играться часами.
На 6800 это выглядит вот так:
#77
#77
#77
В игрульках особо не мучил, прогнал в одной по несколько раз и вот записал что намерило.
Цитата:
Shadow of the Tomb Raider без упора в видео, потыкал по несколько раз от скуки.
6800 1:2 C28 пожато до предела
395 396 394 407 406
6200 1:1 C28 пожато до предела
405 393 395 394 395
Завтра попробую скопировать тайминги с интела и запустить MLC на 7200, чтобы померить нормально.
Intel(R) Memory Latency Checker - v3.9a Measuring idle latencies (in ns)... Numa node Numa node 0 0 42.5
Measuring Peak Injection Memory Bandwidths for the system Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec) Using all the threads from each core if Hyper-threading is enabled Using traffic with the following read-write ratios ALL Reads : 53949.1 3:1 Reads-Writes : 62631.9 2:1 Reads-Writes : 68121.4 1:1 Reads-Writes : 63474.8 Stream-triad like: 51912.3
Measuring Memory Bandwidths between nodes within system Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec) Using all the threads from each core if Hyper-threading is enabled Using Read-only traffic type Numa node Numa node 0 0 53948.9
Measuring Loaded Latencies for the system Using all the threads from each core if Hyper-threading is enabled Using Read-only traffic type Inject Latency Bandwidth Delay (ns) MB/sec ========================== 00000 314.07 54017.7 00002 312.19 54029.1 00008 307.87 54064.2 00015 293.18 54113.4 00050 247.19 54266.4 00100 216.19 54373.9 00200 183.07 54303.9 00300 127.12 52657.6 00400 90.11 47064.9 00500 73.20 40222.2 00700 61.44 30119.6 01000 55.17 22019.1 01300 52.54 17465.8 01700 50.78 13840.2 02500 49.06 9963.3 03500 48.03 7561.5 05000 47.29 5739.8 09000 46.52 3828.0 20000 45.99 2499.1
Measuring cache-to-cache transfer latency (in ns)... Using small pages for allocating buffers Local Socket L2->L2 HIT latency 29.3 Local Socket L2->L2 HITM latency 29.6
i9 12900K Turbo Ratio Limits: 55x (1-2c), 54x (3-4c), 53x (5-7c), 52x(8c) Ring Ratio: 43x(Fixed)
Z690 Asus TUF 2 x 16GB: G Skill 3800C14 @ 3800 14-15-15-34-300-CR2 1.5v
Код:
Intel(R) Memory Latency Checker - v3.9a Measuring idle latencies (in ns)... Numa node Numa node 0 0 42.5
Measuring Peak Injection Memory Bandwidths for the system Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec) Using all the threads from each core if Hyper-threading is enabled Using traffic with the following read-write ratios ALL Reads : 58415.5 3:1 Reads-Writes : 68227.2 2:1 Reads-Writes : 74219.2 1:1 Reads-Writes : 70138.5 Stream-triad like: 57083.7
Measuring Memory Bandwidths between nodes within system Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec) Using all the threads from each core if Hyper-threading is enabled Using Read-only traffic type Numa node Numa node 0 0 58410.1
Measuring Loaded Latencies for the system Using all the threads from each core if Hyper-threading is enabled Using Read-only traffic type Inject Latency Bandwidth Delay (ns) MB/sec ========================== 00000 285.17 58461.5 00002 281.27 58475.8 00008 276.54 58509.7 00015 263.61 58513.2 00050 221.77 58569.7 00100 196.32 58647.0 00200 166.72 58631.4 00300 99.50 56913.4 00400 66.20 49351.5 00500 56.71 41411.0 00700 50.51 30892.9 01000 47.37 22553.1 01300 46.06 17949.1 01700 45.30 14212.7 02500 44.48 10248.1 03500 43.95 7796.2 05000 43.56 5930.2 09000 43.14 3976.9 20000 42.82 2620.6
Measuring cache-to-cache transfer latency (in ns)... Using small pages for allocating buffers Local Socket L2->L2 HIT latency 30.8 Local Socket L2->L2 HITM latency 30.8
А вот взрослое, очень дорогое, но очень печальное по латентности:
Intel(R) Memory Latency Checker - v3.11 Measuring idle latencies for random access (in ns)...
Numa node Numa node 0 0 120.3
Measuring Peak Injection Memory Bandwidths for the system Bandwidths are in MB/sec (1 MB/sec = 1,000,000 Bytes/sec) Using all the threads from each core if Hyper-threading is enabled Using traffic with the following read-write ratios
Member
Статус: Не в сети Регистрация: 14.03.2013 Откуда: неРФ Фото: 15
Phenomenum писал(а):
ваш Intel MLC
Попробуй нажми ещё раз и будет по другому,оно по настроению работает,если в аида +- 2мс,то в этой разброс 5-6 Пробовал в безопасном режиме-разница в аиде 1-1.5,в млс всегда везде "стабильно"5-6.А реально неясно сколько.
Member
Статус: Не в сети Регистрация: 27.02.2007 Откуда: Москва Фото: 114
windowsyes, оно использует ядра как бы. Немножко все 32 потока. Если не хочется, чтобы был разброс, то выключи PBO и поставь фиксированную частоту. 🤷♂️
А так аргументация интересная конечно. Лучше мерить непонятно что, «зато точно». Ох уж это успокоение цифирькой.
Добавлено спустя 26 минут 4 секунды:
Phenomenum писал(а):
А с нормальными таймингами у тебя как получается? Можешь сделать тест/скрин? Меня что-то беспокоит конская задержка на первых 6-ти итерациях.
XMP тайминги чуть получше, конечно, но все равно редкостное днище и немногим лучше моего тролль-профиля. В игрульке так и вовсе по-прежнему за все отдувается кэш. Нет, просто этот бенчмарк в оконном режиме как-то странно работает и в любом случае выдает 250 кадров.
Member
Статус: Не в сети Регистрация: 12.01.2017 Фото: 25
HertZ писал(а):
Это стоковый 7900Х с 2х48 Gb @ 6000 на типичных таймингах. Гипервизор не выключен если что.
От чего зависят первые значения 600+? У меня на 7600/fclk 2133/ 6000cl30 с ужатами таймингами эти значения начинаются с 355 и потом опускаются до 68-69, в аида 56 ns
_________________ ASUS TUF B650M PLUS wifi + 7600@5.1 + 32gb 6000CL30 + RX 7900GRE
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 9
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения