Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 13 
  Версия для печати (полностью) Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 11.06.2016
Фото: 4
Похоже что одно имеет прямую зависимость от другого, навели меня на эту мысль как посредственные результаты рязани, так и впечатляющие бродвеллов с Л4 кэшем. Я прогнал пару тестов, с памятью в обычном режиме работы с латентностью в 50 нс, а также с дико задранными таймингами, которые дали латентность 60 нс, в среднем разница оказалась в районе 7%, но доходила и до 10%. Сама латентность при этом отличается на 20%, из чего уже можно прикинуть какой фпс можно ожидать от процессора в играх, в зависимости от разгона памяти и результата в бенчмарке Аиды64.
Должен сказать, что набор тестов у меня так себе, поэтому буду признателен, если заинтересовавшиеся люди проведут аналогичные тесты в надежных процессорозависимых игровых бенчах, которые дают повторяющиеся результаты.

_________________
overclockers.ru/blog/Coolio/show/36529/rukovodstvo-po-raskrytiju-potenciala-i-tonkoj-nastrojke-vozdushnogo-ohlazhdeniya-personalnyh-kompjuterov



Партнер
 

Member
Статус: Не в сети
Регистрация: 12.01.2005
Это известный факт. В современных играх latency памяти является определяющим параметром производительности памяти, именно по этому у райзена такие посредственные результаты, при хорошем однопотоке. ПСП особого значения не имеет.

_________________
Солдатушки-ребятушки, нашему царю показали фигу. Умрём все до последнего!


 

Member
Статус: Не в сети
Регистрация: 11.06.2016
Фото: 4
N1ghtwish писал(а):
Это известный факт.

Я бы не сказал, что особо известный, иначе бы фанатье перестало кидать друг в друга противоречивыми жипегами, сделанными не понятно при каких обстоятельствах. Поискал на ютубе тесты в играх именно с латентностью - ничего нет, только дурацкие "что лучше частота или тайминги".

Добавлено спустя 57 секунд:
N1ghtwish писал(а):
В современных

Самое смешное, в древней однопоточной игре тоже была заметная разница, около 8 процентов. В современных, с кучей потоков, возможно еще больше будет.

_________________
overclockers.ru/blog/Coolio/show/36529/rukovodstvo-po-raskrytiju-potenciala-i-tonkoj-nastrojke-vozdushnogo-ohlazhdeniya-personalnyh-kompjuterov


 

Member
Статус: Не в сети
Регистрация: 12.01.2005
coolio писал(а):
только дурацкие "что лучше частота или тайминги".

Именно что дурацкие, и задаются таким вопросом дураки, потому что разгон памяти по частоте снижает общую latency более эффективно, чем просто снижение таймингов. В теории, и на 2133Мгц можно скинуть latency ниже 40нс (Intel LGA115x), но вот тайминги придется ставить что-то типа 6-6-6-16, что просто нереально.
coolio писал(а):
Самое смешное, в древней однопоточной игре тоже была заметная разница, около 8 процентов. В современных, с кучей потоков, возможно еще больше будет.

Все зависит от объема, который использует игра, если игра 32-х битная, то там будет минимальная зависимость от памяти (Crysis3), если игра пожирает больше 8Гб RAM (WD2), то она будет очень сильно зависеть от памяти.
Опять же замечу, зависимость от памяти в разных играх может по разному проявляться, например Fallout4 очень любит низкую latency, конкретно на моем примере с i7-6800K разницы между одноканальным режимом, двухканальном и 4-х канальном, практически не было, зато на снижение latency она очень хорошо реагировала, и для нее одноканальный режим с низкой латенси предпочтительнее, чем 4-х канальный с высокой latency, но и высоким ПСП. А вот BF1 любит и ПСП тоже, там одноканальный режим производительность заметно дропает.
Короче говоря, практически ВСЕ современные игры любят низкую latency, но вот некоторые еще и любят и ПСП, правда, на практике 30-35Гб\с (или в чем там измеряется в AIDA64?) хватает за глаза, а вот latency чем ниже, тем лучше.

_________________
Солдатушки-ребятушки, нашему царю показали фигу. Умрём все до последнего!


Последний раз редактировалось N1ghtwish 01.06.2018 16:27, всего редактировалось 1 раз.

 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
N1ghtwish
Ну это вы загнули. 3200 CL15 это примерно 2133 c CL10.

Комбинированный разгон конечно позволяет добиться лучших результатов, если он не идёт в ущерб задержке.

coolio
https://goo.gl/tbEobV
Потом я правда ещё 2 фпс из этой памяти выжал...
А вообще снижение задержек позволяет увеличить производительность практически во всех играх где вы не упираетесь в видеокарту.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Member
Статус: Не в сети
Регистрация: 11.06.2016
Фото: 4
Agiliter писал(а):
https://goo.gl/tbEobV

Неплохо, 15% снижение латентности дало 7% фпс.

_________________
overclockers.ru/blog/Coolio/show/36529/rukovodstvo-po-raskrytiju-potenciala-i-tonkoj-nastrojke-vozdushnogo-ohlazhdeniya-personalnyh-kompjuterov


 

Member
Статус: Не в сети
Регистрация: 12.01.2005
Agiliter писал(а):
Ну это вы загнули. 3200 CL15 это примерно 2133 c CL10.

Спорить не буду, но на низкой частоте очень сложно эффективно снизить latency понижая ТОЛЬКО тайминги. Разгон через понижение таймингов имеет смысл обычно только в 2х случаях: 1. чипсет, который не позволяет гнать по частоте 2. память DDR4 микрон, когда действительно не понятно, что лучше и эффективнее 2133 CL12, 2400 CL15 или 2933 CL20.

Добавлено спустя 11 минут 15 секунд:
coolio
Вот неплохое сравнение 3200 CL13 vs CL16
Дал с таймкодом на AC:O,

2:45 тут камера в арку влетает, снижение latency позволило бустануть фпс на ~12%, когда я тестировал на своем i5-6400@4.6GHz + DDR3-2266 CL13 у меня получилось на 1-2 кадра ниже, чем у него на i5-6400@4.3GHz 3200 CL16, но у меня-то процессор разогнан на 300Мгц выше, т.е. разгон памяти смог не только компенсировать отставание по частоте, но еще и превзойти более разогнанный проц на ~15%.

_________________
Солдатушки-ребятушки, нашему царю показали фигу. Умрём все до последнего!


 

Member
Статус: Не в сети
Регистрация: 11.06.2016
Фото: 4
N1ghtwish писал(а):
Вот неплохое сравнение 3200 CL13 vs CL16

Да, спасибо, плохо, что он латенцию не догадался померить.

_________________
overclockers.ru/blog/Coolio/show/36529/rukovodstvo-po-raskrytiju-potenciala-i-tonkoj-nastrojke-vozdushnogo-ohlazhdeniya-personalnyh-kompjuterov


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
N1ghtwish
Не сложно. Просто. Задержка в наносекундах получается путём простых математических вычислений если вам известна частота тайминг.
Допустим имеем 3200 с таймингом 15 или 9.38нс работает. 3200 с 14 будет 8.75 и не рабоатет. Зато 3333 с 15 будет 9НС и работает.
Я вам больше скажу при разгоне почти вне зависимости от частоты подавляющее большинство задержек в наносекундах будут иметь одинаковый предел. Как у вас было 8.75 предел на 1600 так и на 3200 будет. Только для 1600 это будет 7 тактов, а для 3200 14.
Другое дело что у платы может быть минимальный порог регулировки некоторых таймингов и на низкой частоте вы в этот порог упрётесь.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Member
Статус: Не в сети
Регистрация: 12.01.2005
Agiliter писал(а):
Не сложно. Просто. Задержка в наносекундах получается путём простых математических вычислений если вам известна частота тайминг.

Я имею ввиду, что тайминги не всегда получится скинуть эффективно. Вот у меня память samsung ddr4 b-die, считается довольно неплохой для разгона, была у меня одно время система i7-7700 + C232 чипсет (ASrock E3V5 gaming), выше 2400 выставить нельзя частоту (ограничение чипсета и процессора), и максимум, что я смог сделать это скинуть тайминги до 2400 13-13-13, и например, та же DDR3 от самсунга вполне может брать такие же тайминги на той же 2400 частоте (у меня только одна планка DDR3 способна так работать), т.е. вроде как прогресса на одной частоте (2400) и нет, но это ведь не так, потому что DDR3 от samsung'a выше 2500Мгц уже не способна взять, а DDR4 в легкую берет 3200. И как не крути, но 3200 16-18-18 (это ее предел) без сомнений лучше, чем 2400 CL13.
И, кстати, DDR3 вообще способна работать на таймингах выше 15? Или опять это гнилобайт чудит, просто я пытался DDR3 до 2700 (там идет большой шаг с 2266МГц сразу до ~2700) и вот пытался даже на 20х таймингах запустить - нивкакую, даже если выставить 2266 20-20-20 старта нет.

_________________
Солдатушки-ребятушки, нашему царю показали фигу. Умрём все до последнего!


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
Есть ещё вторичные и третичные тайминги, возможно либо упираетесь в верхний предел их повышение, либо плата сама их не завышает. А ещё может КП в ЦП не тянуть или сами планки.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Member
Статус: Не в сети
Регистрация: 22.03.2005
Откуда: Уфа
Фото: 0
coolio писал(а):
Похоже что одно имеет прямую зависимость от другого,

Не прямую. Всё будет зависеть от размерности задачи, которая исполняется. Если все данные для решения задачи уместятся в кеш L1 (кстати, как будем правильно именовать "кеш" или "кэш", а тот тут некоторые возмущаются, что это слово означает ещё и наличные деньги и по-хорошему их нужно не путать, называя словами с отличающимися буквами ;) ), то данные единожды будут считаны с диска в память, затем из памяти переданы в низший кеш L3 (или L4 у некоторых) и далее в L2 и в L1, только с которым ядро, исполняющее программу и будет общаться, не простаивая лишнее время в ожидании данных. Если размерность задачи больше L1, то в последнем останется только часть данных (самая востребованная), а за остальными придётся обращаться в L2 с уже совсем другими задержками. И так далее этот принцип сохраняется вплоть до ОЗУ и самих дисков (помним про используемый иногда своп).
Какой % задач в конкретном приложении ляжет на долю того или иного кеша сказать заранее трудно, только если нет однозначной инфы об этом от разработчиков. Но, в играх нагрузка нерегулярная, поэтому предсказывать подобные значения загрузки - без толку. Можно только померяться в одинаковых конкретных условиях и сделать выводы больше в частности по тестируемому приложению, чем в общем о сабжевых зависимостях.

Добавлено спустя 7 минут 1 секунду:
N1ghtwish писал(а):
В современных играх latency памяти является определяющим параметром производительности памяти... ПСП особого значения не имеет.

Это связано с тем, что память не настолько регулярно и часто задействована при вычислениях процессором по сравнению с кешем. В память повторно обращаются я выше описал в каких случаях. Но, чаще стараются и берут данные из кеша. Поэтому для разовых эпизодических (по меркам времени ЦП) запросов и важнее становятся тайминги, т.к. высокая ПСП понадобится только в случае, если запрошен был достаточно большой кусок данных. А т.к. запросы часто делают порциями соразмерно тому, сколько готов "скушать" кеш, то ПСП может вообще так и не сыграть своей главной роли.

Добавлено спустя 5 минут 10 секунд:
coolio писал(а):
иначе бы фанатье перестало кидать друг в друга противоречивыми жипегами, сделанными не понятно при каких обстоятельствах.

Фанатье обычно не знает про Пирамиду Грэма и почему их жипеговые аргументы "так сказал уважаемый многими человек" могут оказаться совсем не в кассу (ибо не ведают какие цели преследовал этот уважаемый), а самим разобраться в прямых фактах у них нет либо желания, либо возможностей, либо не знают как это сделать. Потому часто и выступают "стрелочниками".

Добавлено спустя 7 минут 19 секунд:
coolio писал(а):
Самое смешное, в древней однопоточной игре тоже была заметная разница, около 8 процентов. В современных, с кучей потоков, возможно еще больше будет.

Зависит от того, сколько внимания программисты уделили этому факту и возможным оптимизациям (тут мне очень нравятся СидМейеровцы, особенно в последней Цивилизации 6: при загрузке сейва суметь ушатать мне 9 полных 5 ГГц ядер - это просто "Браво!"). Если одновременные запросы разных ядер дойдут до L3/4/памяти/винта, то если им не объяснить, как не мешать друг другу, то ухудшений (фризов, лагов...) точно не миновать.

Добавлено спустя 3 минуты 53 секунды:
N1ghtwish писал(а):
потому что разгон памяти по частоте снижает общую latency более эффективно, чем просто снижение таймингов.

Ну так, частота, она - общая, а тайминги все индивидуальные, под конкретную операцию (чтение или запись) или их группу и под конкретное место (например, задержка передачи данных из банка в банк или общая по ранку, т.е. группе банков).

Добавлено спустя 4 минуты 15 секунд:
N1ghtwish писал(а):
если игра 32-х битная, то там будет минимальная зависимость от памяти

Нет не от этого. Выше уже пояснил. (и даже разные по битности режимы одной игры могли сравнивать не показательно, т.к. писать их могли разные люди по разному реализуя алгоритмы запроса данных + ещё накладные самой битности).

Добавлено спустя 6 минут 45 секунд:
N1ghtwish писал(а):
например Fallout4 очень любит низкую latency, конкретно на моем примере с i7-6800K разницы между одноканальным режимом, двухканальном и 4-х канальном, практически не было, зато на снижение latency она очень хорошо реагировала,

Фолы4 часто подгружает кучу разношёрстных данных, тем более, если настройки выкручивали от дефолта в сторону максимума. Если бы в движке как-то хитро реализовали предвыборку адресов и мелких данных, то можно было бы сильно снизить зависимость от задержки и лучше задействовать ПСП. Но, похоже этого сделано не было (т.к. фича была бы полезной только на мощных ПК, а Фолы4 ещё и консольный).

Добавлено спустя 8 минут 54 секунды:
Agiliter писал(а):
А ещё может КП в ЦП не тянуть или сами планки.

Что интересно, про КП многие так пишут, но стоит спросить чуть подробнее - так никто объяснить не может. ;)У меня ситуация: 4 модуля 3733 (по дефолту от производителя) не стартуют ни при каких выше 3533. Стоят в четырёхканале. Мама по по QVL умеет и 4200 8х8 и 3800 8х16. Ставлю 2х и 1х канал - та же песня. КП при этом недогружен соответственно в 2х и в 4х раза. Каким местом тогда в нём проблема?...

_________________
14900KF(P=7x63_1х60_E48_R52) Apex z790 G.Skill 2x16GB_8200cl32-45-2T 960Pro+2x960Evo+5xSSD 4090_Giga-GOC ASUS_PG278Q Pimax_8KX CM_HAF_X Win11x64


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
КП в процессоре, без разницы что там на плате написано если разводка не бездарная и плата тайминги выставляет нормально... Почему не может вам наверно проще спросить сразу в интел...
Пишут так потому что можно попробовать воткнуть другой процессор и с ним планки те же самые планки на той же плате заведутся. Но поскольку подобные вещи обычно не проверяют в связи с приличной ценой на подобные эксперименты остаётся только гадать дело у вас в планках, таймингах или КП.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 13 
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 12


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  

Лаборатория














Новости

Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan