Игровой режим Ryzen Master помогает бороться с задержками Ryzen Threadripper при обращении к памяти

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 20.04.2024 6:10

Сообщения без ответов | Активные темы

Список форумов » Сайт и конференция » Материалы сайта » Обсуждение новостей

Часовой пояс: UTC + 3 часа

Модератор: Sonic-Chainik

Новая тема /

Закрыто

Сообщений: 42 • Страница 2 из 3 • < 1 2 3 >

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

ByBy3eKa

Добавлено: 15.08.2018 10:49

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 24.05.2016
Откуда: Arstotzka
Фото: 0

cide писал(а):

ты покупай, покупай, потом узнаешь ололо

Вероятно недостаточно частиц "бы" употребил. В следующий раз наверное стоит уточнять словом "гипотетически" или "предполагаю".
Я недостаточно богат для смены платформы на систему с одним камнем за 2к грина вслепую)

matocob писал(а):

Удар по Эпикам: если функционал тот же, а денег в 2 раза меньше,
то "если не видно разницы, то зачем платить больше?"(с)

Потому что у них нет поддержки ECC и для серверов все-равно придется покупать эпики?

Реклама
Партнер

matocob

Добавлено: 15.08.2018 10:51

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 85

Аникей Сковородкер писал(а):

А в общем надо было ради этого проца все-таки выпустить новый чипсет на базе серверного с 8-и канальной памятью.

Чипсет тут ни при чём.
Контроллеры памяти находятся в процессоре, и ничто кроме жадности не мешает развести на плату все 8

Добавлено спустя 2 минуты 7 секунд:

ByBy3eKa писал(а):

Потому что у них нет поддержки ECC и для серверов все-равно придется покупать эпики?

Для серверов начального уровня не нужны ни Эпики, ни платы под них,
насколько знаю, Тредрипперы ЕСС поддерживают, не поддерживают только регистровую память.

BOIN

Добавлено: 15.08.2018 10:59

[профиль]

Member
Статус: Не в сети
Регистрация: 19.05.2017
Откуда: Minsk

ByBy3eKa писал(а):

что мешало оставить 8 каналов памяти

Т.е. вы считаете что АМД - "сам себе злобный буратино", чтобы выпускать проц для десктопа, у которого будет абсолютно тот же функционал и та же "мощность" что и у гораздо более дорого серверного процессора? По сути сделай они то что вы хотите и получился бы практически (а добавь они ещё и поддержку регистровой памяти - было бы и без "практически") полный клон уже год как существующего эпика, с той лишь разницей что этот был бы ещё и лучше: ибо кристаллы тут zen+, а не zen как в эпиках.

Последний раз редактировалось BOIN 15.08.2018 11:03, всего редактировалось 1 раз.

Joestar

Добавлено: 15.08.2018 11:02

[профиль]

Member
Статус: Не в сети
Регистрация: 22.03.2018

Как всегда у амде одни костыли. Недопроцы для игры в бенчмарки.

_________________
i9-9900K / HERO XI / G.SKILL 32GB 3600@14-14-34 / 1080Ti Gaming X / 970 PRO 512GB + 970 EVO 2TB / Seasonic Titanium 650w / Define R6

ByBy3eKa

Добавлено: 15.08.2018 11:09

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 24.05.2016
Откуда: Arstotzka
Фото: 0

matocob писал(а):

6000 в r15 - интересный начальный уровень, видать кто с чем сравнивает)
matocob, BOIN
Интелам никто не помешал 3647 точно так же начать превращать в декстоп и конкурировать со своими серваками по такой логике. Не считаю, что кастрировать половину ядер на подсистему памяти было лучшим решением, чтобы развести серверный и потреб сегмент для рабочих станций.

motnahp

Добавлено: 15.08.2018 12:30

[профиль]

Member
Статус: Не в сети
Регистрация: 29.01.2008
Фото: 0

matocob писал(а):

Контроллеры памяти находятся в процессоре, и ничто кроме жадности не мешает развести на плату все 8

да ладно))). Ты это интелу скажи с его недо-2066, в котором половина слотов не работает если стоит проц с двухканалом, объясни на пальцах как это сделать. Разводка памяти на плате, а потому там неоткуда "вдруг" взяться разводке на еще 4 канала.
Ну и в 4х каналах они сейчас не могут разобраться, а что будет с 8-ю! И да, это ситуацию с "кроссдоступом" не изменит, проблему надо решать в работе межпроцессорных связей и организации планировщика, возможно это будет решено с очередным обновлением БИОС и ОС.

BOIN

Добавлено: 15.08.2018 13:01

[профиль]

Member
Статус: Не в сети
Регистрация: 19.05.2017
Откуда: Minsk

Joestar писал(а):

Как всегда у амде одни костыли. Недопроцы для игры в бенчмарки.

16- "ядрёный" проц у них, имхо, получился более чем нормальный и универсальный, особенно если учесть цену на него и на аналоги у интелла. Разумеется это вещь не для игр, для игр есть платформа AM4.
Проблема у них только с 32 ядерным (и, видимо, такая же будет с 24 ядерником) из-за нехватки каналов памяти, в результате и получился достаточно специфический проц, который в одних задачах лучше чем все что есть на данный момент в это классе, а в других - сливает чуть ли не мэйнстрим процам (слегка утрирую но всё же).

Цитата:

Интелам никто не помешал 3647 точно так же начать превращать в декстоп и конкурировать со своими серваками по такой логике. Не считаю, что кастрировать половину ядер на подсистему памяти было лучшим решением, чтобы развести серверный и потреб сегмент для рабочих станций.

Так вроде xeon'ы на 3647 - это серверные процы у них, разве нет? В десктопе же пока ещё только hedt на 2066... Или я уже "отстал от жизни" и чего то не знаю?

motnahp

Добавлено: 15.08.2018 13:25

[профиль]

Member
Статус: Не в сети
Регистрация: 29.01.2008
Фото: 0

BOIN писал(а):

чуток отстал, планируют новую платформу вывести на X599 под 3647 к концу года, но это не точно.

Добавлено спустя 3 минуты 46 секунд:

BOIN писал(а):

из-за нехватки каналов памяти

Не в этом проблема, интеловские процы спокойно обходятся и 2/4-мя каналами на проц, проблема в организации всей этой канители вокруг кристаллов.

matocob

Добавлено: 15.08.2018 18:19

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 85

motnahp писал(а):

1.Интеловские процы - это интеловские процы, подсистема памяти у них всегда была сильнее чем у АМД,
2.Как бы "канитель вокруг кристаллов" не сильно мешает 1950Х и 1920Х, где у каждого кристалла 2 КП.
А когда к кривизне КП добавляются ещё и задержки шины, тогда мы и видим ахиллесову пяту 2990WX, в качестве костылей для которой предлагают использовать отключение кристаллов без КП и правку временных диаграмм работы с памятью в очередных AGESA

BOIN

Добавлено: 15.08.2018 18:39

[профиль]

Member
Статус: Не в сети
Регистрация: 19.05.2017
Откуда: Minsk

motnahp писал(а):

чуток отстал, планируют новую платформу вывести на X599 под 3647 к концу года, но это не точно.

Про "планируют" я в курсе, именно потому и сказал что ещё ничего ни в продаже, ни в обзорах, ни даже в сливах спецификации нету, так что давайте "не будем делить шкуру не убитого медведя". Когда выпустят тогда и посмотрим что там будет и какие будут отличия от серверов. Пока это всё только слухи и никакой конкретики.
Да и помимо всего прочего - я более чем уверен что 28 ядер будут выпущены именно в ответ на TR4, без него было бы нам 16\18 ядер в hedt, а остальное только в серверах. В любом случае будет либо сразу бешеная цена (т.е. это и будет обычный серверный камень), либо какие-то серьёзные отличия от серверных платформ.

motnahp писал(а):

Тут проблема и в одном и во втором. Т.е.: при данной организации что у них есть сейчас (но да, сделали они знатную хрень) нужна большая пропускная способность (она получается в 2 раза ниже чем в 16 ядерном аналоге у которого таких проблем нет) и её уже очень не хватает (потому и "тупит" проц везде где нужна быстрая работа с ОЗУ). Либо нужно на каждый кристалл свой КП (т.е. 8 каналов памяти) - но тут тогда вопрос нафига нужны эпики (различие получается только в поддержке регистровой памяти). Либо вообще принципиально другой подход: нужно серьёзно переделывать работу с памятью на уровне архитектуры, но и такого тоже конечно же не будет (разве что когда нибудь в каком нибудь условном zen 5, и то маловероятно).
В итоге из-за этого и получили узкоспециализированный 32 ядерный проц и относительно универсальный 16 ядерный.

motnahp

Добавлено: 15.08.2018 19:07

[профиль]

Member
Статус: Не в сети
Регистрация: 29.01.2008
Фото: 0

matocob писал(а):

2.Как бы "канитель вокруг кристаллов" не сильно мешает 1950Х и 1920Х, где у каждого кристалла 2 КП.

о чем и речь, в случае 1950 получаем схему 2-сокетной системы, а в случае 2990 - 4 сокета, где 2 проца иногда плавают как говно в проруби из-за обращения по любому поводу к соседнему кристаллу.

matocob писал(а):

2.Как бы "канитель вокруг кристаллов" не сильно мешает 1950Х и 1920Х, где у каждого кристалла 2 КП.
А когда к кривизне КП добавляются ещё и задержки шины, тогда мы и видим ахиллесову пяту 2990WX, в качестве костылей для которой предлагают использовать отключение кристаллов без КП и правку временных диаграмм работы с памятью в очередных AGESA

Вы путаете причину и следствие, где-то есть проблемы с производительностью связанная с памятью у однокристальной рязани? То что сейчас всплыли проблемы с доступом к КП соседнего кристалла исключительно проблема "канители вокруг кристаллов", если вы сталкивались с настройками серверов, а именно c NUMA, то должны знать о чем я.

BOIN писал(а):

Да и помимо всего прочего - я более чем уверен что 28 ядер будут выпущены именно в ответ на TR4, без него было бы нам 16\18 ядер в hedt, а остальное только в серверах. В любом случае будет либо сразу бешеная цена (т.е. это и будет обычный серверный камень), либо какие-то серьёзные отличия от серверных платформ.

Вообще не понимаю почему все пихают 3647 в серверный сегмент, когда они есть еще и в рабочих станциях, куда как раз таки и метит АМД со своим 2990.

BOIN писал(а):

ут проблема и в одном и во втором. Т.е.: при данной организации что у них есть сейчас (но да, сделали они знатную хрень) нужна большая пропускная способность (она получается в 2 раза ниже чем в 16 ядерном аналоге у которого таких проблем нет) и её уже очень не хватает (потому и "тупит" проц везде где нужна быстрая работа с ОЗУ). Либо нужно на каждый кристалл свой КП (т.е. 8 каналов памяти) - но тут тогда вопрос нафига нужны эпики (различие получается только в поддержке регистровой памяти). Либо вообще принципиально другой подход: нужно серьёзно переделывать работу с памятью на уровне архитектуры, но и такого тоже конечно же не будет (разве что когда нибудь в каком нибудь условном zen 5, и то маловероятно).

Чтобы не писать многабукав могу вам предоставить рендер-тест системы с 56ядрами и одним каналом памяти, вы удивитесь но падение производительности там незначительное (как и увеличение канальности памяти до 12 не увеличивает производительности рендера - проверено лично), чтобы вы поняли что там где в тестах производительность упала до уровня 1950 причина не в количестве каналов памяти, а в организации всей подложки.
Посмотрите со стороны приложения на проц - он имеет 64МБ кэша, но приложению никто не сказал что кэш лежит в разных местах, и приложение начинает пихать задачу, а планировщик по кристаллам, не зная что там расстояния в десятки если не сотни тактов.

VINRARUS

Добавлено: 15.08.2018 19:25

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 12.04.2012
Откуда: UA, Чорнобиль.
Фото: 37

Цитата:

Игровой режим Ryzen Master помогает бороться с задержками Ryzen Threadripper при обращении к памяти

В АМДе таки полные отморозки сидят. Может хватить мучить детей клизмой для слона? :angry:

Аникей Сковородкер писал(а):

А в общем надо было ради этого проца все-таки выпустить новый чипсет на базе серверного с 8-и канальной памятью. Пусть даже по одной планке (разъему) на канал.

Найди, ижненер:
#77

_________________
1я блокировка по нац. признаку это ксенофобия. 2я блокировка сразу после 1й по той же причине это уже расизм. 3я такая же будет фашызмом.
Растёте...

matocob

Добавлено: 15.08.2018 20:18

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 85

VINRARUS не ту плату показал
вот более подходящий вариант, и стоит недорого
#77

Добавлено спустя 42 минуты 8 секунд:

motnahp писал(а):

Вы путаете причину и следствие, где-то есть проблемы с производительностью связанная с памятью у однокристальной рязани?

Есть. Повышенная латентность памяти, не? Не слышал? А что? Наличие ИнфинитиФабрик в однокристалльных R7 и R5 уже отменили?
И с чего вдруг Инфинити в однокристалльном процессоре не мешает, в двухкристалльном процессоре - еле заметно, а в 4-кристалльном вдруг падает настолько, что сам разработчик предлагает отключать кристаллы, обделённые контроллерами памяти?

motnahp писал(а):

То что сейчас всплыли проблемы с доступом к КП соседнего кристалла исключительно проблема "канители вокруг кристаллов", если вы сталкивались с настройками серверов, а именно c NUMA, то должны знать о чем я.

1. Они всплыли не сейчас.
2. Сейчас они просто усугубились отсутствием (отключением) на половине кристаллов контроллеров памяти
3. NUMA и архитектура SMP/UMA - две большие разницы, под NUMA пишется специализированное ПО как системное, так и прикладное.
Не понятно зачем АМД позиционирует процессоры с архитектурой NUMA в потребительский сектор, в котором никакой поддержки данной архитектуры попросту нет.
Опять-таки, проблема не в шине, а в специфическом доступе к памяти, который у 2990WX даже NUMA не соответствует, т.к. у двух из четырёх узлов NUMA отсутствует собственная разделяемая память.

Последний раз редактировалось matocob 15.08.2018 21:59, всего редактировалось 1 раз.

VRoman

Добавлено: 15.08.2018 21:13

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 24.11.2002
Откуда: New Mexico, USA
Фото: 37

matocob

matocob писал(а):

Оставшиеся ядра всё равно находятся в двух кристаллах, между которыми исправно действует ИнфинитиФабрик.
Так что, шина между кристаллами тут ни при чём. Всё дело в отключенных каналах памяти и нехватке ПСП для всех кристаллов.

Я полностью согласен с тем, что не хватает скорости памяти. Но почему я виню IF, это за то, что в значительном количестве тестов 2990 сливает своему собрату с двумя активными ядрами и в наихудшем случае 2990 оказывается аж в 2 раза медленнее! Это никак не погрешность измерений. А количество каналов памяти одинаковое. Что память сдерживает дальнейшее масштабирование это всем понятно, но что как не Infinity Fabric заставляет 2990 работать медленнее 2950??

F2000

Добавлено: 15.08.2018 21:31

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 30.06.2005
Откуда: Лефортово
Фото: 1

matocob писал(а):

И с чего вдруг Инфинити в однокристалльном процессоре не мешает, в двухкристалльном процессоре - еле заметно, а в 4-кристалльном вдруг падает настолько, что сам разработчик предлагает отключать кристаллы, обделённые контроллерами памяти?

Может чем больше кристаллов, тем больше по IF надо гонять данных и тем меньше она справляется? Но тогда что мешало АМД сделать шире её.

ZenturionX

Добавлено: 15.08.2018 23:17

[профиль]

Member
Статус: Не в сети
Регистрация: 19.07.2017

VRoman писал(а):

Что память сдерживает дальнейшее масштабирование это всем понятно, но что как не Infinity Fabric заставляет 2990 работать медленнее 2950??

в случае с "в 2!!раза!!!" непривычная софту "топология" в основном. Или ещё какая из кучки причин.
Например та же ГТА5 - фпс на 2990 как раз примерно в 2 раза проседает в обзорах по сравнению с 2950 - виновата ИФ, или винда а то и может сама игра не хочет нормально работать на таком проце? Проблема тупо в НВдия драйвере(со временем наверное пофиксят) - на Веге ФПС в районе ожидаемого.
Это 1й проц с таким количеством ядер/потоков в десктоп ещё и с непривычной компоновкой - то что поначалу многое будет работать через одно место более чем предсказуемо. Да и большинство "обзоров" делалось пусть и далеко не чайниками но людьми с немного/разительно другим профилем. Был кстати где то вдумчивый обзор под разными осями, большой подборкой софта(включая довольно узкоспециализированный), параллельной загрузкой ресурсоёмкими приложениями итд. Всё довольно однозначно - продукт ну очень нишевый но в этой своей нише он шикарен.

VRoman

Добавлено: 16.08.2018 3:18

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 24.11.2002
Откуда: New Mexico, USA
Фото: 37

ZenturionX Поспорю на 100 баксов, что в случае с 28-ядерным процом от Интел провалов по сравнению с их 18-ядерником не будет. Если какая-то разница и будет, то она будет сопоставима разнице в частотах.

matocob

Добавлено: 16.08.2018 4:33

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 85

VRoman писал(а):

Но почему я виню IF, это за то, что в значительном количестве тестов 2990 сливает своему собрату с двумя активными ядрами и в наихудшем случае 2990 оказывается аж в 2 раза медленнее!

Так ведь нет никакой разницы между 2950 и 2990 в режиме с отключенными кристаллами без контроллеров памяти! Топология у этих процессоров одинаковая!

VRoman писал(а):

А количество каналов памяти одинаковое.

Именно. Архитектура NUMA предполагает доступ к общей памяти с наименьшими задержками внутри узла, а у 2990 этого нет, т.к. контроллеры памяти внутри 2 из 4 узлов отключены! Это уже не NUMA, а чёрт знает что, где упомянутые 2 узла без КП имеют только задержку обращения к "чужому" блоку памяти!

F2000 писал(а):

У каждого кристалла 3 коммутатора с соседями, для 4-х кристаллов это означает связь "все со всеми", т.е. полносвязную сеть. Куда ещё шире?
#77
Проблема, как я неоднократно уже писал, именно в отсутствующих контроллерах памяти, превращающих NUMA неизвестно во что!

VRoman писал(а):

Поспорю на 100 баксов, что в случае с 28-ядерным процом от Интел провалов по сравнению с их 18-ядерником не будет. Если какая-то разница и будет, то она будет сопоставима разнице в частотах.

В случае шины Mesh ситуация более размытая, т.к. всё это происходит внутри одного кристалла, но разница во времени доступа между ближними и дальними ядрами есть, т.к. задержки зависят от длины пути к одному из двух двухканальных КП. Это означает, что задержки при увеличении числа ядер растут, только в связи с тем что
это происходит внутри одного кристалла, задержки эти почти на порядок ниже 25-30 нс (в кремнии) против 200-250 нс (в текстолите). А теперь сами посчитайте, сколько прыжков нужно, чтобы добраться до двухканального КП какому-нибудь из 28 ядер, которые располагаются в решётке 6х5. Оптимальным числом ядер тут тоже будет 16, т.к. для 10 из 16 ядер путь до одного из КП окажется кратчайшим.
#77

ZenturionX писал(а):

Например та же ГТА5 - фпс на 2990 как раз примерно в 2 раза проседает в обзорах по сравнению с 2950 - виновата ИФ

Для альтернативно одарённых я уже разжевал, что виновата не ИФ, а:
1. Отсутствие локальной памяти NUMA (КП) в 2 узлах из 4
2. Деление процессора на 4 кристалла и громадные задержки между кристаллами
И да, тестировать NUMA с помощью приложений для SMT/UMA - это от большого ума, конечно. :lol:

Последний раз редактировалось matocob 16.08.2018 5:34, всего редактировалось 1 раз.

ZenturionX

Добавлено: 16.08.2018 5:30

[профиль]

Member
Статус: Не в сети
Регистрация: 19.07.2017

VRoman писал(а):

Если найдёте с кем - поспорьте конечно. Хотя влёгкую можно и попасть на 100ку.

Добавлено спустя 5 минут 11 секунд:

matocob писал(а):

ZenturionX писал(а):
Например та же ГТА5 - фпс на 2990 как раз примерно в 2 раза проседает в обзорах по сравнению с 2950 - виновата ИФ

Для альтернативно одарённых я уже разжевал, что виновата не ИФ, а:

Зачем так вырывать из контекста?

matocob

Добавлено: 16.08.2018 8:17

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 85

ZenturionX писал(а):

Зачем так вырывать из контекста?

Хорошо, объясню подробно.
Когда вы заводите речь о "топологии", вы как-то упускаете из виду что связи внутри 2950 и 2990 одни и те же.
Так какая тогда "топология"? Тут разница архитектурная, когда у 2 из 4 узлов отняли свой блок памяти и заставили работать с чужим.
UMA-приложения, такие как GTA5, прекрасно чувствуют себя на NUMA-процессорах, да производительность на них ниже, но не настолько.
Разница между 2950 и 2990 не в IF, а в числе контроллеров памяти на кристалл, где-то их 2, а где-то 0, IF при этом присутствует в обоих процессорах, причём как внутри кристаллов, так и снаружи.
И только из-за того что КП распределены по схеме 2-0-2-0 мы имеем возможность наблюдать задержки между кристаллами, т.к. у части кристаллов нет собственной общей памяти на 8 ядер, а кэша L3, который тоже общий для ядер внутри кристалла, явно недостаточно

Новая тема /

Закрыто

Сообщений: 42 • Страница 2 из 3 • < 1 2 3 >

Список форумов » Сайт и конференция » Материалы сайта » Обсуждение новостей

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 42

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:

Игровой режим Ryzen Master помогает бороться с задержками Ryzen Threadripper при обращении к памяти

Кто сейчас на конференции

Лаборатория

Обзор ноутбука ASUS Zenbook DUO (UX8406)

Обзор и тестирование модульного блока питания MSI MAG A850GL PCIE5

Обзор и тестирование процессорного кулера APNX AP1-V

Обзор и тестирование материнской платы MSI Z790 Gaming Plus WIFI

Обзор и тестирование смартфона Honor X9b 5G

Новости