Member
Статус: Не в сети Регистрация: 24.05.2016 Откуда: Arstotzka Фото: 0
cide писал(а):
ты покупай, покупай, потом узнаешь ололо
Вероятно недостаточно частиц "бы" употребил. В следующий раз наверное стоит уточнять словом "гипотетически" или "предполагаю". Я недостаточно богат для смены платформы на систему с одним камнем за 2к грина вслепую)
matocob писал(а):
Удар по Эпикам: если функционал тот же, а денег в 2 раза меньше, то "если не видно разницы, то зачем платить больше?"(с)
Потому что у них нет поддержки ECC и для серверов все-равно придется покупать эпики?
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 85
Аникей Сковородкер писал(а):
А в общем надо было ради этого проца все-таки выпустить новый чипсет на базе серверного с 8-и канальной памятью.
Чипсет тут ни при чём. Контроллеры памяти находятся в процессоре, и ничто кроме жадности не мешает развести на плату все 8
Добавлено спустя 2 минуты 7 секунд:
ByBy3eKa писал(а):
Потому что у них нет поддержки ECC и для серверов все-равно придется покупать эпики?
Для серверов начального уровня не нужны ни Эпики, ни платы под них, насколько знаю, Тредрипперы ЕСС поддерживают, не поддерживают только регистровую память.
Member
Статус: Не в сети Регистрация: 19.05.2017 Откуда: Minsk
ByBy3eKa писал(а):
что мешало оставить 8 каналов памяти
Т.е. вы считаете что АМД - "сам себе злобный буратино", чтобы выпускать проц для десктопа, у которого будет абсолютно тот же функционал и та же "мощность" что и у гораздо более дорого серверного процессора? По сути сделай они то что вы хотите и получился бы практически (а добавь они ещё и поддержку регистровой памяти - было бы и без "практически") полный клон уже год как существующего эпика, с той лишь разницей что этот был бы ещё и лучше: ибо кристаллы тут zen+, а не zen как в эпиках.
Последний раз редактировалось BOIN 15.08.2018 11:03, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 24.05.2016 Откуда: Arstotzka Фото: 0
matocob писал(а):
Для серверов начального уровня не нужны ни Эпики, ни платы под них, насколько знаю, Тредрипперы ЕСС поддерживают, не поддерживают только регистровую память.
6000 в r15 - интересный начальный уровень, видать кто с чем сравнивает) matocob, BOIN Интелам никто не помешал 3647 точно так же начать превращать в декстоп и конкурировать со своими серваками по такой логике. Не считаю, что кастрировать половину ядер на подсистему памяти было лучшим решением, чтобы развести серверный и потреб сегмент для рабочих станций.
Member
Статус: Не в сети Регистрация: 29.01.2008 Фото: 0
matocob писал(а):
Контроллеры памяти находятся в процессоре, и ничто кроме жадности не мешает развести на плату все 8
да ладно))). Ты это интелу скажи с его недо-2066, в котором половина слотов не работает если стоит проц с двухканалом, объясни на пальцах как это сделать. Разводка памяти на плате, а потому там неоткуда "вдруг" взяться разводке на еще 4 канала. Ну и в 4х каналах они сейчас не могут разобраться, а что будет с 8-ю! И да, это ситуацию с "кроссдоступом" не изменит, проблему надо решать в работе межпроцессорных связей и организации планировщика, возможно это будет решено с очередным обновлением БИОС и ОС.
Member
Статус: Не в сети Регистрация: 19.05.2017 Откуда: Minsk
Joestar писал(а):
Как всегда у амде одни костыли. Недопроцы для игры в бенчмарки.
16- "ядрёный" проц у них, имхо, получился более чем нормальный и универсальный, особенно если учесть цену на него и на аналоги у интелла. Разумеется это вещь не для игр, для игр есть платформа AM4. Проблема у них только с 32 ядерным (и, видимо, такая же будет с 24 ядерником) из-за нехватки каналов памяти, в результате и получился достаточно специфический проц, который в одних задачах лучше чем все что есть на данный момент в это классе, а в других - сливает чуть ли не мэйнстрим процам (слегка утрирую но всё же).
Цитата:
Интелам никто не помешал 3647 точно так же начать превращать в декстоп и конкурировать со своими серваками по такой логике. Не считаю, что кастрировать половину ядер на подсистему памяти было лучшим решением, чтобы развести серверный и потреб сегмент для рабочих станций.
Так вроде xeon'ы на 3647 - это серверные процы у них, разве нет? В десктопе же пока ещё только hedt на 2066... Или я уже "отстал от жизни" и чего то не знаю?
Member
Статус: Не в сети Регистрация: 29.01.2008 Фото: 0
BOIN писал(а):
Так вроде xeon'ы на 3647 - это серверные процы у них, разве нет? В десктопе же пока ещё только hedt на 2066... Или я уже "отстал от жизни" и чего то не знаю?
чуток отстал, планируют новую платформу вывести на X599 под 3647 к концу года, но это не точно.
Добавлено спустя 3 минуты 46 секунд:
BOIN писал(а):
из-за нехватки каналов памяти
Не в этом проблема, интеловские процы спокойно обходятся и 2/4-мя каналами на проц, проблема в организации всей этой канители вокруг кристаллов.
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 85
motnahp писал(а):
Не в этом проблема, интеловские процы спокойно обходятся и 2/4-мя каналами на проц, проблема в организации всей этой канители вокруг кристаллов.
1.Интеловские процы - это интеловские процы, подсистема памяти у них всегда была сильнее чем у АМД, 2.Как бы "канитель вокруг кристаллов" не сильно мешает 1950Х и 1920Х, где у каждого кристалла 2 КП. А когда к кривизне КП добавляются ещё и задержки шины, тогда мы и видим ахиллесову пяту 2990WX, в качестве костылей для которой предлагают использовать отключение кристаллов без КП и правку временных диаграмм работы с памятью в очередных AGESA
Member
Статус: Не в сети Регистрация: 19.05.2017 Откуда: Minsk
motnahp писал(а):
чуток отстал, планируют новую платформу вывести на X599 под 3647 к концу года, но это не точно.
Про "планируют" я в курсе, именно потому и сказал что ещё ничего ни в продаже, ни в обзорах, ни даже в сливах спецификации нету, так что давайте "не будем делить шкуру не убитого медведя". Когда выпустят тогда и посмотрим что там будет и какие будут отличия от серверов. Пока это всё только слухи и никакой конкретики. Да и помимо всего прочего - я более чем уверен что 28 ядер будут выпущены именно в ответ на TR4, без него было бы нам 16\18 ядер в hedt, а остальное только в серверах. В любом случае будет либо сразу бешеная цена (т.е. это и будет обычный серверный камень), либо какие-то серьёзные отличия от серверных платформ.
motnahp писал(а):
Не в этом проблема, интеловские процы спокойно обходятся и 2/4-мя каналами на проц, проблема в организации всей этой канители вокруг кристаллов.
Тут проблема и в одном и во втором. Т.е.: при данной организации что у них есть сейчас (но да, сделали они знатную хрень) нужна большая пропускная способность (она получается в 2 раза ниже чем в 16 ядерном аналоге у которого таких проблем нет) и её уже очень не хватает (потому и "тупит" проц везде где нужна быстрая работа с ОЗУ). Либо нужно на каждый кристалл свой КП (т.е. 8 каналов памяти) - но тут тогда вопрос нафига нужны эпики (различие получается только в поддержке регистровой памяти). Либо вообще принципиально другой подход: нужно серьёзно переделывать работу с памятью на уровне архитектуры, но и такого тоже конечно же не будет (разве что когда нибудь в каком нибудь условном zen 5, и то маловероятно). В итоге из-за этого и получили узкоспециализированный 32 ядерный проц и относительно универсальный 16 ядерный.
Member
Статус: Не в сети Регистрация: 29.01.2008 Фото: 0
matocob писал(а):
2.Как бы "канитель вокруг кристаллов" не сильно мешает 1950Х и 1920Х, где у каждого кристалла 2 КП.
о чем и речь, в случае 1950 получаем схему 2-сокетной системы, а в случае 2990 - 4 сокета, где 2 проца иногда плавают как говно в проруби из-за обращения по любому поводу к соседнему кристаллу.
matocob писал(а):
2.Как бы "канитель вокруг кристаллов" не сильно мешает 1950Х и 1920Х, где у каждого кристалла 2 КП. А когда к кривизне КП добавляются ещё и задержки шины, тогда мы и видим ахиллесову пяту 2990WX, в качестве костылей для которой предлагают использовать отключение кристаллов без КП и правку временных диаграмм работы с памятью в очередных AGESA
Вы путаете причину и следствие, где-то есть проблемы с производительностью связанная с памятью у однокристальной рязани? То что сейчас всплыли проблемы с доступом к КП соседнего кристалла исключительно проблема "канители вокруг кристаллов", если вы сталкивались с настройками серверов, а именно c NUMA, то должны знать о чем я.
BOIN писал(а):
Да и помимо всего прочего - я более чем уверен что 28 ядер будут выпущены именно в ответ на TR4, без него было бы нам 16\18 ядер в hedt, а остальное только в серверах. В любом случае будет либо сразу бешеная цена (т.е. это и будет обычный серверный камень), либо какие-то серьёзные отличия от серверных платформ.
Вообще не понимаю почему все пихают 3647 в серверный сегмент, когда они есть еще и в рабочих станциях, куда как раз таки и метит АМД со своим 2990.
BOIN писал(а):
ут проблема и в одном и во втором. Т.е.: при данной организации что у них есть сейчас (но да, сделали они знатную хрень) нужна большая пропускная способность (она получается в 2 раза ниже чем в 16 ядерном аналоге у которого таких проблем нет) и её уже очень не хватает (потому и "тупит" проц везде где нужна быстрая работа с ОЗУ). Либо нужно на каждый кристалл свой КП (т.е. 8 каналов памяти) - но тут тогда вопрос нафига нужны эпики (различие получается только в поддержке регистровой памяти). Либо вообще принципиально другой подход: нужно серьёзно переделывать работу с памятью на уровне архитектуры, но и такого тоже конечно же не будет (разве что когда нибудь в каком нибудь условном zen 5, и то маловероятно).
Чтобы не писать многабукав могу вам предоставить рендер-тест системы с 56ядрами и одним каналом памяти, вы удивитесь но падение производительности там незначительное (как и увеличение канальности памяти до 12 не увеличивает производительности рендера - проверено лично), чтобы вы поняли что там где в тестах производительность упала до уровня 1950 причина не в количестве каналов памяти, а в организации всей подложки. Посмотрите со стороны приложения на проц - он имеет 64МБ кэша, но приложению никто не сказал что кэш лежит в разных местах, и приложение начинает пихать задачу, а планировщик по кристаллам, не зная что там расстояния в десятки если не сотни тактов.
Member
Статус: Не в сети Регистрация: 12.04.2012 Откуда: UA, Чорнобиль. Фото: 37
Цитата:
Игровой режим Ryzen Master помогает бороться с задержками Ryzen Threadripper при обращении к памяти
В АМДе таки полные отморозки сидят. Может хватить мучить детей клизмой для слона?
Аникей Сковородкер писал(а):
А в общем надо было ради этого проца все-таки выпустить новый чипсет на базе серверного с 8-и канальной памятью. Пусть даже по одной планке (разъему) на канал.
Найди, ижненер: #77
_________________ 1я блокировка по нац. признаку это ксенофобия. 2я блокировка сразу после 1й по той же причине это уже расизм. 3я такая же будет фашызмом. Растёте...
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 85
VINRARUS не ту плату показал вот более подходящий вариант, и стоит недорого #77
Добавлено спустя 42 минуты 8 секунд:
motnahp писал(а):
Вы путаете причину и следствие, где-то есть проблемы с производительностью связанная с памятью у однокристальной рязани?
Есть. Повышенная латентность памяти, не? Не слышал? А что? Наличие ИнфинитиФабрик в однокристалльных R7 и R5 уже отменили? И с чего вдруг Инфинити в однокристалльном процессоре не мешает, в двухкристалльном процессоре - еле заметно, а в 4-кристалльном вдруг падает настолько, что сам разработчик предлагает отключать кристаллы, обделённые контроллерами памяти?
motnahp писал(а):
То что сейчас всплыли проблемы с доступом к КП соседнего кристалла исключительно проблема "канители вокруг кристаллов", если вы сталкивались с настройками серверов, а именно c NUMA, то должны знать о чем я.
1. Они всплыли не сейчас. 2. Сейчас они просто усугубились отсутствием (отключением) на половине кристаллов контроллеров памяти 3. NUMA и архитектура SMP/UMA - две большие разницы, под NUMA пишется специализированное ПО как системное, так и прикладное. Не понятно зачем АМД позиционирует процессоры с архитектурой NUMA в потребительский сектор, в котором никакой поддержки данной архитектуры попросту нет. Опять-таки, проблема не в шине, а в специфическом доступе к памяти, который у 2990WX даже NUMA не соответствует, т.к. у двух из четырёх узлов NUMA отсутствует собственная разделяемая память.
Последний раз редактировалось matocob 15.08.2018 21:59, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 24.11.2002 Откуда: New Mexico, USA Фото: 37
matocob
matocob писал(а):
Оставшиеся ядра всё равно находятся в двух кристаллах, между которыми исправно действует ИнфинитиФабрик. Так что, шина между кристаллами тут ни при чём. Всё дело в отключенных каналах памяти и нехватке ПСП для всех кристаллов.
Я полностью согласен с тем, что не хватает скорости памяти. Но почему я виню IF, это за то, что в значительном количестве тестов 2990 сливает своему собрату с двумя активными ядрами и в наихудшем случае 2990 оказывается аж в 2 раза медленнее! Это никак не погрешность измерений. А количество каналов памяти одинаковое. Что память сдерживает дальнейшее масштабирование это всем понятно, но что как не Infinity Fabric заставляет 2990 работать медленнее 2950??
Member
Статус: Не в сети Регистрация: 30.06.2005 Откуда: Лефортово Фото: 1
matocob писал(а):
И с чего вдруг Инфинити в однокристалльном процессоре не мешает, в двухкристалльном процессоре - еле заметно, а в 4-кристалльном вдруг падает настолько, что сам разработчик предлагает отключать кристаллы, обделённые контроллерами памяти?
Может чем больше кристаллов, тем больше по IF надо гонять данных и тем меньше она справляется? Но тогда что мешало АМД сделать шире её.
Что память сдерживает дальнейшее масштабирование это всем понятно, но что как не Infinity Fabric заставляет 2990 работать медленнее 2950??
в случае с "в 2!!раза!!!" непривычная софту "топология" в основном. Или ещё какая из кучки причин. Например та же ГТА5 - фпс на 2990 как раз примерно в 2 раза проседает в обзорах по сравнению с 2950 - виновата ИФ, или винда а то и может сама игра не хочет нормально работать на таком проце? Проблема тупо в НВдия драйвере(со временем наверное пофиксят) - на Веге ФПС в районе ожидаемого. Это 1й проц с таким количеством ядер/потоков в десктоп ещё и с непривычной компоновкой - то что поначалу многое будет работать через одно место более чем предсказуемо. Да и большинство "обзоров" делалось пусть и далеко не чайниками но людьми с немного/разительно другим профилем. Был кстати где то вдумчивый обзор под разными осями, большой подборкой софта(включая довольно узкоспециализированный), параллельной загрузкой ресурсоёмкими приложениями итд. Всё довольно однозначно - продукт ну очень нишевый но в этой своей нише он шикарен.
Member
Статус: Не в сети Регистрация: 24.11.2002 Откуда: New Mexico, USA Фото: 37
ZenturionX Поспорю на 100 баксов, что в случае с 28-ядерным процом от Интел провалов по сравнению с их 18-ядерником не будет. Если какая-то разница и будет, то она будет сопоставима разнице в частотах.
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 85
VRoman писал(а):
Но почему я виню IF, это за то, что в значительном количестве тестов 2990 сливает своему собрату с двумя активными ядрами и в наихудшем случае 2990 оказывается аж в 2 раза медленнее!
Так ведь нет никакой разницы между 2950 и 2990 в режиме с отключенными кристаллами без контроллеров памяти! Топология у этих процессоров одинаковая!
VRoman писал(а):
А количество каналов памяти одинаковое.
Именно. Архитектура NUMA предполагает доступ к общей памяти с наименьшими задержками внутри узла, а у 2990 этого нет, т.к. контроллеры памяти внутри 2 из 4 узлов отключены! Это уже не NUMA, а чёрт знает что, где упомянутые 2 узла без КП имеют только задержку обращения к "чужому" блоку памяти!
F2000 писал(а):
Может чем больше кристаллов, тем больше по IF надо гонять данных и тем меньше она справляется? Но тогда что мешало АМД сделать шире её.
У каждого кристалла 3 коммутатора с соседями, для 4-х кристаллов это означает связь "все со всеми", т.е. полносвязную сеть. Куда ещё шире? #77 Проблема, как я неоднократно уже писал, именно в отсутствующих контроллерах памяти, превращающих NUMA неизвестно во что!
VRoman писал(а):
Поспорю на 100 баксов, что в случае с 28-ядерным процом от Интел провалов по сравнению с их 18-ядерником не будет. Если какая-то разница и будет, то она будет сопоставима разнице в частотах.
В случае шины Mesh ситуация более размытая, т.к. всё это происходит внутри одного кристалла, но разница во времени доступа между ближними и дальними ядрами есть, т.к. задержки зависят от длины пути к одному из двух двухканальных КП. Это означает, что задержки при увеличении числа ядер растут, только в связи с тем что это происходит внутри одного кристалла, задержки эти почти на порядок ниже 25-30 нс (в кремнии) против 200-250 нс (в текстолите). А теперь сами посчитайте, сколько прыжков нужно, чтобы добраться до двухканального КП какому-нибудь из 28 ядер, которые располагаются в решётке 6х5. Оптимальным числом ядер тут тоже будет 16, т.к. для 10 из 16 ядер путь до одного из КП окажется кратчайшим. #77
ZenturionX писал(а):
Например та же ГТА5 - фпс на 2990 как раз примерно в 2 раза проседает в обзорах по сравнению с 2950 - виновата ИФ
Для альтернативно одарённых я уже разжевал, что виновата не ИФ, а: 1. Отсутствие локальной памяти NUMA (КП) в 2 узлах из 4 2. Деление процессора на 4 кристалла и громадные задержки между кристаллами И да, тестировать NUMA с помощью приложений для SMT/UMA - это от большого ума, конечно.
Последний раз редактировалось matocob 16.08.2018 5:34, всего редактировалось 1 раз.
ZenturionX Поспорю на 100 баксов, что в случае с 28-ядерным процом от Интел провалов по сравнению с их 18-ядерником не будет. Если какая-то разница и будет, то она будет сопоставима разнице в частотах.
Если найдёте с кем - поспорьте конечно. Хотя влёгкую можно и попасть на 100ку.
Добавлено спустя 5 минут 11 секунд:
matocob писал(а):
ZenturionX писал(а): Например та же ГТА5 - фпс на 2990 как раз примерно в 2 раза проседает в обзорах по сравнению с 2950 - виновата ИФ
Для альтернативно одарённых я уже разжевал, что виновата не ИФ, а:
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 85
ZenturionX писал(а):
Зачем так вырывать из контекста?
Хорошо, объясню подробно. Когда вы заводите речь о "топологии", вы как-то упускаете из виду что связи внутри 2950 и 2990 одни и те же. Так какая тогда "топология"? Тут разница архитектурная, когда у 2 из 4 узлов отняли свой блок памяти и заставили работать с чужим. UMA-приложения, такие как GTA5, прекрасно чувствуют себя на NUMA-процессорах, да производительность на них ниже, но не настолько. Разница между 2950 и 2990 не в IF, а в числе контроллеров памяти на кристалл, где-то их 2, а где-то 0, IF при этом присутствует в обоих процессорах, причём как внутри кристаллов, так и снаружи. И только из-за того что КП распределены по схеме 2-0-2-0 мы имеем возможность наблюдать задержки между кристаллами, т.к. у части кристаллов нет собственной общей памяти на 8 ядер, а кэша L3, который тоже общий для ядер внутри кристалла, явно недостаточно
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 42
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения