Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 319 • Страница 9 из 16<  1 ... 6  7  8  9  10  11  12 ... 16  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 28.02.2008
Откуда: Калининград
Фото: 99
ZeroCooolX писал(а):
Вопрос как раз и заключается в том, как осуществлён общий доступ к L3 внутри одного ССX, ведь он состоит из 4 блоков. Ядрам нечем обмениваться, кроме данных в L3.


Ну раз нет никакой кольцевой шины или mesh и задержки доступа каждого ядра к каждой части кэша равны, значит там прямые линки одинаковой "длины" и пропускной способности. И топология этих линков сильно усложнится увеличь мы число ядер в CCX до 6 или 8. Shared L3 cache в данном контексте имхо означает как раз возможность доступа каждого ядра к всему адресному пространству L3 с одинаковыми задержками. При 6 и более ядрах, обеспечить такую возможность будет уже гораздо труднее.
Intel как мы знаем, использует кольцевую шину для объединения ядер и их кэшей в общий комплекс (и это не мешает ему также называть свой L3 "shared"), но в CCX AMD нет аналога кольцевой шины.

Hexa core CFL
#77

_________________
пятачок его свинейшества



Партнер
 

Member
Статус: Не в сети
Регистрация: 06.10.2009
Откуда: Россия
Фото: 4
k2viper, есть одно отличие, Intel использует эти шины для связи L3 с I/O - шина универсальна. AMD - нет, использует внешнюю для CCX IF. А значит, блоки L3 должны быть объединены, возможно без сквозных шин.
Цитата:
И топология этих линков сильно усложнится увеличь мы число ядер в CCX до 6 или 8. Shared L3 cache в данном контексте имхо означает как раз возможность доступа каждого ядра к всему адресному пространству L3 с одинаковыми задержками. При 6 и более ядрах, обеспечить такую возможность будет уже гораздо труднее.

Я не отрицаю, что будет сложнее. Но само понятие "линков" между ядрами - абстрактно. Есть доступ к L3 и обмен данными через него, а значит и сейчас нет никаких "прямых линков".


 

Member
Статус: Не в сети
Регистрация: 28.02.2008
Откуда: Калининград
Фото: 99
ZeroCooolX писал(а):
Но само понятие "линков" между ядрами - абстрактно. Есть доступ к L3 и обмен данными через него, а значит и сейчас нет никаких "прямых линков".


Хз. Внимательное рассмотрение структуры кэша что у AMD что у Intel показывает что ни те ни другие не используют реально "монолитный" блок L3 кэша. Так или иначе и у интела и у амд кэш состоит из долей (slices), и если Интел прямо упоминает что для их соединения и соединения остальных блоков на SoC используется Ring, то у АМД нет прямого официального упоминания структуры соединений долей кэша.
Есть только косвенные упоминания на том самом слайде АМД, где визуально изображено что-то напоминающее "полную решетку mesh" где каждая доля соединена с каждой другой долей. Физически, похоже эти соединения отмечены на слайдах как L3 CTL. И их по странному совпадению даже 6 штук :)
Какой-то аналог Ring bus нужен АМД, короче говоря. И судя по их последним патентам, они немало сил вложили именно в разработку этих самых interconnects, так что вполне возможно что у АМД уже есть рабочий вариант своего собственного ring-mesh.

слайд CCX
#77

_________________
пятачок его свинейшества


 

Member
Статус: Не в сети
Регистрация: 24.11.2002
Откуда: New Mexico, USA
Фото: 42
Наконец-то интересное дельное обсуждение пошло. Между ядрами связи вроде как нет, но каждое ядро имеет равный доступ к 4м частям L3 кэша, что и изображено на слайдах. Одна часть "своя" и три "чужих". Если количество ядер вырастет, то пропорционально увеличится количество линков к кэшу. Тут будет логично предположить, что с ростом числа ядер вырастет общий размер L3. Но тогда возникнет вопрос, как его будут увеличивать? Я бы предположил, что в нём пропорционально будет увеличено число блоков по 2 мега на ядро. И в этом случае равноправная связь ядер со всеми частями кэша станет куда более комплексной, имея по 7 линков на ядро к "чужой" части кэша.
И соглашусь, что показывают близкий предел масштабируемости архитектуры в том виде как она сегодня есть. Большое число кристаллов на проц дома совсем ни к чему и частенько может быть хуже от 4х кристаллов в нагрузке под одной программой. 8 ядер на модуль и два модуля на кристалл кажется оптимальным решением, или может 4 модуля на кристалл если каналов памяти добавят. "Беспамятные" кристаллы идут хорошо как собаке пятая нога. Ими ещё надо суметь воспользоваться.


 

Member
Статус: Не в сети
Регистрация: 05.09.2013
первый квартал 2019г? теперь я знаю точную дату смерти интела.

_________________
amd ryzen 2700/gigabyte b450i/patriot viper 4 3600/radeon rx5700xt/thermaltake cologone 730w


 

Member
Статус: Не в сети
Регистрация: 28.02.2008
Откуда: Калининград
Фото: 99
kilosbxl писал(а):
первый квартал 2019г? теперь я знаю точную дату смерти интела.


Просто "2019г", причем для Rome обозначен релиз 2H2019, а настольные по утверждению самой АМД, должны выйти после серверных.
Так что рано хороните.
Да и точные хар-ки, цены и частоты не понятны. Что если там будет +10-15% всего включая и прирост частоты и прирост IPC?

VRoman писал(а):
Если количество ядер вырастет, то пропорционально увеличится количество линков к кэшу. Тут будет логично предположить, что с ростом числа ядер вырастет общий размер L3. Но тогда возникнет вопрос, как его будут увеличивать? Я бы предположил, что в нём пропорционально будет увеличено число блоков по 2 мега на ядро. И в этом случае равноправная связь ядер со всеми частями кэша станет куда более комплексной, имея по 7 линков на ядро к "чужой" части кэша.


Именно про это я и писал. Причем число необходимых линков растет в геометрической прогрессии. При 4 ядрах нужно 6 линков, при 6 ядрах уже 15(!), а при 8 даже не стал считать. Топология внутри CCX адски усложняется.
Поэтому AMD и нужен свой аналог Ring bus транспорта, если они хотят увеличивать число ядер в CCX.

Однако можно ведь нарастить число ядер, не увеличивая размер CCX - просто сделать не два, а три/четыре CCX на кристалл.
Но я допускаю и что они вовсе откажутся от структуры с CCX либо кардинально его переработают, например посадив все ядра, SDF и I/O HUB на новую общую шину (аналог Ring bus). Ну, будет слегка заимствование Интеловской топологии, ну а что теперь, это не впервой 8-)

_________________
пятачок его свинейшества


 

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 124
k2viper писал(а):
при 8 даже не стал считать

(N-1)*N/2 = 28
проблема не в том что растёт число связей, а в том, что кратно увеличивается их протяжённость с соответствующими проблемами задержек и синхронизации
k2viper писал(а):
Но я допускаю и что они вовсе откажутся от структуры с CCX либо кардинально его переработают, например посадив все ядра, SDF и I/O HUB на новую общую шину (аналог Ring bus).

Кольцевая шина - это тупик, от которого и сама Интел отказалась в пользу меша, а сейчас рассматривает альтернативы и мешу.
Так что от группировки ядер никто не отказывается. К тому же, АМД активно продвигает идею разнородных ядер внутри кристалла.


 

Member
Статус: Не в сети
Регистрация: 28.02.2008
Откуда: Калининград
Фото: 99
matocob писал(а):
Кольцевая шина - это тупик, от которого и сама Интел отказалась в пользу меша, а сейчас рассматривает альтернативы и мешу.
Так что от группировки ядер никто не отказывается. К тому же, АМД активно продвигает идею разнородных ядер внутри кристалла.


Кольцевая шина тупик для больших ЦПУ монолитной компоновки, испольуемой Интелом, а в рамках одного CCX на 4-8 ядер она может работать вполне эффективно, что собственно и демонстрирует Интел.
Ну и всегда остается вариант собрать больше двух CCX на одном кристалле. И будут желанные 12(16) ядер.

Интел, к слову, тоже активно работает в направлении разнородных структур внутри кристалла. А также многослойных кристаллов где разные слои производятся по разным технологическим нормам.

_________________
пятачок его свинейшества


 

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 124
k2viper писал(а):
Кольцевая шина тупик для больших ЦПУ монолитной компоновки

Не совсем. Кольцевая шина имеет одну особенность - чем больше устройств на ней висит, тем хуже она работает и больше ресурсов придётся потратить на обеспечение её работы. Потому Интел и вывела для себя технический предел - 10 или 12 ядер на шине (помимо ядер там и другие устройства болтаются)


 

Member
Статус: Не в сети
Регистрация: 21.04.2005
Откуда: Москва
Фото: 57
k2viper писал(а):
Просто "2019г", причем для Rome обозначен релиз 2H2019, а настольные по утверждению самой АМД, должны выйти после серверных.

2H это вторая половина 2019. Тогда как еще с конца 2017 по роадмапу/прикидкам, первые образцы появятся в Q42018 (уже пошли инженерники утекать), а сами процы в Q12019. По свидетельству некоторых инсайдеров, то январь полу-бумага, февраль продажи. Можно ссылочку на первоисточник? А то не раз уже слышал. Только без Лексагона и его аналитиков.

Добавлено спустя 5 минут 55 секунд:
k2viper писал(а):
Что если там будет +10-15% всего включая и прирост частоты и прирост IPC?

10% это у Zen->Zen+, лайтовый рефрешь архитектуры/тп. Т.е. ты прогнозируешь, что от смены "мобильного" ТП уровня 16нм -> на лидершипный 7nm и сильного апгрейда проца, получится тоже самое? :spy:

_________________
◼️2016 YEAR: GTX 1080/8GB - 499$◼️2019 YEAR: VEGA 56/8GB - 299$ (+52% p/p)◼️ЖДУН Next-Gen`a 8GB +75% p/p 🌐bit.do/eYWD5.⚠️Не корми икрой Хуанга/Лизу!


 

Member
Статус: Не в сети
Регистрация: 14.01.2011
XRR писал(а):
10% это у Zen->Zen+, лайтовый рефрешь архитектуры/тп. Т.е. ты прогнозируешь, что от смены "мобильного" ТП уровня 16нм -> на лидершипный 7nm и сильного апгрейда проца, получится тоже самое?


У интеля вон при попытке смены 14 на 10 получилось даже не то же самое, а хуже чем было. И Zen+ уже не на "мобильном" ТП.

_________________
Gigabyte UG 2.0-OP/i5-9600K 5000Mhz/Captain 240EX/PA-GTX1060 Dual 6G 1950Mhz/DDR4 3200MHz 16GB Patriot/THNSNH128GCST/LG 49LB629V/Seasonic SSR-650FX


 

Member
Статус: Не в сети
Регистрация: 21.04.2005
Откуда: Москва
Фото: 57
hendehog писал(а):
У интеля вон при попытке смены 14 на 10 получилось

Так причем тут "интель"? Что он не шмог общеизвестно.

hendehog писал(а):
И Zen+ уже не на "мобильном" ТП.

Основа та же самая, что ее лениво перевели на "хай перформанс" лыжи с большими утечками, не сильно поменяло дело.

Цитата:
12LP is a series of minor tweaks to 14LPP, relating to performance bumps and improvements that come from a partial optical shrink and a slight change in manufacturing rules in the middle-line and back-end of the manufacturing process.

_________________
◼️2016 YEAR: GTX 1080/8GB - 499$◼️2019 YEAR: VEGA 56/8GB - 299$ (+52% p/p)◼️ЖДУН Next-Gen`a 8GB +75% p/p 🌐bit.do/eYWD5.⚠️Не корми икрой Хуанга/Лизу!


 

Member
Предупреждение 
Статус: Не в сети
Регистрация: 27.01.2008
Откуда: Deep Space
Фото: 25
hendehog писал(а):
У интеля вон при попытке смены

А что такое "интелЪ"? AMD уже во всю выпускает 32 ядра на старые мат.платы, а "интелЪ" никак 8 ядер в домашний десктоп не может выпустить и 10 нм. никак не освоит что-бы без брака. Это то же самое что приводить в пример "Почту России" только называть её "интелЪ".

_________________
-=AMD POWER FAN CLUB=- *AMD OverClan*


 

Member
Статус: Не в сети
Регистрация: 12.03.2003
Откуда: Калининград
SATelit писал(а):
AMD уже во всю выпускает 32 ядра на старые мат.платы

SATelit писал(а):
а "интелЪ" никак 8 ядер в домашний десктоп не может выпустить

В огороде бузина а в Киеве дядька.
Каким образом 32 ядра в HEDT и серверном сегменте относятся к "домашнему" сегменту ?
А так то да - отличное, и, главное, верное сравнение.

_________________
Lorichic писал(а):Память покупается на весь срок жизни.
АМ4 - Сокет свободных людей (с)XRR
14600kf\Zotac 5070ti Solid Core OC\2x16Gb DDR4-3200@4000CL16


 

Member
Предупреждение 
Статус: Не в сети
Регистрация: 27.01.2008
Откуда: Deep Space
Фото: 25
cypher1999 писал(а):
Каким образом 32 ядра в HEDT и серверном сегменте относятся к "домашнему" сегменту ?

Вот этого я не знаю, ты это не я, и за тебя сказать я не могу.
Наверное таким же как и тролль на зарплате у "интелЪ". :D

_________________
-=AMD POWER FAN CLUB=- *AMD OverClan*


 

Member
Статус: Не в сети
Регистрация: 12.03.2003
Откуда: Калининград
SATelit писал(а):
Вот этого я не знаю

Зачем тогда пишешь откровенный бред ?

_________________
Lorichic писал(а):Память покупается на весь срок жизни.
АМ4 - Сокет свободных людей (с)XRR
14600kf\Zotac 5070ti Solid Core OC\2x16Gb DDR4-3200@4000CL16


 

Member
Предупреждение 
Статус: Не в сети
Регистрация: 27.01.2008
Откуда: Deep Space
Фото: 25
cypher1999 писал(а):
Зачем тогда пишешь откровенный бред ?

Ну так это в твоём синем понимании - бред.
В реальности это правдой и реальностью завётся. Синий фанатизм имеет одно из свойств, не замечать конкурентов, что поделаешь, у синих сектантов - "интелЪ" - усегда вПереди, и во вовсём впереди. Тем более переведи абривиатуру HEDT - это то же десктоп, и многих святая синева кинула на платформе 2066 (HEDT), признай "интулЪ" - аутсайдер с нелеквидным хламом под названием "капитализация". :D

_________________
-=AMD POWER FAN CLUB=- *AMD OverClan*


 

Member
Статус: Не в сети
Регистрация: 04.11.2017
Откуда: из леса
k2viper писал(а):
Есть только косвенные упоминания на том самом слайде АМД, где визуально изображено что-то напоминающее "полную решетку mesh" где каждая доля соединена с каждой другой долей. Физически, похоже эти соединения отмечены на слайдах как L3 CTL. И их по странному совпадению даже 6 штук
Какой-то аналог Ring bus нужен АМД, короче говоря. И судя по их последним патентам, они немало сил вложили именно в разработку этих самых interconnects, так что вполне возможно что у АМД уже есть рабочий вариант своего собственного ring-mesh.
Значит, есть логика в использовании протоколов-аналогов от интела , и кольца, и мешка - для общения ядер внутри ццх использовать "кольцо", а для общения между ццх и контроллером памяти использовать "мешок", в виде доработанной инфинифабрики?

k2viper писал(а):
Ну, будет слегка заимствование Интеловской топологии, ну а что теперь, это не впервой
Вообще-то интел сам не прочь заимствовать, у тех же АМД: сначала 64 бита - как ем64т, затем, начиная с нехалема - встроенный в проц контроллер памяти, откуда заимствовано - известно; "шина" КуПИ (квик пат интерконнект), это аналог гипертранспорта АМД, ну и видеовстройка - задумка АМД, правда, интел в осуществлении этой задумки опередил АМД, надо отдать ему должное. Естественно, и АМД занимались и занимаются заимствованием у интела, но картина должна быть полной.

matocob писал(а):
Кольцевая шина - это тупик, от которого и сама Интел отказалась в пользу меша, а сейчас рассматривает альтернативы и мешу.
А какя же альтернатива кольцу и мешку? Неужели аналог инфинифабрики?

SATelit писал(а):
А что такое "интелЪ"? AMD уже во всю выпускает 32 ядра на старые мат.платы, а "интелЪ" никак 8 ядер в домашний десктоп не может выпустить
В хедт-сегменте у интела есть 22 ядра, а в настольный они выводят 8-ядерники - 9700 и 9900, пусть долго шли, пусть дорогие - но зато кошерные, с припоем, и гончие :D По суммарной производительности 32 ядра АМД обойдут 22 ядра интела, а вот в настольном сегменте, восьмиядерники интела и7 9700 и и9 9900 будут посильнее ризенов 2700, особенно 9900. Пусть разница не будет колоссальной, но всё же заметной - особенно из-за лучшего разгонного потанцевала у интела. Но будут они не только лишь для всех.
У АМД останется козырь в виде более низкой цены и сочетания цена/производительность, а затем АМД выпустят дзен2, и противостояние снова накалится.

_________________
Улыбок тебе... дед Макар (читай наоборот)


 

Member
Статус: Не в сети
Регистрация: 30.04.2015
Откуда: Россия
Фото: 637
Ivan Ivanov писал(а):
а затем АМД выпустят дзен2, и противостояние снова накалится.

это если у амд не получится случайных стабильных 4.2ГГц по всем ядрам из-за сырого 7нм и цены в 500-700 московских рублей за АМ4 процы. И ещё разные приколы могут быть, самые страшные - это работа маркетологов (аля кальве под крышкой и 4 ядер хватит всем ещё лет на 10).

_________________
cpu: r9 7953@stock, mobo: asus strix e-e, ram: hynixDR 32GBx2@6200 28-35-32-47-79 1.4V, gpu: 7900XTX TUF, psu: Tt iLGTV PLUS 1250 atx3


 

Member
Статус: Не в сети
Регистрация: 12.03.2003
Откуда: Калининград
SATelit писал(а):
Ну так это в твоём синем понимании - бред.

Тяжелый случай. Конкурент "домашним" процам интеля - это 32х ядерник от АМД ? Жесть, конечно. :D

_________________
Lorichic писал(а):Память покупается на весь срок жизни.
АМ4 - Сокет свободных людей (с)XRR
14600kf\Zotac 5070ti Solid Core OC\2x16Gb DDR4-3200@4000CL16


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 319 • Страница 9 из 16<  1 ... 6  7  8  9  10  11  12 ... 16  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 41


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan