А собственно почему кэш не может быть эксклюзивным?
Поясняю. Есть 2 ядра. Допустим, 1 ядро обратилось к данным, которые находятся в кэше 2 ядра. Если нет л3 кэша, то первому ядру придется лезть в память, а это долго.
Если есть разделяемый ИНКЛЮЗИВНЫЙ кэш 3 уровня, то эти же данные будут лежать и в л3-кэше, и 1 ядро возьмет их оттуда. А что с эксклюзивным кэшем делать? 2 ядро должно будет выгрузить свои данные в л3 кэш, что ли? Но это во первых долго, а во вторых, может они ему опять понадобятся. К тому же разделяемый эксклюзивный кэш сделать сложно чисто технически.
А система л1-л2 так и останется эксклюзивной (т.е. данные в л1 и л2 не дублируются, а л3 содержит копии л2 всех ядер)
Проблема в том,что у двуядерных К10 L2 НЕ разделяемый
на сколько я знаю, у K10 как и у K8 сохранился раздельный L2, а также по заверениям самой AMD в K10 L2 будет эксклюзивным, а L3 инклюзивным. кстати, почему некоторые считают его медленным, он же будет находится на кристале и работать на той же частоте, что и сам процессор (если верить хоботу).
он же будет находится на кристале и работать на той же частоте,
Латентность полюбому больше. Хотя бы потому, что проц обращается сначала к Л1, потом (если данных нет) то в Л2, и только потом в Л3 (а потом в память), т.ч. еще и суммарная латентность обращения к памяти увеличится.
выставке Computex 2007 компания AMD продемонстрировала четырехъядерные серверные процессоры Opteron на основе ядра Barcelona.
По словам представителей компании, новые процессоры обеспечивают более высокую производительность в популярных серверных приложениях используемых. Наряду с увеличением общей производительности «энергетическая эффективность» процессоров AMD Opteron (Barcelona) также существенно возросла. Общая цифра, характеризующая превосходство новых процессоров над предыдущим поколением, составила 50-80%. Такое превосходство достигнуто не только благодаря новой архитектуре процессоров, но и за счет внедрения технологии Dual Dynamic Power Management. Новая технология управляет работой процессора и контроллера памяти позволяет более рационально использовать их ресурсы, итогом будет являться повышенная экономия энергии и более гибкая производительность. Компания AMD позаботилась и о максимально легкой миграции на новые процессоры в рамках старых систем. Так, например, для того чтобы обеспечить поддержку новых процессоров нет нужды менять часть оборудования, так как процессоры AMD Opteron (Barcelona) обладают тем же разъемом что и их предшественники. Для успешного внедрения новых четырехядерных процессоров AMD достаточно лишь обновить BIOS. А сохранившийся уровень тепловыделения позволит использовать старые системы охлаждения. Также стоит отметить, что новые процессоры одобрены партнерами AMD и широкий круг программного обеспечения уже сейчас может использовать все преимущества новых четырехъядерных процессоров AMD Opteron (Barcelona).
Вот такая новость, в которой бросаются в глаза три момента:
1. Сравнивают не с коркой, а с К8,
2. Сравнивают не столько производительность, сколько «энергетическую эффективность» 3. Тестов нет Вывод: всё труднее надеяться на превосходство над коркой
Member
Статус: Не в сети Регистрация: 04.06.2005 Откуда: Оксфордшир
Afx писал(а):
Цитата:
А как насчет долбанутого менеджера задач винды? Который пытается 1 поток распределить между ядрами.
Это как?
Это то, что я вижу в Task Manager. Запускаешь однопоточную задачу и в дефолт она распределяется 50-50 между двумя ядрами. А если вручную привязать к одному ядру, производительность выше.
Если неправ, буду только рад.
_________________ Таких людей уже нет, а скоро совсем не будет BTEAM_Shifty
Не, насчет быстрой шины L1-L2 неуверен, спрашивал про это но в ответ уклончивые рассказы.А кэш будет немного изменен, как именно неуточнялиОрганизация L1-L2-L3 будет эксклюзивная, так что может придется увелечить задержки, которые компенсируются большим L3, но без L3 новое ядро будет проигрывать
скорей всего шину расширят, а задержки у кэша и так больше уж не куда
Afx писал(а):
Если вкратце - л3 кэш полезен только в ситуации когда несколько ядер одновременно работают с одними и теми же данными, а для 1 потока л3 кэш может только навредить из за больших задержек. (Впрочем, я сам не думаю, что будет сильное падение, а вот снижение латентности в 1 ситуации можетбыть серьезным).
да? а как же Gallatin?
Afx писал(а):
Латентность полюбому больше. Хотя бы потому, что проц обращается сначала к Л1, потом (если данных нет) то в Л2, и только потом в Л3 (а потом в память), т.ч. еще и суммарная латентность обращения к памяти увеличится.
че то вы тут наплели мне кажется
_________________ Кратчайшее расстояние между двумя точками это точка.
Я только что ушел от AMD (собранно только лично 12 систем на заказ). Хотя был их поклонником много лет (стаж дружбы с АМД года 4). Но все. Махаю ручкой. И не буду скрывать, на покупку Core 2 Duo меня толкнула сама AMD. Именно неуважением к своим постоянным клиентам. Подчеркну - именно не уважением. И этой вот тягомутиной с переходами на разные сокеты за короткий промежуток времени (особенно просто взбесил переход на AM2 c 939 за короткий период), и окончательную, жирную точку поставила новая система индексов описанная в статье. До этого как то все еще проглатывал. А теперь хватит. Надоело. Расцениваю переход на новые индексы как продолжение хамского отношения к конечным потребителям, да просто как плевок и издевательство. Я не собираюсь читать вест этот бред и выучивать новые системы индексов. Чем старые не угодили? Ведь все понятно как день было! А сейчас Ну добавили бы буковки какие нибудь, типа AMD ATHLON LE (Low energy) X2 5000+ , и все было бы понятно...
В общем, начала AMD просто здорово (я про сокет А и продолжение с Бартонами), а потом начала дергаться. Теперь собранные на 939 системы в момент устарели. И лично меня здорово подставили в глазах клиентов. Я то дурак понадеялся, что будет как с Сокетом А. Дружба надолго, а тут видиш ли АМ2 приспичило. За каким? А теперь и новые обозначения, с потолка взятые... В общем, не люблю непостоянство. Пока AMD... :weep::weep:
Король умер, да здравствует король! Тобиш - Intel
PS
На обновку идет еще один комп, уже заказан Core 2 Duo....
PPS
Фраза из статьи: "...но старая система с "баллами рейтинга" тоже себя изжила...". Абсолютно не согласен. Если равняться на Intel, да изжила. Но в том то и дело, что она стала хорошим показателем именно внутри линейки самой АМД. Что не мение важно. А теперь, с новой системой, сам черт ногу сломит. Со старой, при всех ее недостатках, можно было хотябы приблизительно судить что перед тобой лежит. А потом уже читать.
Такие фразы в корне не верны. Совсем недавно так же говорили про AGP. Ну и? Уже как 2 года его хоронят. А все никак... Практика доказала что кроме подвода доп. энергии, PCI-E ничего практически не дает. Осторожнее надо с фразами.
Это то, что я вижу в Task Manager. Запускаешь однопоточную задачу и в дефолт она распределяется 50-50 между двумя ядрами. А если вручную привязать к одному ядру, производительность выше. Если неправ, буду только рад.
Не знаю, не знаю... Я просто с тудом представляю как это возможно чисто физически. Может все таки задача многопоточная?
Dogmatik
Цитата:
да? а как же Gallatin?
Можно по подробнее?
Цитата:
че то вы тут наплели мне кажется
Я в архитектуре процов в общем то не специалист, так что может че и напутал. А че не так?
Legat
Цитата:
Сравнивают не с коркой, а с К8,
Сравнивать напрямую с конкурентом запрещено - антиреклама. (это как в рекламе, сравнивают с абстрактным "обычным порошком".
По остальным пунктам согласен — это настораживает.
у него был L3 и в однопоточных ни каких тормозов не наблюдалось.
Afx писал(а):
Я в архитектуре процов в общем то не специалист, так что может че и напутал. А че не так?
да же если так рассуждать, то все равно в целом латентность уменьшиться, т. к. вероятность нахождения данных в кэше сильно увеличиться, особенно для однопоточных приложений (одному потоку будут доступны 2MB), а на фоне латентности памяти, задержки кэша незначительны. и насколько я помню поиск идет в 2х кэшах одновременно: L1 и L2 (но вот тут просто не помню точно)
_________________ Кратчайшее расстояние между двумя точками это точка.
у него был L3 и в однопоточных ни каких тормозов не наблюдалось
Про ксеон не скажу, но у какого то "экстремального" пня4 вроде тоже был л3-кэш, и влияние на производительность (по сравнению с обычным) было ничтожным. Впрочем, утверждать не буду, т.к. не помню.
Цитата:
да же если так рассуждать, то все равно в целом латентность уменьшиться, т. к. вероятность нахождения данных в кэше сильно увеличиться
Согласен, но все же 2 метра л3-кэша неравносильно 2 м л2 кэша коре, имхо кэшезависимость будет меньше (за счет латентности). В общем, не хочу гадать на кофейной гуще, подождем тестов.
Цитата:
и насколько я помню поиск идет в 2х кэшах одновременно: L1 и L2
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 24
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения