Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 97 • Страница 5 из 5<  1  2  3  4  5
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 20.06.2013
devl547 писал(а):
лучше бы Kabini развивали

Так они и развивают, Beema же, на ядрах Puma, а в этом году вроде как выходят Puma+ с допилками от экскаватора.



Партнер
 

Member
Статус: Не в сети
Регистрация: 13.02.2013
Yalg писал(а):
Эмм, и откуда?

А разве не видно?
Смотрите производительность на такт.

CPU у FX-8150 2,21
у i5-2500 - 2.50. Разница - на 13%.
Но, смотрим на i7-2600 - а там уже 3,36, т.е. на 50 % выше, чем у буля, и соответсвенно на 34% выше чем у i5
Вопрос: что есть такого у i7, и нет у i5, что позволяет показать такой резкий скачек производительности?

Аналогично FPU:
FX: 0.182
i5: 0,226
i7: 0.345

Итого имеем: i5 обходит буль на 25%
i7 обходит i5 в полтора!!!! раза. За счет чего? Чего нет в i5, но есть в i7?

______________
Вот под эту штуку очень похоже AMD сейчас и копает: выполнение двух потоков на одном ядре. Плюс конечно же рост производительности одного ядра в чистом виде.

Добавлено спустя 36 минут 17 секунд:
Yalg писал(а):
Да в стимроллере они тоже обещали +30% ipc, результат же...

А разве прироста нет?
На большинстве тестов прирост 7850K в сравнении с 6800K 5-15%, при частоте меньшей на 10%
Да, кое-где бывают проигрыши. Но опять же: при меньшей частоте, при равной - даже на этих "неудобных" задачах - паритет.

________
Соглашусь, что именно что 30% не набралось, но средние по больнице 20% есть.


 

Member
Статус: Не в сети
Регистрация: 20.06.2013
MaK123 писал(а):
Соглашусь, что именно что 30% не набралось, но средние по больнице 20% есть.

6% по сравнению с 6800k на одной частоте. Плюс местами даже хуже. 6% тоже хорошо, но обещали в разы больше.
MaK123 писал(а):
выполнение двух потоков на одном ядре. Плюс конечно же рост производительности одного ядра в чистом виде.

Это не объясняет почему у интела даже у i5 FPU быстрее.


 

Member
Статус: Не в сети
Регистрация: 13.02.2013
Yalg писал(а):
6% по сравнению с 6800k на одной частоте. Плюс местами даже хуже. 6% тоже хорошо, но обещали в разы больше.

Где 6, где и 20 при частоте, меньшей на 10%. Где-то даже небольшое отставание есть, но никак не бОльшее, чем те 10% разницы в частоте.

Yalg писал(а):
Это не объясняет почему у интела даже у i5 FPU быстрее.

Разумеется не объясняет.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
MaK123 писал(а):
За счет чего? Чего нет в i5, но есть в i7?


Дозагрузка конвеера вторым потоком.

MaK123 писал(а):
AMD сейчас и копает: выполнение двух потоков на одном ядре.


Без наличия широкого ядра - бесполезная вещь. Когда у них будет 1 ядро Zen на уровне 1 модуля FX по ресурсам - тогда можно многопоток рассматривать.


 

Member
Статус: Не в сети
Регистрация: 13.02.2013
devl547 писал(а):
Без наличия широкого ядра - бесполезная вещь. Когда у них будет 1 ядро Zen на уровне 1 модуля FX по ресурсам - тогда можно многопоток рассматривать.

Полезная при любом раскладе. Ядро Atom'а ну никак не попадает под определение "широкое", но и там HyperThreading свои 30% производительности накидывает. Естетсвенно на задачах, которые умеют лишними ядрами пользоваться, неважно -настояшие ядра, или виртуальные, тонкие, широкие или так себе...


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
MaK123 писал(а):
Ядро Atom'а ну никак не попадает под определение "широкое", но и там HyperThreading свои 30% производительности накидывает.


Там ещё большая задница - in-order. Естественно, что HT будет догружать проц когда основной поток простаивает.
А как только атомы сделали out-of-order, так сразу HT убрали.


 

Member
Статус: Не в сети
Регистрация: 13.02.2013
А в Пентиум-4 что плохого, что он от HT ускоряется?
Вроде бы и ядрышко так себе... явно не мощнее FX-а ;) И частоты примерно те же. Кеша - кот наплакал, потому двум потокам явно тесно, память - ну хорошо если два канала по 400, или попросту - медлннная она, а потому - дерутся потоки за нее.
А вот поди же - помогает ему HyperThtreading.

А вот в Core2Duo HT нет. Хотя ядро явно жирнее, чем предыдущее. Да и атомовских болячек нет, и кеш хозяйский, и со скоростью доступа к памяти пробелм никаких - а вот нет HyperThreading у него, и точка.
А у первого же i7-го, который с номером 920 HT опять появился. Хотя ядро ну никак не мощнее, чем у Core2Quad: при близких частотах и отключенном HT процессоры бодаются без особого перевеса одного над другим.

Так что не очень оно вписывается в схему...


 

Member
Статус: Не в сети
Регистрация: 20.06.2013
MaK123 писал(а):
А вот в Core2Duo HT нет. Хотя ядро явно жирнее, чем предыдущее. Да и атомовских болячек нет, и кеш хозяйский, и со скоростью доступа к памяти пробелм никаких - а вот нет HyperThreading у него, и точка.

Им не до HT было в этом ядре, но уже в следующем он вернулся.


 

Member
Статус: Не в сети
Регистрация: 13.02.2013
Я задал вопрос про три архитектуры.
Одна из них (пусть будет собирательный образ - Pentium 4, дабы не перечислять все ядра) не могла похвастаться ни "широким" ядром (у современных FX явно пошире будет), ни приличным объемом кеша (самых распространеннрые модели - 512 килобайт), ни быстрой памятью (типовая платформа - двухканалка по 400, по современным меркам это вообще никак).

Итого: работают два потока. На "тонком" ядре (ибо если FX "толстым" или допустим "широким" не является, то еще более медленный Pentium и подавно). Все данные подкачиваются по медленной памяти, и помещаются в крохотный кеш, где два работающих потока дико мешают друг другу, ибо постоянно конкурируют за место в кеше для "своих" данных.
И при этом на Pentium 4 HeperThreading есть, рабоатает, и привносит свои проценты в копилку производительности. Причем вполне нормальные проценты, 15-20, иной раз и 30, явно не копейки какие-то...

А на FX, где и ядро быстрее, и кеша больше, и память в типовом конфиге бегает 2*1600, а не 2*400 (да и встроенный в чип контроллер памяти свою лепту дает) оказывается разместить аналог HyperThreading нельзя, или вернее сказать разместить то можно, но бесполезно: ядро недостаточно "толстое", а потому параллелить в нем будет фактически нечего: все ресурсы ядра могут быть выбраны и одним потоком.


 

Member
Статус: Не в сети
Регистрация: 02.02.2004
Откуда: Украина.
MaK123 писал(а):
А в Пентиум-4 что плохого, что он от HT ускоряется?

Очень длинный конвеер, простой которого очень дорого обходится. Поэтому HT для пентиум 4 был единственным вариантом без смены ядра добавить производительность, ибо по частоте выжать не получилось, по производительности на такт тоже, а конвейер очень большой (кажется 31 стадия). кеша по тем аременам там очень даже не мало, у некоторых процесосров было всего 64килобайта кеша второго уровня.
MaK123 писал(а):
работают два потока. На "тонком" ядре (ибо если FX "толстым" или допустим "широким" не является, то еще более медленный Pentium и подавно). Все данные подкачиваются по медленной памяти, и помещаются в крохотный кеш, где два работающих потока дико мешают друг другу, ибо постоянно конкурируют за место в кеше для "своих" данных.

Это по нынешним временам, а по тем все не так печально было и память быстрая тоже :) задержке той памяти могут завидывать и нынешние модули.
MaK123 писал(а):
А на FX, где и ядро быстрее, и кеша больше, и память в типовом конфиге бегает 2*1600, а не 2*400 (да и встроенный в чип контроллер памяти свою лепту дает) оказывается разместить аналог HyperThreading нельзя, или вернее сказать разместить то можно, но бесполезно: ядро недостаточно "толстое", а потому параллелить в нем будет фактически нечего: все ресурсы ядра могут быть выбраны и одним потоком.

Если опять упрется в слабую скорость отдельных блоков, то поможетне больше чем тому же пентиуму 4. Последний в ряде задач при HT замедлялся только.


 

Member
Статус: Не в сети
Регистрация: 13.02.2013
Alexsandr писал(а):
Очень длинный конвеер, простой которого очень дорого обходится. Поэтому HT для пентиум 4 был единственным вариантом без смены ядра добавить производительность, ибо по частоте выжать не получилось, по производительности на такт тоже, а конвейер очень большой (кажется 31 стадия).

Не совсем так. А вернее, совсем не так.
31 стадия была у Prescott. У него же и кеш добавили, сначала до мегабайта, а потом в конце жизненного цикла архитектуры, всего за год до выхода Core2Duo - даже два.
Но до этого был Northwood, и HyperThreading дебютировал как раз на нем. Если быть точнее, то на P4 3.06 Ghz под шину 533.
А в нем и конвеер был всего-то 20 ступеней, и кеш - 512 кило.
Т.е. конвеер короче, чем у FX, а кеша на ядро - вдвое меньше.


Alexsandr писал(а):
Если опять упрется в слабую скорость отдельных блоков, то поможетне больше чем тому же пентиуму 4. Последний в ряде задач при HT замедлялся только.

На ряде задач замедляются и вполне современные четырехядерные i7 на фоне самих себя же, но с отключенным HT.

Это не проблема архитектуры. Это проблема софта, который не зная про существования вирутальных и реальных ядер перекидывает часть расчетов на виртуальные в сиутации, когда физические ядра в этот момент простаивают.

Аналогично ведет себя кстати и FX при работе в системах (пишу только про системы от Microsoft) Виста и ниже, а также Windows 7, без фиксов KB2645594 и KB2646060: ОС нагружает вторые ядра в модуле, при полностью простаивающих других модулях. Производительность естественно садится, т.к. возникает кофликт двух ядер за кеш, за FPU, за декодировщик команд, и т.д.


 

Member
Статус: Не в сети
Регистрация: 02.02.2004
Откуда: Украина.
MaK123 писал(а):
31 стадия была у Prescott. У него же и кеш добавили, сначала до мегабайта, а потом в конце жизненного цикла архитектуры, всего за год до выхода Core2Duo - даже два.
Но до этого был Northwood, и HyperThreading дебютировал как раз на нем.

на 4-м пентиуме конвеер был длинным,не важно нортфут пресскот или другое ядро. У прескота просто конвеер стал еще больше.
MaK123 писал(а):
А в нем и конвеер был всего-то 20 ступеней, и кеш - 512 кило.

Это не всего-то, а ого-го по тем временам. Для сравнения такой кеш был только серверных процессоров до этого.


 

Member
Статус: Не в сети
Регистрация: 13.02.2013
Alexsandr писал(а):
на 4-м пентиуме конвеер был длинным,не важно нортфут пресскот или другое ядро.

Да какой он длинный? Это сейчас длинные... Ну удлинили его супротив P-III. Стал длиннее, да. Но не "длинным".

Alexsandr писал(а):
Это не всего-то, а ого-го по тем временам. Для сравнения такой кеш был только серверных процессоров до этого.

В серверных процессорах того времени лепили по 2 мегабайта кеша L3, помимо 0,5 мегабайта L2
Собственно первый же P4 EE и был обрубком от того Xeon'а.
А 512 килобайт без L3 кеша был де-факто стандарт для ширпотреба. И HyperThreading на этом ширпотребе давал очень недурственные результаты.

https://ru.wikipedia.org/wiki/Pentium_4 ... me_Edition

Отсюда опять повторяю вопрос: почему на P4 HT работает, и дает пользу, а аналог HT в исполнении AMD работать на гораздо более мощном ядре, скажем Вишере на сможет?


 

Member
Статус: Не в сети
Регистрация: 02.02.2004
Откуда: Украина.
MaK123 писал(а):
Да какой он длинный? Это сейчас длинные... Ну удлинили его супротив P-III. Стал длиннее, да. Но не "длинным".

По тем временам длинный. Да и сейчас не короткий. У ядра Prestonia помнится не было 3-го уровня, по сути это и был 4-й пенек. интел старалась ускорить свои ядра, отсюда и кеш появился потом.
MaK123 писал(а):
А 512 килобайт без L3 кеша был де-факто стандарт для ширпотреба.

петиум 3 с частотой 1,3Ггц и кешем 512килобайт стоит дороже нортфуда, намного дороже. Вот такой ширпотреб :) У конкурента столько же кеша появилось только на ядре бартон.
MaK123 писал(а):
почему на P4 HT работает, и дает пользу, а аналог HT в исполнении AMD работать на гораздо более мощном ядре, скажем Вишере на сможет?

Вишера и так делит некоторые блоки, там боюсь нечего загружать из-за модульности. Это не ко всем блокам относится, но все же. Контролировать кучу состояний блоков скорее всего будет весьма накладно. Думаю поэтому там особого прироста не будет.


 

Member
Статус: Не в сети
Регистрация: 13.02.2013
Alexsandr писал(а):
петиум 3 с частотой 1,3Ггц и кешем 512килобайт стоит дороже нортфуда, намного дороже. Вот такой ширпотреб У конкурента столько же кеша появилось только на ядре бартон.

Понятие "дороже" мало как связано с технической частью. Скорее даже никак не связано. Можно продавать совершенную вещь задешево для (допустим) захвата рынка.
А можно пустить далеко не идеальный процессор (8150) по 300 баксов, и через год, увидев, что он мало кому нужен за те деньги, его заметно более быстрого последователя (8350) по 200.

Alexsandr писал(а):
Вишера и так делит некоторые блоки, там боюсь нечего загружать из-за модульности. Это не ко всем блокам относится, но все же. Контролировать кучу состояний блоков скорее всего будет весьма накладно. Думаю поэтому там особого прироста не будет.

Да ничего она не делит. Мы рассматриваем CPU. Он сам по себе. Второй поток в модуле не запущен. Все ресурсы отданы этому CPU.
Теперь запускаем второй поток в модуле. Появляется конкуренция двух CPU за кеш, за доступ к памяти, и т.д. И это правильно, так и должно быть, более того - иначе не бывает, хоть у AMD, хоть у Интел'а. За все, что делится между ядрами возникает война. У современных процессоров Intel'а - это кеш L3, и оперативка. У стареньких Core2Duo - кеш L2 и оперативка. У современной Вишеры - кеш L2, FPU, кеш L3 (если не влезло в L2), и далее - оперативка. Где-то посередине - декодер команд (уже исправлено введением второго декодера в Кавери).

А теперь нет у нас теперь модулей. Есть одно ядро, как у Вишеры, один FPU, как у Вишеры и т.д. Т.е. из модуля забрали второй CPU, а все остальное - осталось. Получили в результате обычное себе классическое ядро, как у Pentium III, как у Фенома, как у Core.
И теперь на этом ядре запускаем второй поток за счет технологии, подобной HyperThreading. Разаве теперь два потока не будут драться за место в кеше? А за доступ к памяти? А за FPU? А за декодер команд?

Так какая разница, за счет чего они будут драться, за счет ли второго CPU в модуле, или за счет HyperThreading?
Разница только в производительности - первый случай дает бОльшую производительнось, что и наблюдается при переходе с 4 на 8 потоков на AMD в сравнении с Intel i7 (четырехядерные модели).


 

Member
Статус: Не в сети
Регистрация: 02.02.2004
Откуда: Украина.
Разница в архитектуре. Если у строй техники есть разделяемые блоки которыенужнорешать как делить, то драться еще и между виртуальными потоками штука более сложная. Может в будущем,на следующем техпроцессе объединят.


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 97 • Страница 5 из 5<  1  2  3  4  5
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 23


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan