Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 92 • Страница 3 из 5<  1  2  3  4  5  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 
Прилепленное (важное) сообщение

роБОТяга
Статус: Не в сети
Регистрация: 05.07.2005
Ждём Ваших отзывов о материале.
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!



Партнер
 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 25.06.2004
***

linuxdrom писал(а):
В конфигурациях с поддержкой технологии Hyper-Threading некоторые потоки программного кода могут конкурировать за доступ к совместно используемым ресурсам, снижая производительность всей системы.

Бред уже постаревшей и сивой кобылы...поучите матчасть немного
..тот Hyper-Threading который реализуется в Нехалем ...маленько имеет другую структуру...
никто и ничего конфликтовать там не будет...будет кое что другое...тема по этим вопросам есть
и даже на этом форуме..где я соизволил излагать ...уча неучей что к чему....
...да на чём мы остановились..так вот при той технологии которая реализуется в Нехалем...
...будет существенная прибавка в производительности...то что считают Гипер-Трейдиногом...
в том понимании как его понимают..это не со всем верно...
........Хотя и Гипер-Трейдинг реализованный в старом Нет Бурсте..лично у меня и большинства
програмистов не вызывал нареканий...и был популярен у програмистов...и даже многими из них любим... :beer:


***


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
TyyOx91 писал(а):
Dryden
Цитата:
Нехалему имхо такие костыли не нужны - именно из-за намного более удачной архитектуры.

Признайтесь честно - вы называете HT "костылём" патамучта такой фитчи нет (и не предвидется) у АМД? :D. И почему же это "костыль" если сможет добавить к многопоточной производительности N-ое количество процентов? Вобще интересно - как отличить какая фитча является костылём, а какая нет. Можно ли в таком контексте считать интегрированный контроллер памяти AMD - "костылём"? :tooth:

Признаюсь такой фитчи нет (и не предвидется) у АМД, потому-что здоровому костили не нужны, они только мешают (C2D также) . Отличить просто, если фитча помогает или хотя бы не мешает всем, то она "костылём" не является (интегрированный контроллер памяти никому не мешает и многим помогает).

Технические обоснования :wink: :
1) K8 (C2D также) являются суперскалярными и конвейерными, то есть параллельно обрабатывают несколько команд с переопределением порядка их следования в целях оптимальной загрузки вычислительных ресурсов.
2) Процессор K8 очень быстро очищает и перезагружает конвейер
3) У C2D выборка команд идет четырьмя одновременно.
4) У C2D имеется сложный блок предсказания ветвлений, который использует самые передовые алгоритмы, сводящие к минимуму вероятность неправильного предсказания и следующей за ним перезагрузки конвейера.
Ну а как костыли (НТ) мешает Вы уже знаете.


 

Member
Статус: Не в сети
Регистрация: 21.09.2006
Откуда: Хабаровск
SEVER NN писал(а):
Хотя и Гипер-Трейдинг реализованный в старом Нет Бурсте..лично у меня и большинства програмистов не вызывал нареканий

Согласен! Никогда не видел минусов в Hiper-Threading'е.
Например в WinRAR'е мне он увеличил скорость упаковки с 450Кбайт/с до 650Кбайт/с, в Xilisoft Video Converter заметно уменьшил время кодирования, что можно объяснить заточенностью кодеков под многоядерность!

_________________
...Ищy выход из Интеpнета...


Последний раз редактировалось Defrager 01.04.2007 16:53, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
SEVER NN писал(а):
***

linuxdrom писал(а):
В конфигурациях с поддержкой технологии Hyper-Threading некоторые потоки программного кода могут конкурировать за доступ к совместно используемым ресурсам, снижая производительность всей системы.

Бред уже постаревшей и сивой кобылы...поучите матчасть немного

..тот Hyper-Threading который реализуется в Нехалем ...маленько имеет другую структуру...
никто и ничего конфликтовать там не будет...будет кое что другое...тема по этим вопросам есть
и даже на этом форуме..где я соизволил излагать ...уча неучей что к чему....
...да на чём мы остановились..так вот при той технологии которая реализуется в Нехалем...
...будет существенная прибавка в производительности...то что считают Гипер-Трейдиногом...
в том понимании как его понимают..это не со всем верно...

А Вы учитесь читать: Я не знаю сколько процентов HT даст Нехалему, по этому буду судить по Р4 и Pentium D.

Цитата:
........Хотя и Гипер-Трейдинг реализованный в старом Нет Бурсте..лично у меня и большинства
програмистов не вызывал нареканий...и был популярен у програмистов...и даже многими из них любим... :beer:

И где их берут итих любителей програмистов Гипер-Трейдинга
:lol:
Добавлено спустя 8 минут, 52 секунды
Defrager писал(а):
Никогда не видел минусов в Hiper-Threading'е.
Например в WinRAR'е мне он увеличил скорость упаковки с 450Кбайт/с до 650Кбайт/с, в Xilisoft Video Converter заметно уменьшил время кодирования, что можно объяснить заточенностью кодеков под многоядерность!

Ну может плохо смотрели :wink: . А от куда берётся прирост производительности на P4 я писал.


 

Member
Статус: Не в сети
Регистрация: 21.09.2006
Откуда: Хабаровск
linuxdrom писал(а):
Ну может плохо смотрели

Фанатство в конференции не приветствуется, а я свои слова могу подтвердить скриншотами, а вы кроме пустого ляля ничего больше и не способны сделать!

_________________
...Ищy выход из Интеpнета...


 

Member
Статус: Не в сети
Регистрация: 21.01.2007
Откуда: Санкт-Петербург
Нет,есть приложения,которые он тормозит(сам правда таких не видел),но в абсолютном большинстве(приложения,не заточенные под многопоточность) результат с гипертрейдингом больше результата без него на доли процента.Есть больше,есть меньше,но САМОЕ ГЛАВНОЕ:ЕГО ИСПОЛЬЗОВАТЬ НИКТО НЕ ЗАСТАВЛЯЕТ-не хочет,можешь выключить :D


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
Defrager писал(а):
linuxdrom писал(а):
Ну может плохо смотрели

Фанатство в конференции не приветствуется, а я свои слова могу подтвердить скриншотами, а вы кроме пустого ляля ничего больше и не способны сделать!

Ну и причём тут фанатство? Я вам верю, Hyper-Threading дествительно на архитектуре NetBurst помогает, просто не всегда. Свои скриншоты я предаставить в потверждения я немогу (нет у меня NetBurst), а в инете если надо найду.
А это "а вы кроме пустого ляля ничего больше и не способны сделать!" - в конференции тоже не приветствуется. И что я могу зделать на форуме кроме "ляля"( прошу заметить не пустого)? И кричать не надо, будьте спокойней, все хорошо :beer:


 

Member
Статус: Не в сети
Регистрация: 22.06.2004
linuxdrom
Цитата:
Признаюсь такой фитчи нет (и не предвидется) у АМД, потому-что здоровому костили не нужны, они только мешают (C2D также) . Отличить просто, если фитча помогает или хотя бы не мешает всем, то она "костылём" не является (интегрированный контроллер памяти никому не мешает и многим помогает).

Ошибка. Для интегрированного контроллера тоже можно найти ситуации, когда его наличие будет "просаживать" производительность. Например, для многопроцессорных систем на базе АМД необходимо программировать с оглядкой на NUMA. Иначе на неоптимизированных задачах можно получить реальное "проседание" относительно однопроцессорной и с меньшей частотой. Смотрим тесты:
http://www.fcenter.ru/online.shtml?arti ... ards/19826
В этом смысле, мультитрединг ничем не отличается от ИКП - так же требуется явная оптимизация. Так что по вашим критериям - ИКП костыль для архитектуры К8. :lol:
Цитата:
Технические обоснования :
1) K8 (C2D также) являются суперскалярными и конвейерными, то есть параллельно обрабатывают несколько команд с переопределением порядка их следования в целях оптимальной загрузки вычислительных ресурсов.

О!. Спасибо. Не знаю зачем вы это написали, но именно этот аргумент я и хотел привести в качестве показателя нужности мултитрединга.
А именно - Athlon64 может обрабатывать одновременно 3 инструкции за такт (IPC=3) Core может обрабатывать 4 инструкции за такт (или 5 с MacroOP fusion) (IPC=4(5)). В тоже время, для большинства програм average IPC < 2. Замеры можете найти в сети. Недавно видел замеры на linux kernel - для Athlon64 результаты были в районе 1.6-1.8. То есть, по сути дела, до 30-40% ресурсов процессора практически всегда простаивают - всё из-за сильно ограниченной возможности распараллеливания х86 кода. Так почему бы не занять простаивающие ресурсы другим тредом?
Цитата:
2) Процессор K8 очень быстро очищает и перезагружает конвейер
3) У C2D выборка команд идет четырьмя одновременно.
4) У C2D имеется сложный блок предсказания ветвлений, который использует самые передовые алгоритмы, сводящие к минимуму вероятность неправильного предсказания и следующей за ним перезагрузки конвейера.

Так и знал, что будете "давить" на длинноконвейерность Р4. :haha: Распространнёная ошибка - считать мультитрединг костылём для длиноконвейерных архитектур. Итаниум и Power5 это очень хорошо доказали.
Добавлено спустя 1 час, 16 минут, 21 секунду
linuxdrom
Цитата:
То есть с НТ должно задествоватся 70% ресурсов процессора (30% про запас ) То есть мы должны получить 100% прироста производительности!

Надо написать очень специфический код, чтобы задействовать 100% ресурсов процессора. (видимо что-то типа интеловского "термометра" для Коры).
Цитата:
1) процессорное время является не единственным процессорным ресурсом, разделяемым при гипертрединге - в целях экономии разделяется и кэш-память.

Насколько я помню, по цепочке конвейера, общими являются все ресурсы до register file. В общей слозности НТ добавляет 5% к площади процессора.
Цитата:
И если вычислительный процесс нагружает только один вычислительный блок и критичен к размеру кэша, то мы теряем в производительности.

Не понятно, что имеется в виду.
Цитата:
а чтобы не усложнять технологию, в ней не реализуется одновременное выполнение инструкций выборки/декодирования в двух потоках. То есть такие инструкции выполняются поочередно. Параллельно же выполняются лишь обычные команды

Ну и что. Стадию декодирования обычно не является критичной в Р4, так как L1 trace cache хранит уже декодированные инструкции.
Цитата:
В конфигурациях с поддержкой технологии Hyper-Threading некоторые потоки программного кода могут конкурировать за доступ к совместно используемым ресурсам, снижая производительность всей системы.

Для таких потоков и ввели инструкции MONITOR/MWAIT .
Цитата:
Все очень прсто по моему IMHO в "хорошем" процессоре не создается такого огромного дисбаланса между производительностю конвеера-декодера и исполняющим (функциональным) устройством. Как пример "плохого" - Р4, где конвеер был в состоянии загрузить только 35% ресурсов процессра. И правильно зачем делать орошее логическое ядро, давайте их продублируем

Откровенно говоря, в К8 дисбаланс ещё больше. При 6 портах запуска (vs. 4 в Р4) K8 может обрабатывать только 3 инструкции одновременно. При этом даже темп в 3 инструкции никогда не достигается.
Цитата:
Поймите для НТ не подходит простое распараллеливание (при таком подходе производительность часто снижается). Для НТ нужны MONITOR/MWAIT для того чтобы хотя бы не тормозило.

Согласен, в ряде случаев для предыдущей версии НТ нужна была оптимизация. С этим не спорил. Как будет в будущей версии - посмотрим.


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
TyyOx91 писал(а):
linuxdrom
Цитата:
Признаюсь такой фитчи нет (и не предвидется) у АМД, потому-что здоровому костили не нужны, они только мешают (C2D также) . Отличить просто, если фитча помогает или хотя бы не мешает всем, то она "костылём" не является (интегрированный контроллер памяти никому не мешает и многим помогает).

Ошибка. Для интегрированного контроллера тоже можно найти ситуации, когда его наличие будет "просаживать" производительность. Например, для многопроцессорных систем на базе АМД необходимо программировать с оглядкой на NUMA. Иначе на неоптимизированных задачах можно получить реальное "проседание" относительно однопроцессорной и с меньшей частотой.

Ключевое слово многопроцессорные, мы же расматривали "костыли" в рамках однопроцессорных систем. Но ведь без NUMA и интегрированного контроллера, было б ещё хуже, чем в тех случаёв когда мы получаем "проседание".
Цитата:
Цитата:
Технические обоснования :
1) K8 (C2D также) являются суперскалярными и конвейерными, то есть параллельно обрабатывают несколько команд с переопределением порядка их следования в целях оптимальной загрузки вычислительных ресурсов.

О!. Спасибо. Не знаю зачем вы это написали, но именно этот аргумент я и хотел привести в качестве показателя нужности мултитрединга.
А именно - Athlon64 может обрабатывать одновременно 3 инструкции за такт (IPC=3) Core может обрабатывать 4 инструкции за такт (или 5 с MacroOP fusion) (IPC=4(5)). В тоже время, для большинства програм average IPC < 2. Замеры можете найти в сети. Недавно видел замеры на linux kernel - для Athlon64 результаты были в районе 1.6-1.8. То есть, по сути дела, до 30-40% ресурсов процессора практически всегда простаивают - всё из-за сильно ограниченной возможности распараллеливания х86 кода. Так почему бы не занять простаивающие ресурсы другим тредом?

Ну почему, у Р4 при простраивающих 65%, прирост производительности даже по вашим словам всего 10-30% (на самом деле намного меньше), ведь должно быть ~185%. Я выше написал почему (даже боле-менее с технического обоснованиями). Если не понятно - другим тредом занять "простаивающие" ресурсы не всегда возможно. И самое главное - другим тредам далеко не всегда нужны именно "простаивающие" ресурсы.
На счёт linux kernel - дайте пожалуста ссылочку. А пока ссылки нет, рискну предположить что там ядро было i386 или i586. Так вот посравнению i386 ядро скомпилированое с максимальными оптимизациями для K8 быстреё yf ~50%. То есть IPC уже 2.7, что не так и плохо. А вобше плохо оптимизированый код и есть одной из главных проблем (хорошо хоть в Linux это можно иправлять).
Кроме того кто сказал что у К8 идеальный конвеер-декодер? Был бы идеальный было б IPC=3.
Цитата:
Цитата:
2) Процессор K8 очень быстро очищает и перезагружает конвейер
3) У C2D выборка команд идет четырьмя одновременно.
4) У C2D имеется сложный блок предсказания ветвлений, который использует самые передовые алгоритмы, сводящие к минимуму вероятность неправильного предсказания и следующей за ним перезагрузки конвейера.

Так и знал, что будете "давить" на длинноконвейерность Р4. :haha: Распространнёная ошибка - считать мультитрединг костылём для длиноконвейерных архитектур. Итаниум и Power5 это очень хорошо доказали.

Дело в том, что на длиноконвейерной архитектуре и дает наибольшую пользу Hyper-Threading, но даже на ней толку мало. Про Итаниум и Power5 к сожалению не знаю, просветите пожалуста.
Упс! Пока писал столько нового появилось
Добавлено спустя 41 минуту, 35 секунд
Цитата:
Цитата:
То есть с НТ должно задествоватся 70% ресурсов процессора (30% про запас ) То есть мы должны получить 100% прироста производительности!

Надо написать очень специфический код, чтобы задействовать 100% ресурсов процессора. (видимо что-то типа интеловского "термометра" для Коры).

Или очень оптимизированый, к чему и надо стремиться.
Цитата:
Цитата:
И если вычислительный процесс нагружает только один вычислительный блок и критичен к размеру кэша, то мы теряем в производительности.

Не понятно, что имеется в виду.

Имелось в виду, к примеру если запустить поток комманд, связанных с вычислениями с плавающей точкой и большими блоками данных то производительность ухудшится.

Цитата:
Цитата:
Все очень прсто по моему IMHO в "хорошем" процессоре не создается такого огромного дисбаланса между производительностю конвеера-декодера и исполняющим (функциональным) устройством. Как пример "плохого" - Р4, где конвеер был в состоянии загрузить только 35% ресурсов процессра. И правильно зачем делать орошее логическое ядро, давайте их продублируем

Откровенно говоря, в К8 дисбаланс ещё больше

Я говорил что К8 хороший?
Цитата:
При 6 портах запуска (vs. 4 в Р4) K8 может обрабатывать только 3 инструкции одновременно. При этом даже темп в 3 инструкции никогда не достигается.

По чему "даже"? Ведь 3 инструкции это в теоретический идеал (я ошибаюсь?)

Цитата:
Цитата:
Поймите для НТ не подходит простое распараллеливание (при таком подходе производительность часто снижается). Для НТ нужны MONITOR/MWAIT для того чтобы хотя бы не тормозило.

Согласен, в ряде случаев для предыдущей версии НТ нужна была оптимизация. С этим не спорил.

Спорить не спорил, но заявлял про 10-30% :)
Цитата:
Как будет в будущей версии - посмотрим.

Ну будем надеяться на лучшее.


 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 02.10.2006
Откуда: Питер
Насколько я думаю, в основном прирост быстродействия в архитектуре P4 при использовании ГТ, был за счет исполнения второго конвеера, когда первый простаивал, загружая 31 стадию.
Так как в Нахале конвейер будет приблизительно раза в два короче, то и польза от ГТ снизится приблизительно раза в 2, т.е. по моим прикидкам, от введения ГТ в Нахала будет прирост 5-15%, что по себе совсем неплохо.
К примеру, если он будет набирать в СПУмарк06 ~ 20К попугаев без ГТ, то с ним будет набирать ~ 21К-23К попужуев :D, хотя фих знает канешна.....


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
Nikols999 писал(а):
Насколько я думаю, в основном прирост быстродействия в архитектуре P4 при использовании ГТ, был за счет исполнения второго конвеера, когда первый простаивал, загружая 31 стадию.
Так как в Нахале конвейер будет приблизительно раза в два короче, то и польза от ГТ снизится приблизительно раза в 2, т.е. по моим прикидкам, от введения ГТ в Нахала будет прирост 5-15%, что по себе совсем неплохо.

Вы оперируете 10-30% как и TyyOx91, что неверно. Откуда вы их берёте?
http://www.fcenter.ru/img/article/CPU/I ... /88070.png


 

Member
Статус: Не в сети
Регистрация: 14.01.2007
linuxdrom, а при чем здесь ссылка на ту давнюю статью (обзор только вышедшего C2D) с Ф-Центра ? Нас ведь интересуют Nehalem и NetBurst. Давайте начнем с того, что никто из нас не может прикидывать ничего в процентах. Мы можем спекулировать только на тему "а нужно ли?". Но поскольку никаких особо ясных спеков о Nehalem'е нет, то о каких-либо числах говорить преждевременно.
Nikols999 писал(а):
в основном прирост быстродействия в архитектуре P4 при использовании ГТ, был за счет исполнения второго конвеера, когда первый простаивал, загружая 31 стадию.

Что это значит?:spy:

_________________
Цель спора есть изменение природы истины.


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
Obscured писал(а):
linuxdrom, а при чем здесь ссылка на ту давнюю статью (обзор только вышедшего C2D) с Ф-Центра ? Нас ведь интересуют Nehalem и NetBurst.

Ссылка к тому, что по статье видно, что прироста в 10-30% производительности от НТ (не понятным образом появшихся у TyyOx91) нету.


 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 02.10.2006
Откуда: Питер
Obscured писал(а):
в основном прирост быстродействия в архитектуре P4 при использовании ГТ, был за счет исполнения второго конвеера, когда первый простаивал, загружая 31 стадию.

Ну я думал, что это знает каждый обитатель Клокерсов.ру но так и ббыть я поищу для вас мсатериалы, которые вам лично лень прочитать, про известную технологию Гипертрейдинг, которые в избытке обнаруживаются здесь.....


 

Member
Статус: Не в сети
Регистрация: 14.01.2007
linuxdrom
Т.е. Вы сравнивали XE965 c D945?... Так там прирост если и будет, то от наращивания частоты, а не от ГТ. Надо найти сравнение одноядерных Пней: одного с ГТ, другого без.
Nikols999
Извольте-с.
Добавлено спустя 5 минут, 18 секунд
Цитата:
Фактически, Intel вынуждена была отказаться от поддержки Hyper-Threading в современных настольных многоядерных процессорах только из-за неэффективной организации обмена данными через шину.
;) поиск

_________________
Цель спора есть изменение природы истины.


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
Obscured писал(а):
linuxdrom
Т.е. Вы сравнивали XE965 c D945?... Так там прирост если и будет, то от наращивания частоты, а не от ГТ.

Нет я сравнивал удельную производительность на мегагерц. У XE965 она больше на ~5% по сравнению с D945, правда заслуга в этом шины на 1066МГц (у D945 800МГц). Причём производительность на гигагерц в некоторых задачах у XE965 меньше на 10% чем у D945 и вина в этом НТ (от увеличения шины производительность не уменшается).
Цитата:
Надо найти сравнение одноядерных Пней: одного с ГТ, другого без.

Лучше двухядерных, ведь Nehalem будет многоядерным. Мне икать лень :roll: , а та давняя статья с Ф-Центра попалась первой


 

Member
Статус: Не в сети
Регистрация: 14.01.2007
linuxdrom
Ок.

_________________
Цель спора есть изменение природы истины.


 

Member
Статус: Не в сети
Регистрация: 05.11.2003
Откуда: Новосибирск
Хамство удалено.

Hil.
Отредактировано модератором: Hil. Дата: 02.04.2007 22:29


 

Member
Статус: Не в сети
Регистрация: 22.06.2004
linuxdrom
Цитата:
Ключевое слово многопроцессорные, мы же расматривали "костыли" в рамках однопроцессорных систем. Но ведь без NUMA и интегрированного контроллера, было б ещё хуже, чем в тех случаёв когда мы получаем "проседание".

Вообще-то мы рассматривали общий случай - что можно назвать костылями, а что нет. И на сколько я понял, по вашему костыль - это фитча которая даёт прибавку в производительности в одной области, за счёт уменьшения производительности в другой. Никакой привязки к "частным" случаям не было. Поэтому пример с двухпроцессорной системой - кошерный.
Цитата:
Ну почему, у Р4 при простраивающих 65%, прирост производительности даже по вашим словам всего 10-30% (на самом деле намного меньше), ведь должно быть ~185%.

Я не знаю как вы насчитали 185%. Прирост производительности не может быть больше, чем процент "простаивающих" ресурсов. При этом максимальный выигрышь может быть только если второй тред использует простаивающие вычислительные блоки.
Цитата:
Если не понятно - другим тредом занять "простаивающие" ресурсы не всегда возможно. И самое главное - другим тредам далеко не всегда нужны именно "простаивающие" ресурсы.

Не думаю, что кто-то надеялся на КПД в 100%. Если второй тред сможет использовать хоть часть простаивающих исполнительных блоков в определённые отрезки времени на некоторых задачах - это уже может оправдать добавление такой логики. Тем более, что это не сильно сказывается на увеличении кристала (на Р4 - 5%). Количество вычислительных ресурсов в процессоре всё время растёт. При этом возможность параллелезации х86 кода не улучшилась (так как это больше зависит от конкретных алгоритмов, чем от конкретного кода). Было бы глупо не попытаться использовать простаивающие ресурсы. Даже на не самой удачной реализации НТ в Р4 на многих задачах был заметен значительный выигрыш - до 30%. Кроме того, на сколько я вас понял - больше всего вас заботит падение производительности на некоторых задачах - ну что же, это challenge для разработчиков Интел. Но как вам уже сказали - не обязательно новая реализация НТ будет в точности повторять предыдущую. Поэтому странно, что вы так упорно пытаетесь доказать "ненужность" НТ даже не дождавшись хоть какой нибудь более менее вразумительной информации.
Цитата:
На счёт linux kernel - дайте пожалуста ссылочку. А пока ссылки нет, рискну предположить что там ядро было i386 или i586. Так вот посравнению i386 ядро скомпилированое с максимальными оптимизациями для K8 быстреё yf ~50%.

Нет. Тестировали на последних версиях ядер. Ссылка была где-то на xtremesystems.org. К сожалению сейчас уже не нахожу. Но вот вам другая интересная ссылка:
http://cadal.cse.nsysu.edu.tw/publicati ... essors.pdf
Иследование максимального ILP для х86 кода на типтчных приложениях без привязки к конкретной архитектуре. Получилось в среднем 2.2 инструкции за такт. Это максимум. На реальных архитектурах гораздо меньше - 0.8-1.0 для типтчных десктопных программ по оценкам anandtech.com:
http://www.anandtech.com/cpuchipsets/sh ... spx?i=2657
Цитата:
Про Итаниум и Power5 к сожалению не знаю, просветите пожалуста.

http://www.princeton.edu/~jdonald/resea ... tecito.pdf
http://www-941.ibm.com/collaboration/wi ... chitecture
Цитата:
Спорить не спорил, но заявлял про 10-30%

10-30% на оптимизированном коде? С чем вы не согласны?
http://www.hardwareanalysis.com/action/ ... icle/1557/


 

Member
Статус: Не в сети
Регистрация: 25.03.2005
Откуда: МО
TyyOx91 писал(а):
Dryden
Цитата:
Нехалему имхо такие костыли не нужны - именно из-за намного более удачной архитектуры.

Признайтесь честно - вы называете HT "костылём" патамучта такой фитчи нет (и не предвидется) у АМД? :D. И почему же это "костыль" если сможет добавить к многопоточной производительности N-ое количество процентов? Вобще интересно - как отличить какая фитча является костылём, а какая нет. Можно ли в таком контексте считать интегрированный контроллер памяти AMD - "костылём"? :tooth:
давайте вспомним базовые понятия. Костыль - это такая подпорка, которая помогает хромому ходить. И даже бегать.
Я называю ГТ костылем НБ, т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами. Главный костыль - частота. Еще один - ГТ. На костыле ГТ Пи4 бегает быстрее до 30%! :tooth:
Цитата:
Добавлено спустя 3 минуты, 1 секунду
linuxdrom
Цитата:
неудачный ГТ будет хрошим дополнением для Нехалема

Ещё один... с хрустальным шаром. Кто вам сказал, что HT будет неудачным?
А он этого не утверждал. Вы бы внимательнее читали ;)

_________________
Обзоры фильмов без спойлеров на okolnica.ru


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 92 • Страница 3 из 5<  1  2  3  4  5  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 16


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan