Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 92 • Страница 4 из 5<  1  2  3  4  5  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 
Прилепленное (важное) сообщение

роБОТяга
Статус: Не в сети
Регистрация: 05.07.2005
Ждём Ваших отзывов о материале.
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!



Партнер
 

Member
Статус: Не в сети
Регистрация: 22.06.2004
Dryden
Цитата:
давайте вспомним базовые понятия. Костыль - это такая подпорка, которая помогает хромому ходить. И даже бегать.
Я называю ГТ костылем НБ, т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами. Главный костыль - частота. Еще один - ГТ. На костыле ГТ Пи4 бегает быстрее до 30%!

Ага. Если я вас правильно понял, то дело не в том, что "приклеивают", а дело в том, к чему "приклеивают"? То есть, та же технология "приклеенная" к Core будет не костылём, а очень даже полезной фитчей? :tooth:
Цитата:
т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами.

Интересно услышать ваш критерий неудачности. Если это скорость/энергопотребление, то можно ли считать архитектуру К8 неудачной? Ну а ИКП - соответственно, костылём? :?:


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
TyyOx91 писал(а):
Цитата:
Ну почему, у Р4 при простраивающих 65%, прирост производительности даже по вашим словам всего 10-30% (на самом деле намного меньше), ведь должно быть ~185%.

Я не знаю как вы насчитали 185%. Прирост производительности не может быть больше, чем процент "простаивающих" ресурсов. При этом максимальный выигрышь может быть только если второй тред использует простаивающие вычислительные блоки.

65% "простаивающих" ресурсов - 35% не "простаивающих" ресурсов . 65/35=1,857=185%

Цитата:
Даже на не самой удачной реализации НТ в Р4 на многих задачах был заметен значительный выигрыш - до 30%.

Неправда, не в многих, а в некоторых отимизированых(а иногда бывало и 50% почему Вы невспомнили про них?)
Цитата:
Цитата:
На счёт linux kernel - дайте пожалуста ссылочку. А пока ссылки нет, рискну предположить что там ядро было i386 или i586. Так вот посравнению i386 ядро скомпилированое с максимальными оптимизациями для K8 быстреё на ~50%.

Нет. Тестировали на последних версиях ядер. Ссылка была где-то на xtremesystems.org. К сожалению сейчас уже не нахожу.

Дело в том, что ядро Linux можно скомпилировать под очень многие архитектуры и с разными оптимизациями, и новизна версии на это невлияет. Тоесть "последняя версия" не означает что она была собрана для AMD64. А тест и я ненахожу :weep:
TyyOx91 Насчёт Power5 я немного недопонял, у меня на работе была рабочая станция Мас Power5, и дополнительных логоческих ядер там замечено не было, как было 2 прцесора, так и есть.
Цитата:
Цитата:
Спорить не спорил, но заявлял про 10-30%

10-30% на оптимизированном коде? С чем вы не согласны?
http://www.hardwareanalysis.com/action/ ... icle/1557/

Я несогласен с тем что Вы пытались представить "10-30% на оптимизированном коде" как 10-30% производительности, которые есть всегда, что является не правдой. По вышей ссылке получается от -3% до +38%, а среднее ~6%. Причём это для однопроцесорной системы, для многопроцесорной результат скорее всего будет ещё хуже.


 

Member
Статус: Не в сети
Регистрация: 25.03.2005
Откуда: МО
TyyOx91 писал(а):
Dryden
Цитата:
давайте вспомним базовые понятия. Костыль - это такая подпорка, которая помогает хромому ходить. И даже бегать.
Я называю ГТ костылем НБ, т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами. Главный костыль - частота. Еще один - ГТ. На костыле ГТ Пи4 бегает быстрее до 30%!

Ага. Если я вас правильно понял, то дело не в том, что "приклеивают", а дело в том, к чему "приклеивают"? То есть, та же технология "приклеенная" к Core будет не костылём, а очень даже полезной фитчей? :tooth:
дайте костыль (а лучше пару) здоровому человеку и попросите его пройтись... А лучше пробежаться ;)
Цитата:
Цитата:
т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами.

Интересно услышать ваш критерий неудачности. Если это скорость/энергопотребление, то можно ли считать архитектуру К8 неудачной? Ну а ИКП - соответственно, костылём? :?:
В том, что без вышеперечисленных костылей больной вел себя как и положено больному. Неэффективно он себя вел. А К8 без ИКП - это ж К7 - вполне себе удачная архитектура :P

_________________
Обзоры фильмов без спойлеров на okolnica.ru


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
Цитата:
дайте костыль (а лучше пару) здоровому человеку и попросите его пройтись... А лучше пробежаться ;)

Ага, я уже писал об этом :beer:
Цитата:
Цитата:
Цитата:
т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами.

Интересно услышать ваш критерий неудачности. Если это скорость/энергопотребление, то можно ли считать архитектуру К8 неудачной? Ну а ИКП - соответственно, костылём? :?:
В том, что без вышеперечисленных костылей больной вел себя как и положено больному. Неэффективно он себя вел. А К8 без ИКП - это ж К7 - вполне себе удачная архитектура :P

Даже если брать скорость/энергопотребление, то архитектуру К8 нельзя считать неудачной, как на момет своего выхода она была лучше других. А вот Р4 таким похвастатся не может, значит неудачен.
"К8 без ИКП - это ж К7" - несовсем так, но если даже с такой позиции подходить, то К7 по нашему критерию удачности - удачная архитектура, то есть здоровая, отсюда вывод - ИКП не костыли.


 

Member
Статус: Не в сети
Регистрация: 22.06.2004
linuxdrom
Цитата:
65% "простаивающих" ресурсов - 35% не "простаивающих" ресурсов . 65/35=1,857=185%

65% "простаивающих" ресурсов в Р4? Ерунда! Trace Cache способен выдавать по 3 микроинструкции за такт на 4 порта.
Цитата:
Неправда, не в многих, а в некоторых отимизированых(а иногда бывало и 50% почему Вы невспомнили про них?)

Достаточно и то, что НТ давал ускорение при запуске двух независимых задач. Но не стоит сводить к обсуждению процентов. Вы почему-то пытаетесь отрицать перспективы НТ, но железных аргументов я так и не услышал.
Цитата:
Я несогласен с тем что Вы пытались представить "10-30% на оптимизированном коде" как 10-30% производительности, которые есть всегда, что является не правдой.

Я не пытаюсь доказать, что они есть всегда, я пытаюсь доказать что они есть (пусть и не всегда) (Чувствуете разницу?)
Dryden
Цитата:
дайте костыль (а лучше пару) здоровому человеку и попросите его пройтись... А лучше пробежаться

Цитата:
А К8 без ИКП - это ж К7 - вполне себе удачная архитектура

К7, который практически везде сливал Р4 и практически ничем не отличается от К8, кроме ИКП (и 64 бит, которые до сих пор мало используются). Но по вашим словам К7 - хорошая архитектура. Значит ей не нужен был костыль в виде ИКП. :lol: Впрочем вы так и не дали критерия "удачности".
linuxdrom
Цитата:
Даже если брать скорость/энергопотребление, то архитектуру К8 нельзя считать неудачной, как на момет своего выхода она была лучше других. А вот Р4 таким похвастатся не может, значит неудачен.

Да ну? Почитайте тесты Northwood vs. K7 - здесь их часто приводили. Видимо будете удивлены.


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
Цитата:
Цитата:
65% "простаивающих" ресурсов - 35% не "простаивающих" ресурсов . 65/35=1,857=185%

65% "простаивающих" ресурсов в Р4? Ерунда! Trace Cache способен выдавать по 3 микроинструкции за такт на 4 порта.

"Типичный набор инструкций использует ресурсы процессора Intel с микроархитектурой NetBurst всего лишь на 35%" - http://www.intel.com/cd/ids/developer/e ... htm?page=4
Цитата:
Цитата:
Я несогласен с тем что Вы пытались представить "10-30% на оптимизированном коде" как 10-30% производительности, которые есть всегда, что является не правдой.

Я не пытаюсь доказать, что они есть всегда, я пытаюсь доказать что они есть (пусть и не всегда) (Чувствуете разницу?)

Я рад что мы пришли к взаимопониманию :beer:

Цитата:
К7, который практически везде сливал Р4 и практически ничем не отличается от К8, кроме ИКП (и 64 бит, которые до сих пор мало используются)

K7 появился вовремена Р3, и был не хуже его, значит - удачен. И отличия есть и другие, я думал Вы знаете.
Цитата:
Цитата:
Даже если брать скорость/энергопотребление, то архитектуру К8 нельзя считать неудачной, как на момет своего выхода она была лучше других. А вот Р4 таким похвастатся не может, значит неудачен.

Да ну? Почитайте тесты Northwood vs. K7 - здесь их часто приводили. Видимо будете удивлены.

Про K7 сказал выше, а Northwood это не первые Р4, первые Willamette и они проигрывали как K7, так и Р3, а значит были неудачны.


 

Member
Статус: Не в сети
Регистрация: 22.06.2004
linuxdrom
Цитата:
"Типичный набор инструкций использует ресурсы процессора Intel с микроархитектурой NetBurst всего лишь на 35%" - http://www.intel.com/cd/ids/developer/e ... htm?page=4

Читайте внимательнее - Интел имеет в виду исполнительные блоки, я же говорил о конвейере. Считать исполнительные блоки нет смысла - их число обычно избыточно. Практически ни один процессор не способен одновременно загрузить все свои исполнительные блоки (конвейер не позволит). Впрочем, если взять за основу данные Ананда о среднем IPC = 1, то их утверждение верно и в отношении конвейера. Но тогда это верно для всех х86 процессоров.
Цитата:
Про K7 сказал выше, а Northwood это не первые Р4, первые Willamette и они проигрывали как K7, так и Р3, а значит были неудачны.

Вилли был где-то хуже, где-то лучше (Quake3 и кодирование). Не в этом дело. На тот момент НБ был новой и прогрессивной архитектурой. Через короткое время, перейдя на 130 нм. увеличив кэш и частоту шины, он раскрыл свой потенциал и уел всех конкурентов. А потом вышел К8..., а затем Core... Всё идёт по кругу, а вы спорите о каких-то нюансах. Если на то пошло, то первые низкочастотные оптероны тоже не могли соперничать с влавствующим в то время 3.2Ггц Норсвудом. Все доводы о неудачност НБ не выдерживают критики, по той причине, что был определённый промежуток времени, когда Р4 имел практически абсолютное доминирование (смотрите тесты 3.2ГГц Р4 вс. Атлон ХР 3200+).


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
TyyOx91 писал(а):
Читайте внимательнее - Интел имеет в виду исполнительные блоки, я же говорил о конвейере. Считать исполнительные блоки нет смысла - их число обычно избыточно. Практически ни один процессор не способен одновременно загрузить все свои исполнительные блоки (конвейер не позволит). Впрочем, если взять за основу данные Ананда о среднем IPC = 1, то их утверждение верно и в отношении конвейера. Но тогда это верно для всех х86 процессоров.

Смотрите и тут мы пришли к тому, что я говорил изначально о "хорошем" процесоре: в "хорошем" процессоре не создается такого огромного дисбаланса между производительностю конвеера-декодера и исполняющим (функциональным) устройством.
Поэтому надо совершенствовать конвеер-декодер, ну или если идти по вашему пути, то дублировать (НТ). Однако дублирование (НТ), не есть оптимальным вариантом. Можно также устранять избыточные исполнительные блоки, и за освобожденые ресурсы создавать лишние ядра (как пример 80 ядерный прототип от Интел) .
Цитата:
Цитата:
Про K7 сказал выше, а Northwood это не первые Р4, первые Willamette и они проигрывали как K7, так и Р3, а значит были неудачны.

Вилли был где-то хуже, где-то лучше (Quake3 и кодирование). Не в этом дело. На тот момент НБ был новой и прогрессивной архитектурой.

Дело в том что, прогресивность не делает архитектуру автоматом "хорошей" и удачной, и НБ это доказала. К примеру С2D и К8 далеко не такие прогрессивные, но помоему ИМНО являются удачными.
(смотрите тесты 3.2ГГц Р4 вс. Атлон ХР 3200+)->(см. тесты 1.8ГГц Р4 вс. Атлон ХР 1800+)
Цитата:
Достаточно и то, что НТ давал ускорение при запуске двух независимых задач.

Вы опять забыли слова иногда, невсегда, обычно.


 

Member
Статус: Не в сети
Регистрация: 22.06.2004
linuxdrom
Цитата:
в "хорошем" процессоре не создается такого огромного дисбаланса между производительностю конвеера-декодера и исполняющим (функциональным) устройством.

Вы упорно не хотите вникнуть в то, о чём я писал выше и возможно даже не читали приведённые мной ссылки. Проблема ведь не в дисбалансе между шириной конвейера и количеством исполнительных устройств. Проблема в том что в большинстве задач сам конвейер не загружен даже на 70% (по некоторым оценкам - даже меньше). В болшинстве алгоритмов средний теоретический ILP (instruction level parallelism) не превышает 2.2-2.5 (из-за зависимости инструкций по данным). Прибавте к этому последовательные инструкции, branch miss-prediction, cache miss rate и получите что на реальном процессоре средний IPC < 2 (по некоторым оценкам - гораздо меньше). В результате даже такие ультраширокие процессоры с явным параллелизмом как Итаниум (6-wide issue) загружены в среднем меньше чем на половину.
Цитата:
Поэтому надо совершенствовать конвеер-декодер, ну или если идти по вашему пути, то дублировать (НТ). Однако дублирование (НТ), не есть оптимальным вариантом. Можно также устранять избыточные исполнительные блоки, и за освобожденые ресурсы создавать лишние ядра (как пример 80 ядерный прототип от Интел) .

В конечном счёте всё сводится к "войне" концепций - ILP vs. TLP (thread level parallelism). И судя по последним направлениям AMD, Intel, IBM и SUN - последняя концепция начинает выигрывать. Но прикол в том, что multithreading в какой-то мере позволяет совместить обе эти концепции.
Цитата:
Дело в том что, прогресивность не делает архитектуру автоматом "хорошей" и удачной, и НБ это доказала.

Я так и не понял в чём заключается неудачность НБ. Архитектура с выской частотой и низким ILP тоже имеет право на существование. Кстати именно такой архитектурой является архитектура К8 по отношении к архитектуре Итаниум. Что касается НБ, то можно сказать, что были неудачные экземпляры в этой архитектуре (прескот - в основном за счёт энергопотребления). Но всю архитектуру неудачной я бы не назвал.
Цитата:
иногда, невсегда, обычно.

Я бы сказал "обычно". Но ведь то же самое можно сказать о любой фитче в процессоре, не правда ли? "Обычно" обычно даже не упоминается в отношении того же ИКП. ;)


 

Member
Статус: Не в сети
Регистрация: 08.06.2006
TyyOx91 писал(а):
Ошибка. Для интегрированного контроллера тоже можно найти ситуации, когда его наличие будет "просаживать" производительность. Например, для многопроцессорных систем на базе АМД необходимо программировать с оглядкой на NUMA. Иначе на неоптимизированных задачах можно получить реальное "проседание" относительно однопроцессорной и с меньшей частотой. Смотрим тесты:http://www.fcenter.ru/online.shtml?articles/har...otherboards/19826

Прям пальцем в небо. там просаживается за счет латентности, а не за счет контроллера.
Цитата:
Во-вторых, платформа Quad FX зачастую оказывается медленнее обычной однопроцессорной Socket AM2 системы из-за более высокой латентности подсистемы памяти. Технология NUMA, доказавшая свою эффективность в серверах, в настольных системах часто оказывается вредна, в чём мы могли воочию убедиться.

Смотрим выводы.
TyyOx91 писал(а):
В этом смысле, мультитрединг ничем не отличается от ИКП - так же требуется явная оптимизация.

Ну это вообще без комментариев.

_________________
Кратчайшее расстояние между двумя точками это точка.


 

Member
Статус: Не в сети
Регистрация: 25.03.2005
Откуда: МО
TyyOx91 писал(а):
Dryden
Цитата:
дайте костыль (а лучше пару) здоровому человеку и попросите его пройтись... А лучше пробежаться

Цитата:
А К8 без ИКП - это ж К7 - вполне себе удачная архитектура

К7, который практически везде сливал Р4 и практически ничем не отличается от К8, кроме ИКП (и 64 бит, которые до сих пор мало используются). Но по вашим словам К7 - хорошая архитектура. Значит ей не нужен был костыль в виде ИКП. :lol:
давайте опять определимся со словами. "Сливал" используется в ассенизационной отрасли, и если мы не спускаем процессоры в унитаз, то этот термин нас не касается. Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...
Цитата:
Впрочем вы так и не дали критерия "удачности".
Как и вы. Но меня об этом никто и не просил. А вот вы претендуете, но также не обосновываете. ;)

_________________
Обзоры фильмов без спойлеров на okolnica.ru


 

Member
Статус: Не в сети
Регистрация: 22.06.2004
Dogmatik
Цитата:
Прям пальцем в небо. там просаживается за счет латентности, а не за счет контроллера.

Вот-вот - из-за высокой латентности памяти. А почему она высокая? Правильно - из-за индивидуальных встроенных контроллеров и вынужденной организации NUMA системы. В системах с общей памятью таких проблем нет.
Цитата:
Ну это вообще без комментариев.

Ну почему же? Прокоментируйте - послушаем. Но прежде, чем сказать глупость почитайте что такое NUMA и как под неё оптимизируют.
Dryden
Цитата:
давайте опять определимся со словами. "Сливал" используется в ассенизационной отрасли, и если мы не спускаем процессоры в унитаз, то этот термин нас не касается.

Бизнес-сленг:
Слить – 1. проиграть; 2. продать ненужный или переоцененный актив; 3. распространить конфиденциальную информацию.
Первое определение как раз подходит. Да и вы слово "костыль" тоже не по прямому назначению используете.

Цитата:
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...

До сих пор разговор шел о производительности. Причём здесь цена и т.д.? Впрочем, в разгоне Р4 так же был лучше.
Цитата:
Как и вы. Но меня об этом никто и не просил.

Ну как же так? Я же вас попросил.
Цитата:
А вот вы претендуете, но также не обосновываете.

Не понял - на что я претендую? Я же не развешивал ярлыки однознaчной удачности/неудачности на ту или иную архитектуру. Что именно я должен обосновывать?


 

Member
Статус: Не в сети
Регистрация: 12.02.2005
Dryden писал(а):
"Сливал" используется в ассенизационной отрасли, и если мы не спускаем процессоры в унитаз, то этот термин нас не касается.

Термин этот вас, аэмдэшников (или твоими словами - ассенизаторов), ещё как касается.


 

Member
Статус: Не в сети
Регистрация: 24.10.2003
Откуда: Novosibirsk
Dryden писал(а):
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...


Забыли добавить - на каком классе задач. Ибо на широком классе задач в численных методах P4 опережал не только K7 (здесь и первые Willamete выигрывали у практически равночастотных K7, а впоследствии с увеличением разности реальных частот P4 вообще не оставлял K7 никаких шансов) но и K8.
И кстати, до сих пор опережает, как это ни удивительно.

P4 никогда не проигрывал K8 по производительности там, где она была реально нужна.


 

Member
Статус: Не в сети
Регистрация: 25.03.2005
Откуда: МО
TyyOx91 писал(а):
[off]Бизнес-сленг:
Слить – 1. проиграть; 2. продать ненужный или переоцененный актив; 3. распространить конфиденциальную информацию.
Первое определение как раз подходит. Да и вы слово "костыль" тоже не по прямому назначению используете.
это был во первых юмор, во вторых, намек на то, что использовали утверждение однозначное в ситуации неоднозначной. Отсюда следующий вопрос:
Цитата:
Цитата:
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...

До сих пор разговор шел о производительности. Причём здесь цена и т.д.? Впрочем, в разгоне Р4 так же был лучше.
нет, речь шла о "сливал". вы сравнили два процессора, причем выбрали почему-то процессор за 100$ и 200$ (упрощенно). Да, знаю, исходя из рейтинга. Но обычные люди-то выбирают систему именно исходя из производительность\цена.
Цитата:
Цитата:
Как и вы. Но меня об этом никто и не просил.

Ну как же так? Я же вас попросил.
Цитата:
А вот вы претендуете, но также не обосновываете.

Не понял - на что я претендую? Я же не развешивал ярлыки однознaчной удачности/неудачности на ту или иную архитектуру. Что именно я должен обосновывать?
вы попросили объяснить, почему я считаю неудачной. Я объяснил. Вы же, хотя повесили однозначный ярлык "слива" (без "имхо"), свое мнение не обосновали.[/off]
Добавлено спустя 4 минуты, 25 секунд
Lord Violator писал(а):
[off]
Dryden писал(а):
"Сливал" используется в ассенизационной отрасли, и если мы не спускаем процессоры в унитаз, то этот термин нас не касается.

Термин этот вас, аэмдэшников (или твоими словами - ассенизаторов), ещё как касается.
как злобно :haha:
Не надо этот вечный спор так близко к сердцу принимать ;)
Кстати, у меня IQ тоже примерно 130-140 (давно уже не мерялся, точно не помню), но мне это не мешает признать то, что мне не нравится. К примеру - я не разбираюсь в архитектуре процессоров, или - линейка Core2Duo лучше чем K8 по сочетанию ряда потребительских характеристик (не всех - по цене не лучше).[/off]
Добавлено спустя 1 минуту, 15 секунд
Cronos писал(а):
Dryden писал(а):
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...

Забыли добавить - на каком классе задач. Ибо на широком классе задач в численных методах P4 опережал не только K7 (здесь и первые Willamete выигрывали у практически равночастотных K7, а впоследствии с увеличением разности реальных частот P4 вообще не оставлял K7 никаких шансов) но и K8.
И кстати, до сих пор опережает, как это ни удивительно.
P4 никогда не проигрывал K8 по производительности там, где она была реально нужна.
думаю, не обижу вас если попрошу определиться с областью "реально нужных" задач?

_________________
Обзоры фильмов без спойлеров на okolnica.ru


 

Member
Статус: Не в сети
Регистрация: 01.03.2007
Откуда: Київ
TyyOx91 писал(а):
Dogmatik
Цитата:
Прям пальцем в небо. там просаживается за счет латентности, а не за счет контроллера.

Вот-вот - из-за высокой латентности памяти. А почему она высокая? Правильно - из-за индивидуальных встроенных контроллеров и вынужденной организации NUMA системы. В системах с общей памятью таких проблем нет.

В системах с общей памятью таких проблем нет, по тому что латентность там всегда высокая. Я уже обращал внимание на то, что без NUMA и интегрированного контроллера, было б ещё хуже, чем в тех случаёв когда мы получаем "проседание"
Добавлено спустя 6 минут, 59 секунд
TyyOx91 писал(а):

Но прежде, чем сказать глупость почитайте что такое NUMA и как под неё оптимизируют.

NUMA предназначена для серверов, а на нормальных серверах и так всё оптимизируют. Поэтому NUMA никаких проблем там не создает, а преимущества имеет явные. Поэтому глупость сказали Вы. PS. Без обид. Частично в Вашем заблуждении виновата AMD, котроя прозиционирует Quad FX как игровую платформу, хотя намного логичней что Quad FX ближе к рабочим станциям.
Добавлено спустя 23 минуты, 43 секунды
Cronos писал(а):
Dryden писал(а):
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...

Забыли добавить - на каком классе задач. Ибо на широком классе задач в численных методах P4 опережал не только K7 (здесь и первые Willamete выигрывали у практически равночастотных K7, а впоследствии с увеличением разности реальных частот P4 вообще не оставлял K7 никаких шансов) но и K8.
И кстати, до сих пор опережает, как это ни удивительно.

P4 никогда не проигрывал K8 по производительности там, где она была реально нужна.

Я так понял, у Вас очень маленький класс задач где реально нужна производительность. :lol:


 

Member
Статус: Не в сети
Регистрация: 22.06.2004
Dryden
Цитата:
нет, речь шла о "сливал". вы сравнили два процессора, причем выбрали почему-то процессор за 100$ и 200$ (упрощенно).

Цитата:
вы попросили объяснить, почему я считаю неудачной. Я объяснил

Стоп! Давайте будем отделять мух от котлет. Изначально речь шла об архитектуре (и перспективах HT для той или иной архитектуры), а не об упаковонном в коробку процессоре с наклеенной ценой. Вы утверждали, что архитектура НБ является неудачной, а НТ, соответственно, является костылём к этой архитектуре. Когда я попросил вас обосновать неудачность, вы почему-то привели цену процессора как главный довод неудачности архитектуры (хотя цена к архитектуре ну прям никаким боком...). Давайте хоть в этой ветке отвлечёмся от марктинговых стратегий фирм Интел и АМД, а будем рассматривать непосредственно архитектуры.
Цитата:
Вы же, хотя повесили однозначный ярлык "слива" (без "имхо"), свое мнение не обосновали.

Я не навешивал ярлыки, я привёл довольно известный факт, подтверждение которому можно увидеть например здесь:
http://www.anandtech.com/showdoc.aspx?i=1834&p=7
Архитектуру К7 неудачной я не называл (так как я убеждён что это она очень даже удачна).
linuxdrom
Цитата:
В системах с общей памятью таких проблем нет, по тому что латентность там всегда высокая.

На самом деле, разница не слишком большая, а в двухсокетных конфигурациях разница совсем нивилируется (в систем с общей памятью латентность всегда постоянная):
#77
В 4-сокетных конфигах, в системах на Оптеронах латентность уже будет хуже чем у Зионов. Ну, а про 8-сокетные уже и подумать страшно (видимо поэтому на них, извиняюсь, "забили"...)
Цитата:
Я уже обращал внимание на то, что без NUMA и интегрированного контроллера, было б ещё хуже, чем в тех случаёв когда мы получаем "проседание"

NUMA - это "вещь" хорошая... если используемому софту о ней "известно". Если нет - то страдает не только производительность однопоточных программ, но и scalability на многопоточных.
http://www.anandtech.com/printarticle.aspx?i=2879
NUMA вообщето не является необходимой для 2,4,8-процессороных систем. В случае с АМД она просто вынужденная. Был проект Horus - обьеденить оптероны в систему с реально (не виртуально) общей памятью, но что-то там не заладилось с чипсетом.
Цитата:
NUMA предназначена для серверов, а на нормальных серверах и так всё оптимизируют. Поэтому NUMA никаких проблем там не создает, а преимущества имеет явные. Поэтому глупость сказали Вы. PS. Без обид. Частично в Вашем заблуждении виновата AMD, котроя прозиционирует Quad FX как игровую платформу, хотя намного логичней что Quad FX ближе к рабочим станциям.

Я не заблуждаюсь в отношении NUMA, и не отрицаю её "нужность" для серверов, как вы, видимо, подумали. Просто у медали есть две стороны - помните с чего началось? "Не-костыль эта фитча которая не мешает" - я привёл пример, что даже такая полезная фитча, как ИКП - тоже иногда мешает.


 

Member
Статус: Не в сети
Регистрация: 25.03.2005
Откуда: МО
TyyOx91 писал(а):
Стоп! Давайте будем отделять мух от котлет. Изначально речь шла об архитектуре (и перспективах HT для той или иной архитектуры), а не об упаковонном в коробку процессоре с наклеенной ценой. Вы утверждали, что архитектура НБ является неудачной, а НТ, соответственно, является костылём к этой архитектуре. Когда я попросил вас обосновать неудачность, вы почему-то привели цену процессора как главный довод неудачности архитектуры (хотя цена к архитектуре ну прям никаким боком...). Давайте хоть в этой ветке отвлечёмся от марктинговых стратегий фирм Интел и АМД, а будем рассматривать непосредственно архитектуры.
цену я привел как довод против "слива". Кстати, по чистой производительности с равными рейтингами сливал только Бартон 3000-3200. Торобреды 2800 кое-где обгоняли и 3ггц П4.
Неудачность архитектуры NB я кратко выразил, определю подробнее:
1) Сложная архитектура, требующая серьезных оптимизаций в универсальных задачах (лишняя работа программерам "просто так").
2) В то же время берущая грубой силой (частотой). (А зачем тогда было наворачивать сложность, если еще и частоту надо задирать?)
3) В то же время вовсю крутящаяся на холостом ходу (была на фцентре статья про некие внутренние механизмы...эммм... replay это вроде называлось)
4) потребовалось хитро извернуться, чтобы уменьшить холостой ход, чем и стал HT. Что опять же проявлялось не везде, не однозначно, и требовало оптимизаций.
У вас может появиться соблазн поспорить с этими нюансами. Например сказать: "А вот у конкурента было зато так" или "ну и что зато продавался хорошо". Т.е. привести аргументы, не имеющие прямого отношения, зато 100% истинные. Но давайте не будем этого делать, т.к. я привел вам обоснование своего отношения, и отношения многих других и дальнейший спор ничего не изменит. Желаю всяческих успехов и приятного времяпрепровождения :)
Цитата:
Цитата:
Вы же, хотя повесили однозначный ярлык "слива" (без "имхо"), свое мнение не обосновали.

Я не навешивал ярлыки, я привёл довольно известный факт, подтверждение которому можно увидеть например здесь:
http://www.anandtech.com/showdoc.aspx?i=1834&p=7
Архитектуру К7 неудачной я не называл (так как я убеждён что это она очень даже удачна).
о том и речь. Мы говорили об "удачности" K8 без ИКП, что упрощенно говоря есть К7 :)

_________________
Обзоры фильмов без спойлеров на okolnica.ru


 

Member
Статус: Не в сети
Регистрация: 05.11.2003
Откуда: Новосибирск
Dryden
Цитата:
Сложная архитектура
Господь с тобой, п4 прост как тапок. Ты хоть сравни хотя бы с к7.

_________________
аналоговый сигнал всегда лучше цифрового, ибо он непрерывный, а цифровой - дискретный :D


 

Member
Статус: Не в сети
Регистрация: 14.01.2007
Я так понимаю. что архитектурно Penryn мало чем будет отличаться от Conroe - 45нм., SSE4, увеличение кэша.... Т.е. ничего особенного.
А вот Nehalem будут отличаться намного больше: там и CSI, и КП, и наверное будет конвейер изменен - может там количество стадий увеличится? В Nehalem'е Интел обещает улучшить блок вычислений FP и т.д.

_________________
Цель спора есть изменение природы истины.


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 92 • Страница 4 из 5<  1  2  3  4  5  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 24


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan