давайте вспомним базовые понятия. Костыль - это такая подпорка, которая помогает хромому ходить. И даже бегать. Я называю ГТ костылем НБ, т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами. Главный костыль - частота. Еще один - ГТ. На костыле ГТ Пи4 бегает быстрее до 30%!
Ага. Если я вас правильно понял, то дело не в том, что "приклеивают", а дело в том, к чему "приклеивают"? То есть, та же технология "приклеенная" к Core будет не костылём, а очень даже полезной фитчей?
Цитата:
т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами.
Интересно услышать ваш критерий неудачности. Если это скорость/энергопотребление, то можно ли считать архитектуру К8 неудачной? Ну а ИКП - соответственно, костылём?
Member
Статус: Не в сети Регистрация: 01.03.2007 Откуда: Київ
TyyOx91 писал(а):
Цитата:
Ну почему, у Р4 при простраивающих 65%, прирост производительности даже по вашим словам всего 10-30% (на самом деле намного меньше), ведь должно быть ~185%.
Я не знаю как вы насчитали 185%. Прирост производительности не может быть больше, чем процент "простаивающих" ресурсов. При этом максимальный выигрышь может быть только если второй тред использует простаивающие вычислительные блоки.
65% "простаивающих" ресурсов - 35% не "простаивающих" ресурсов . 65/35=1,857=185%
Цитата:
Даже на не самой удачной реализации НТ в Р4 на многих задачах был заметен значительный выигрыш - до 30%.
Неправда, не в многих, а в некоторых отимизированых(а иногда бывало и 50% почему Вы невспомнили про них?)
Цитата:
Цитата:
На счёт linux kernel - дайте пожалуста ссылочку. А пока ссылки нет, рискну предположить что там ядро было i386 или i586. Так вот посравнению i386 ядро скомпилированое с максимальными оптимизациями для K8 быстреё на ~50%.
Нет. Тестировали на последних версиях ядер. Ссылка была где-то на xtremesystems.org. К сожалению сейчас уже не нахожу.
Дело в том, что ядро Linux можно скомпилировать под очень многие архитектуры и с разными оптимизациями, и новизна версии на это невлияет. Тоесть "последняя версия" не означает что она была собрана для AMD64. А тест и я ненахожу TyyOx91 Насчёт Power5 я немного недопонял, у меня на работе была рабочая станция Мас Power5, и дополнительных логоческих ядер там замечено не было, как было 2 прцесора, так и есть.
Я несогласен с тем что Вы пытались представить "10-30% на оптимизированном коде" как 10-30% производительности, которые есть всегда, что является не правдой. По вышей ссылке получается от -3% до +38%, а среднее ~6%. Причём это для однопроцесорной системы, для многопроцесорной результат скорее всего будет ещё хуже.
Member
Статус: Не в сети Регистрация: 25.03.2005 Откуда: МО
TyyOx91 писал(а):
Dryden
Цитата:
давайте вспомним базовые понятия. Костыль - это такая подпорка, которая помогает хромому ходить. И даже бегать. Я называю ГТ костылем НБ, т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами. Главный костыль - частота. Еще один - ГТ. На костыле ГТ Пи4 бегает быстрее до 30%!
Ага. Если я вас правильно понял, то дело не в том, что "приклеивают", а дело в том, к чему "приклеивают"? То есть, та же технология "приклеенная" к Core будет не костылём, а очень даже полезной фитчей?
дайте костыль (а лучше пару) здоровому человеку и попросите его пройтись... А лучше пробежаться
Цитата:
Цитата:
т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами.
Интересно услышать ваш критерий неудачности. Если это скорость/энергопотребление, то можно ли считать архитектуру К8 неудачной? Ну а ИКП - соответственно, костылём?
В том, что без вышеперечисленных костылей больной вел себя как и положено больному. Неэффективно он себя вел. А К8 без ИКП - это ж К7 - вполне себе удачная архитектура
_________________ Обзоры фильмов без спойлеров на okolnica.ru
Member
Статус: Не в сети Регистрация: 01.03.2007 Откуда: Київ
Цитата:
дайте костыль (а лучше пару) здоровому человеку и попросите его пройтись... А лучше пробежаться
Ага, я уже писал об этом
Цитата:
Цитата:
Цитата:
т.к. считаю, что архитектура НБ для десктопов неудачна, и ей потребовались костыли, чтобы соперничать с конкурентами.
Интересно услышать ваш критерий неудачности. Если это скорость/энергопотребление, то можно ли считать архитектуру К8 неудачной? Ну а ИКП - соответственно, костылём?
В том, что без вышеперечисленных костылей больной вел себя как и положено больному. Неэффективно он себя вел. А К8 без ИКП - это ж К7 - вполне себе удачная архитектура
Даже если брать скорость/энергопотребление, то архитектуру К8 нельзя считать неудачной, как на момет своего выхода она была лучше других. А вот Р4 таким похвастатся не может, значит неудачен.
"К8 без ИКП - это ж К7" - несовсем так, но если даже с такой позиции подходить, то К7 по нашему критерию удачности - удачная архитектура, то есть здоровая, отсюда вывод - ИКП не костыли.
65% "простаивающих" ресурсов - 35% не "простаивающих" ресурсов . 65/35=1,857=185%
65% "простаивающих" ресурсов в Р4? Ерунда! Trace Cache способен выдавать по 3 микроинструкции за такт на 4 порта.
Цитата:
Неправда, не в многих, а в некоторых отимизированых(а иногда бывало и 50% почему Вы невспомнили про них?)
Достаточно и то, что НТ давал ускорение при запуске двух независимых задач. Но не стоит сводить к обсуждению процентов. Вы почему-то пытаетесь отрицать перспективы НТ, но железных аргументов я так и не услышал.
Цитата:
Я несогласен с тем что Вы пытались представить "10-30% на оптимизированном коде" как 10-30% производительности, которые есть всегда, что является не правдой.
Я не пытаюсь доказать, что они есть всегда, я пытаюсь доказать что они есть (пусть и не всегда) (Чувствуете разницу?) Dryden
Цитата:
дайте костыль (а лучше пару) здоровому человеку и попросите его пройтись... А лучше пробежаться
Цитата:
А К8 без ИКП - это ж К7 - вполне себе удачная архитектура
К7, который практически везде сливал Р4 и практически ничем не отличается от К8, кроме ИКП (и 64 бит, которые до сих пор мало используются). Но по вашим словам К7 - хорошая архитектура. Значит ей не нужен был костыль в виде ИКП. Впрочем вы так и не дали критерия "удачности". linuxdrom
Цитата:
Даже если брать скорость/энергопотребление, то архитектуру К8 нельзя считать неудачной, как на момет своего выхода она была лучше других. А вот Р4 таким похвастатся не может, значит неудачен.
Да ну? Почитайте тесты Northwood vs. K7 - здесь их часто приводили. Видимо будете удивлены.
Я несогласен с тем что Вы пытались представить "10-30% на оптимизированном коде" как 10-30% производительности, которые есть всегда, что является не правдой.
Я не пытаюсь доказать, что они есть всегда, я пытаюсь доказать что они есть (пусть и не всегда) (Чувствуете разницу?)
Я рад что мы пришли к взаимопониманию
Цитата:
К7, который практически везде сливал Р4 и практически ничем не отличается от К8, кроме ИКП (и 64 бит, которые до сих пор мало используются)
K7 появился вовремена Р3, и был не хуже его, значит - удачен. И отличия есть и другие, я думал Вы знаете.
Цитата:
Цитата:
Даже если брать скорость/энергопотребление, то архитектуру К8 нельзя считать неудачной, как на момет своего выхода она была лучше других. А вот Р4 таким похвастатся не может, значит неудачен.
Да ну? Почитайте тесты Northwood vs. K7 - здесь их часто приводили. Видимо будете удивлены.
Про K7 сказал выше, а Northwood это не первые Р4, первые Willamette и они проигрывали как K7, так и Р3, а значит были неудачны.
Читайте внимательнее - Интел имеет в виду исполнительные блоки, я же говорил о конвейере. Считать исполнительные блоки нет смысла - их число обычно избыточно. Практически ни один процессор не способен одновременно загрузить все свои исполнительные блоки (конвейер не позволит). Впрочем, если взять за основу данные Ананда о среднем IPC = 1, то их утверждение верно и в отношении конвейера. Но тогда это верно для всех х86 процессоров.
Цитата:
Про K7 сказал выше, а Northwood это не первые Р4, первые Willamette и они проигрывали как K7, так и Р3, а значит были неудачны.
Вилли был где-то хуже, где-то лучше (Quake3 и кодирование). Не в этом дело. На тот момент НБ был новой и прогрессивной архитектурой. Через короткое время, перейдя на 130 нм. увеличив кэш и частоту шины, он раскрыл свой потенциал и уел всех конкурентов. А потом вышел К8..., а затем Core... Всё идёт по кругу, а вы спорите о каких-то нюансах. Если на то пошло, то первые низкочастотные оптероны тоже не могли соперничать с влавствующим в то время 3.2Ггц Норсвудом. Все доводы о неудачност НБ не выдерживают критики, по той причине, что был определённый промежуток времени, когда Р4 имел практически абсолютное доминирование (смотрите тесты 3.2ГГц Р4 вс. Атлон ХР 3200+).
Member
Статус: Не в сети Регистрация: 01.03.2007 Откуда: Київ
TyyOx91 писал(а):
Читайте внимательнее - Интел имеет в виду исполнительные блоки, я же говорил о конвейере. Считать исполнительные блоки нет смысла - их число обычно избыточно. Практически ни один процессор не способен одновременно загрузить все свои исполнительные блоки (конвейер не позволит). Впрочем, если взять за основу данные Ананда о среднем IPC = 1, то их утверждение верно и в отношении конвейера. Но тогда это верно для всех х86 процессоров.
Смотрите и тут мы пришли к тому, что я говорил изначально о "хорошем" процесоре: в "хорошем" процессоре не создается такого огромного дисбаланса между производительностю конвеера-декодера и исполняющим (функциональным) устройством. Поэтому надо совершенствовать конвеер-декодер, ну или если идти по вашему пути, то дублировать (НТ). Однако дублирование (НТ), не есть оптимальным вариантом. Можно также устранять избыточные исполнительные блоки, и за освобожденые ресурсы создавать лишние ядра (как пример 80 ядерный прототип от Интел) .
Цитата:
Цитата:
Про K7 сказал выше, а Northwood это не первые Р4, первые Willamette и они проигрывали как K7, так и Р3, а значит были неудачны.
Вилли был где-то хуже, где-то лучше (Quake3 и кодирование). Не в этом дело. На тот момент НБ был новой и прогрессивной архитектурой.
Дело в том что, прогресивность не делает архитектуру автоматом "хорошей" и удачной, и НБ это доказала. К примеру С2D и К8 далеко не такие прогрессивные, но помоему ИМНО являются удачными. (смотрите тесты 3.2ГГц Р4 вс. Атлон ХР 3200+)->(см. тесты 1.8ГГц Р4 вс. Атлон ХР 1800+)
Цитата:
Достаточно и то, что НТ давал ускорение при запуске двух независимых задач.
в "хорошем" процессоре не создается такого огромного дисбаланса между производительностю конвеера-декодера и исполняющим (функциональным) устройством.
Вы упорно не хотите вникнуть в то, о чём я писал выше и возможно даже не читали приведённые мной ссылки. Проблема ведь не в дисбалансе между шириной конвейера и количеством исполнительных устройств. Проблема в том что в большинстве задач сам конвейер не загружен даже на 70% (по некоторым оценкам - даже меньше). В болшинстве алгоритмов средний теоретический ILP (instruction level parallelism) не превышает 2.2-2.5 (из-за зависимости инструкций по данным). Прибавте к этому последовательные инструкции, branch miss-prediction, cache miss rate и получите что на реальном процессоре средний IPC < 2 (по некоторым оценкам - гораздо меньше). В результате даже такие ультраширокие процессоры с явным параллелизмом как Итаниум (6-wide issue) загружены в среднем меньше чем на половину.
Цитата:
Поэтому надо совершенствовать конвеер-декодер, ну или если идти по вашему пути, то дублировать (НТ). Однако дублирование (НТ), не есть оптимальным вариантом. Можно также устранять избыточные исполнительные блоки, и за освобожденые ресурсы создавать лишние ядра (как пример 80 ядерный прототип от Интел) .
В конечном счёте всё сводится к "войне" концепций - ILP vs. TLP (thread level parallelism). И судя по последним направлениям AMD, Intel, IBM и SUN - последняя концепция начинает выигрывать. Но прикол в том, что multithreading в какой-то мере позволяет совместить обе эти концепции.
Цитата:
Дело в том что, прогресивность не делает архитектуру автоматом "хорошей" и удачной, и НБ это доказала.
Я так и не понял в чём заключается неудачность НБ. Архитектура с выской частотой и низким ILP тоже имеет право на существование. Кстати именно такой архитектурой является архитектура К8 по отношении к архитектуре Итаниум. Что касается НБ, то можно сказать, что были неудачные экземпляры в этой архитектуре (прескот - в основном за счёт энергопотребления). Но всю архитектуру неудачной я бы не назвал.
Цитата:
иногда, невсегда, обычно.
Я бы сказал "обычно". Но ведь то же самое можно сказать о любой фитче в процессоре, не правда ли? "Обычно" обычно даже не упоминается в отношении того же ИКП.
Ошибка. Для интегрированного контроллера тоже можно найти ситуации, когда его наличие будет "просаживать" производительность. Например, для многопроцессорных систем на базе АМД необходимо программировать с оглядкой на NUMA. Иначе на неоптимизированных задачах можно получить реальное "проседание" относительно однопроцессорной и с меньшей частотой. Смотрим тесты:http://www.fcenter.ru/online.shtml?articles/har...otherboards/19826
Прям пальцем в небо. там просаживается за счет латентности, а не за счет контроллера.
Цитата:
Во-вторых, платформа Quad FX зачастую оказывается медленнее обычной однопроцессорной Socket AM2 системы из-за более высокой латентности подсистемы памяти. Технология NUMA, доказавшая свою эффективность в серверах, в настольных системах часто оказывается вредна, в чём мы могли воочию убедиться.
Смотрим выводы.
TyyOx91 писал(а):
В этом смысле, мультитрединг ничем не отличается от ИКП - так же требуется явная оптимизация.
Ну это вообще без комментариев.
_________________ Кратчайшее расстояние между двумя точками это точка.
Member
Статус: Не в сети Регистрация: 25.03.2005 Откуда: МО
TyyOx91 писал(а):
Dryden
Цитата:
дайте костыль (а лучше пару) здоровому человеку и попросите его пройтись... А лучше пробежаться
Цитата:
А К8 без ИКП - это ж К7 - вполне себе удачная архитектура
К7, который практически везде сливал Р4 и практически ничем не отличается от К8, кроме ИКП (и 64 бит, которые до сих пор мало используются). Но по вашим словам К7 - хорошая архитектура. Значит ей не нужен был костыль в виде ИКП.
давайте опять определимся со словами. "Сливал" используется в ассенизационной отрасли, и если мы не спускаем процессоры в унитаз, то этот термин нас не касается. Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...
Цитата:
Впрочем вы так и не дали критерия "удачности".
Как и вы. Но меня об этом никто и не просил. А вот вы претендуете, но также не обосновываете.
_________________ Обзоры фильмов без спойлеров на okolnica.ru
Прям пальцем в небо. там просаживается за счет латентности, а не за счет контроллера.
Вот-вот - из-за высокой латентности памяти. А почему она высокая? Правильно - из-за индивидуальных встроенных контроллеров и вынужденной организации NUMA системы. В системах с общей памятью таких проблем нет.
Цитата:
Ну это вообще без комментариев.
Ну почему же? Прокоментируйте - послушаем. Но прежде, чем сказать глупость почитайте что такое NUMA и как под неё оптимизируют. Dryden
Цитата:
давайте опять определимся со словами. "Сливал" используется в ассенизационной отрасли, и если мы не спускаем процессоры в унитаз, то этот термин нас не касается.
Бизнес-сленг: Слить – 1. проиграть; 2. продать ненужный или переоцененный актив; 3. распространить конфиденциальную информацию. Первое определение как раз подходит. Да и вы слово "костыль" тоже не по прямому назначению используете.
Цитата:
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...
До сих пор разговор шел о производительности. Причём здесь цена и т.д.? Впрочем, в разгоне Р4 так же был лучше.
Цитата:
Как и вы. Но меня об этом никто и не просил.
Ну как же так? Я же вас попросил.
Цитата:
А вот вы претендуете, но также не обосновываете.
Не понял - на что я претендую? Я же не развешивал ярлыки однознaчной удачности/неудачности на ту или иную архитектуру. Что именно я должен обосновывать?
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Dryden писал(а):
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...
Забыли добавить - на каком классе задач. Ибо на широком классе задач в численных методах P4 опережал не только K7 (здесь и первые Willamete выигрывали у практически равночастотных K7, а впоследствии с увеличением разности реальных частот P4 вообще не оставлял K7 никаких шансов) но и K8.
И кстати, до сих пор опережает, как это ни удивительно.
P4 никогда не проигрывал K8 по производительности там, где она была реально нужна.
Member
Статус: Не в сети Регистрация: 25.03.2005 Откуда: МО
TyyOx91 писал(а):
[off]Бизнес-сленг: Слить – 1. проиграть; 2. продать ненужный или переоцененный актив; 3. распространить конфиденциальную информацию. Первое определение как раз подходит. Да и вы слово "костыль" тоже не по прямому назначению используете.
это был во первых юмор, во вторых, намек на то, что использовали утверждение однозначное в ситуации неоднозначной. Отсюда следующий вопрос:
Цитата:
Цитата:
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...
До сих пор разговор шел о производительности. Причём здесь цена и т.д.? Впрочем, в разгоне Р4 так же был лучше.
нет, речь шла о "сливал". вы сравнили два процессора, причем выбрали почему-то процессор за 100$ и 200$ (упрощенно). Да, знаю, исходя из рейтинга. Но обычные люди-то выбирают систему именно исходя из производительность\цена.
Цитата:
Цитата:
Как и вы. Но меня об этом никто и не просил.
Ну как же так? Я же вас попросил.
Цитата:
А вот вы претендуете, но также не обосновываете.
Не понял - на что я претендую? Я же не развешивал ярлыки однознaчной удачности/неудачности на ту или иную архитектуру. Что именно я должен обосновывать?
вы попросили объяснить, почему я считаю неудачной. Я объяснил. Вы же, хотя повесили однозначный ярлык "слива" (без "имхо"), свое мнение не обосновали.[/off] Добавлено спустя 4 минуты, 25 секунд
Lord Violator писал(а):
[off]
Dryden писал(а):
"Сливал" используется в ассенизационной отрасли, и если мы не спускаем процессоры в унитаз, то этот термин нас не касается.
Термин этот вас, аэмдэшников (или твоими словами - ассенизаторов), ещё как касается.
как злобно Не надо этот вечный спор так близко к сердцу принимать Кстати, у меня IQ тоже примерно 130-140 (давно уже не мерялся, точно не помню), но мне это не мешает признать то, что мне не нравится. К примеру - я не разбираюсь в архитектуре процессоров, или - линейка Core2Duo лучше чем K8 по сочетанию ряда потребительских характеристик (не всех - по цене не лучше).[/off] Добавлено спустя 1 минуту, 15 секунд
Cronos писал(а):
Dryden писал(а):
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...
Забыли добавить - на каком классе задач. Ибо на широком классе задач в численных методах P4 опережал не только K7 (здесь и первые Willamete выигрывали у практически равночастотных K7, а впоследствии с увеличением разности реальных частот P4 вообще не оставлял K7 никаких шансов) но и K8. И кстати, до сих пор опережает, как это ни удивительно. P4 никогда не проигрывал K8 по производительности там, где она была реально нужна.
думаю, не обижу вас если попрошу определиться с областью "реально нужных" задач?
_________________ Обзоры фильмов без спойлеров на okolnica.ru
Member
Статус: Не в сети Регистрация: 01.03.2007 Откуда: Київ
TyyOx91 писал(а):
Dogmatik
Цитата:
Прям пальцем в небо. там просаживается за счет латентности, а не за счет контроллера.
Вот-вот - из-за высокой латентности памяти. А почему она высокая? Правильно - из-за индивидуальных встроенных контроллеров и вынужденной организации NUMA системы. В системах с общей памятью таких проблем нет.
В системах с общей памятью таких проблем нет, по тому что латентность там всегда высокая. Я уже обращал внимание на то, что без NUMA и интегрированного контроллера, было б ещё хуже, чем в тех случаёв когда мы получаем "проседание" Добавлено спустя 6 минут, 59 секунд
TyyOx91 писал(а):
Но прежде, чем сказать глупость почитайте что такое NUMA и как под неё оптимизируют.
NUMA предназначена для серверов, а на нормальных серверах и так всё оптимизируют. Поэтому NUMA никаких проблем там не создает, а преимущества имеет явные. Поэтому глупость сказали Вы. PS. Без обид. Частично в Вашем заблуждении виновата AMD, котроя прозиционирует Quad FX как игровую платформу, хотя намного логичней что Quad FX ближе к рабочим станциям. Добавлено спустя 23 минуты, 43 секунды
Cronos писал(а):
Dryden писал(а):
Итак, по каким значащим параметрам P4 обгонял K7 ? По производительность\цена? По надежность\цена? Хотя бы может, по производительность-в-разгоне\цена? Думаю, вы знаете ответ...
Забыли добавить - на каком классе задач. Ибо на широком классе задач в численных методах P4 опережал не только K7 (здесь и первые Willamete выигрывали у практически равночастотных K7, а впоследствии с увеличением разности реальных частот P4 вообще не оставлял K7 никаких шансов) но и K8. И кстати, до сих пор опережает, как это ни удивительно.
P4 никогда не проигрывал K8 по производительности там, где она была реально нужна.
Я так понял, у Вас очень маленький класс задач где реально нужна производительность.
нет, речь шла о "сливал". вы сравнили два процессора, причем выбрали почему-то процессор за 100$ и 200$ (упрощенно).
Цитата:
вы попросили объяснить, почему я считаю неудачной. Я объяснил
Стоп! Давайте будем отделять мух от котлет. Изначально речь шла об архитектуре (и перспективах HT для той или иной архитектуры), а не об упаковонном в коробку процессоре с наклеенной ценой. Вы утверждали, что архитектура НБ является неудачной, а НТ, соответственно, является костылём к этой архитектуре. Когда я попросил вас обосновать неудачность, вы почему-то привели цену процессора как главный довод неудачности архитектуры (хотя цена к архитектуре ну прям никаким боком...). Давайте хоть в этой ветке отвлечёмся от марктинговых стратегий фирм Интел и АМД, а будем рассматривать непосредственно архитектуры.
Цитата:
Вы же, хотя повесили однозначный ярлык "слива" (без "имхо"), свое мнение не обосновали.
Я не навешивал ярлыки, я привёл довольно известный факт, подтверждение которому можно увидеть например здесь: http://www.anandtech.com/showdoc.aspx?i=1834&p=7 Архитектуру К7 неудачной я не называл (так как я убеждён что это она очень даже удачна). linuxdrom
Цитата:
В системах с общей памятью таких проблем нет, по тому что латентность там всегда высокая.
На самом деле, разница не слишком большая, а в двухсокетных конфигурациях разница совсем нивилируется (в систем с общей памятью латентность всегда постоянная): #77 В 4-сокетных конфигах, в системах на Оптеронах латентность уже будет хуже чем у Зионов. Ну, а про 8-сокетные уже и подумать страшно (видимо поэтому на них, извиняюсь, "забили"...)
Цитата:
Я уже обращал внимание на то, что без NUMA и интегрированного контроллера, было б ещё хуже, чем в тех случаёв когда мы получаем "проседание"
NUMA - это "вещь" хорошая... если используемому софту о ней "известно". Если нет - то страдает не только производительность однопоточных программ, но и scalability на многопоточных. http://www.anandtech.com/printarticle.aspx?i=2879 NUMA вообщето не является необходимой для 2,4,8-процессороных систем. В случае с АМД она просто вынужденная. Был проект Horus - обьеденить оптероны в систему с реально (не виртуально) общей памятью, но что-то там не заладилось с чипсетом.
Цитата:
NUMA предназначена для серверов, а на нормальных серверах и так всё оптимизируют. Поэтому NUMA никаких проблем там не создает, а преимущества имеет явные. Поэтому глупость сказали Вы. PS. Без обид. Частично в Вашем заблуждении виновата AMD, котроя прозиционирует Quad FX как игровую платформу, хотя намного логичней что Quad FX ближе к рабочим станциям.
Я не заблуждаюсь в отношении NUMA, и не отрицаю её "нужность" для серверов, как вы, видимо, подумали. Просто у медали есть две стороны - помните с чего началось? "Не-костыль эта фитча которая не мешает" - я привёл пример, что даже такая полезная фитча, как ИКП - тоже иногда мешает.
Member
Статус: Не в сети Регистрация: 25.03.2005 Откуда: МО
TyyOx91 писал(а):
Стоп! Давайте будем отделять мух от котлет. Изначально речь шла об архитектуре (и перспективах HT для той или иной архитектуры), а не об упаковонном в коробку процессоре с наклеенной ценой. Вы утверждали, что архитектура НБ является неудачной, а НТ, соответственно, является костылём к этой архитектуре. Когда я попросил вас обосновать неудачность, вы почему-то привели цену процессора как главный довод неудачности архитектуры (хотя цена к архитектуре ну прям никаким боком...). Давайте хоть в этой ветке отвлечёмся от марктинговых стратегий фирм Интел и АМД, а будем рассматривать непосредственно архитектуры.
цену я привел как довод против "слива". Кстати, по чистой производительности с равными рейтингами сливал только Бартон 3000-3200. Торобреды 2800 кое-где обгоняли и 3ггц П4. Неудачность архитектуры NB я кратко выразил, определю подробнее: 1) Сложная архитектура, требующая серьезных оптимизаций в универсальных задачах (лишняя работа программерам "просто так"). 2) В то же время берущая грубой силой (частотой). (А зачем тогда было наворачивать сложность, если еще и частоту надо задирать?) 3) В то же время вовсю крутящаяся на холостом ходу (была на фцентре статья про некие внутренние механизмы...эммм... replay это вроде называлось) 4) потребовалось хитро извернуться, чтобы уменьшить холостой ход, чем и стал HT. Что опять же проявлялось не везде, не однозначно, и требовало оптимизаций. У вас может появиться соблазн поспорить с этими нюансами. Например сказать: "А вот у конкурента было зато так" или "ну и что зато продавался хорошо". Т.е. привести аргументы, не имеющие прямого отношения, зато 100% истинные. Но давайте не будем этого делать, т.к. я привел вам обоснование своего отношения, и отношения многих других и дальнейший спор ничего не изменит. Желаю всяческих успехов и приятного времяпрепровождения
Цитата:
Цитата:
Вы же, хотя повесили однозначный ярлык "слива" (без "имхо"), свое мнение не обосновали.
Я не навешивал ярлыки, я привёл довольно известный факт, подтверждение которому можно увидеть например здесь: http://www.anandtech.com/showdoc.aspx?i=1834&p=7 Архитектуру К7 неудачной я не называл (так как я убеждён что это она очень даже удачна).
о том и речь. Мы говорили об "удачности" K8 без ИКП, что упрощенно говоря есть К7
_________________ Обзоры фильмов без спойлеров на okolnica.ru
Я так понимаю. что архитектурно Penryn мало чем будет отличаться от Conroe - 45нм., SSE4, увеличение кэша.... Т.е. ничего особенного.
А вот Nehalem будут отличаться намного больше: там и CSI, и КП, и наверное будет конвейер изменен - может там количество стадий увеличится? В Nehalem'е Интел обещает улучшить блок вычислений FP и т.д.
_________________ Цель спора есть изменение природы истины.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 24
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения