CPU Multi-Dimensional Branch Prediction Memory Test

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 08.07.2026 1:34

Сообщения без ответов | Активные темы

Список форумов » Специализированные форумы » Бенчмаркинг

Часовой пояс: UTC + 3 часа

Новая тема /

Ответить

Сообщений: 238 • Страница 8 из 12 • < 1 ... 5 6 7 8 9 10 11 12 >

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Locki

Добавлено: 24.02.2006 15:48

[профиль]

Member
Статус: Не в сети
Регистрация: 31.01.2004
Откуда: moskow

Ладно, если не понятно, то

Цитата:

Предсказание переходов (ветвлений) призвано свести к минимуму холостую работу конвейера и обеспечить его непрерывным потоком команд. Вообще, в среднем до 10 процентов кода программы составляют безусловные переходы, передающие управление по новому указанному адресу, и от 10 до 20 процентов - условные переходы, которые меняют или не меняют ход выполнения программы в зависимости от результата сравнения или выполнения какого-либо другого условия. В случае, если условный переход не выполняется, программа просто продолжает выполнение следующей по порядку команды.

Безусловные переходы проблем не вызывают, процессор точно знает, что они будут выполнены и поэтому просто начинает выборку команд по указанному адресу. Команды условных переходов представляют определенные трудности, потому что процессор не знает, будет ли выполнен переход до тех пор, пока команда не пройдет исполнительную ступень конвейера. Однако ожидание, пока команда ветвления покинет исполнительную ступень, означает временный отказ от возможности выборки и обработки дальнейших команд.

Для предсказания переходов процессор использует расширенный алгоритм Yeh'а, позволяющий с большой достоверностью спрогнозировать, будет ли выполняться переход. Если предсказание окажется верным, то исполнение продолжится с малой задержкой или совсем без задержки. Если же предположение ошибочно, то частично выполненные команды придется удалять из конвейера, а новые команды выбирать из области памяти с правильным адресом, декодировать и выполнять их. Это повлечет за собой существенное снижение производительности, напрямую зависящее от глубины конвейера - для архитектуры P6 в случае ошибочного предсказания перехода потери составят от 4 до 15 тактов.

Алгоритм предсказания ветвлений является динамическим двухуровневым и основывается на поведении команд перехода за предшествующий период времени (поскольку один и тот же переход часто выполняется более чем один раз, например, в цикле), а также на поведении конкретных групп команд, для которых с большой вероятностью можно предсказать конкретный переход. Точность предсказания данного алгоритма составляет порядка 90 процентов.

Итак, выровненные 16-байтовые команды передаются в дешифратор команд (Instruction Decoder) , состоящий из трех параллельных дешифраторов, два из которых - простые (Simple), и один - сложный (Complex). Задача каждого дешифратора - преобразование IA инструкции в одну или несколько микрокоманд (micro-ops).

Простые дешифраторы обрабатывают команды x86, транслируемые в единственную микрокоманду. Сложный дешифратор работает с командами, которым соответствуют от одной до четырех микрокоманд. Некоторые особенно сложные команды невозможно непосредственно декодировать даже сложным дешифратором, поэтому они передаются в планировщик последовательности микрокоманд (MIS - microcode instruction sequencer), генерирующий необходимое число микрокоманд. Если простой дешифратор встречает команду, которая не поддается трансляции, то она передается в сложный дешифратор, либо в планировщик последовательности микрокоманд. Такая пересылка слегка замедляет дешифрацию, но за счет буферизации с помощью станции-резервуара (Reservation Station), работу которой мы еще рассмотрим, не очень значительно сказывается на производительности.

В случае, если сложные и простые команды безупречно выровнены их соответственными дешифраторами, то дешифраторы способны генерировать в общей сложности шесть микрокоманд за такт, но, как правило, из всех трех дешифраторов за один такт выдаются три микрокоманды, соответствующие, в среднем, двум - трем IA командам, которые передаются в буфер восстановления последовательности (ROB - Reorder Buffer). ROB содержит 40 элементов, размером 254 байт каждый, и может хранить микрокоманду, два связанных с ней операнда, результат и несколько битов состояния.

Последним этапом перед выполнением команд является отображение регистров, осуществляемое в таблице псевдонимов регистров (RAT - register alias table). Архитектура x86 предусматривает только восемь 32-разрядных регистров общего назначения, а с таким малым числом регистров вероятность того, что две соседние команды будут использовать один регистр, относительно велика. Отображение регистров помогает ослабить влияние таких регистровых взаимозависимостей (register dependencies) - в случае необходимости записи в один и тот же регистр для двух команд их невозможно будет исполнить вне очереди без отображения регистров, так как более поздняя команда не может быть обработана до завершения более ранней команды.

При отображении регистров происходит преобразование программных ссылок на архитектурные регистры в ссылки на 40 физических регистров микрокоманд, реализованных в буфере восстановления последовательности. По существу, процессор "размножает клонированием" ограниченное число программируемых, архитектурных регистров и отслеживает, какие клоны содержат наиболее поздние значения. Это предотвращает задержки, которые в противном случае были бы внесены в процесс обработки команд взаимозависимостями в результате конфликтующих обращений к регистрам.

Станция-резервуар выступает диспетчером и планировщиком микрокоманд, для чего непрерывно сканирует буфер восстановления последовательности и выбирает команды, готовые к исполнению (имеющие все исходные операнды). Результат выполнения возвращается назад в буфер и сохраняется вместе с микрокомандой до вывода. Порядок исполнения команд основывается не на их первоначальной последовательности, а на факте готовности команды и ее операндов к исполнению, это и есть out-of-order - исполнение с изменением последовательности.

Если дешифраторы приостановили работу, исполнительные блоки продолжают работать, пользуясь командами, поставляемыми резервуаром, а в случае занятости исполнительных устройств, резервуар предоставляет возможность дешифраторам работать. Заполняется резервуар в очень редких случаях, что приводит к приостановке работы дешифраторов.

Выполнение микрокоманд осуществляется двумя целочисленными блоками, двумя блоками вычислений с плавающей точкой и одним блоком взаимодействия с памятью - таким образом, возможно выполнение до пяти микрокоманд за такт процессора.

Два целочисленных блока способны исполнять две целочисленные микрооперации одновременно. Один из блоков, как упоминалось выше, разработан специально для выполнения операций перехода. Он способен обнаруживать ошибочно предсказанный переход и оповещать буфер предсказания переходов о необходимости перезапуска конвейера. Рассмотрим это подробнее.

Дешифратор прикрепляет к команде перехода оба адреса - предсказанный адрес перехода и предварительно признанный неудачным. Когда целочисленный блок исполнения выполняет операцию перехода, он в состоянии определить, какая из ветвей была выбрана. В случае перехода по предсказанию все предварительно накопленные и выполненные команды данной ветви маркируются как годные для дальнейшего использования, и продолжается исполнение данной ветви программы. В противном случае, блок выполнения перехода в целочисленном блоке изменяет статус всех команд данной ветви на "подлежащие удалению". Потом передает в буфер адреса перехода правильный адрес перехода, и буфер, в свою очередь, перезапускает конвейер с этого адреса.

Блок взаимодействия с памятью отвечает за выполнение микрокоманд загрузки и сохранения. Загрузка требует только указания адреса памяти, поэтому может быть представлена одной микрокомандой. Сохранение требует также указания содержимого для сохранения, поэтому кодируется двумя микрокомандами. Часть блока, обрабатывающая команды сохранения, имеет два порта, что позволяет обрабатывать адресную и микрокоманду данных параллельно. Также возможно параллельное выполнение операций загрузки и сохранения в одном такте.

Для операций с плавающей точкой предусмотрены два блока вычислений, причем второй предназначен для обработки SIMD инструкций.

Команды, которые исполняются не в той последовательности, которая предписана программой (speculative), следует в конечном итоге расположить в должной последовательности - иначе процессор не всегда сможет получить правильные результаты.

Буфер восстановления последовательности сохраняет статус исполнения и результаты каждой микрокоманды. Микрокоманда выводится блоком вывода, который, подобно станции-резервуару, сканирует буфер восстановления последовательности на предмет обнаружения микрокоманд, которые уже не повлияют на выполнение других микрокоманд.

Такие команды признаются завершенными, и блок вывода выстраивает их в первоначальную последовательность, учитывая прерывания, исключения, точки останова и неверные предсказания переходов.

Блок вывода способен выводить три микрокоманды за такт. При выводе микрокоманды результаты записываются в выводящий регистровый файл (RRF - retire register file) и/или память. Выводящий регистровый файл содержит 8 регистров общего назначения и 8 регистров для данных с плавающей точкой. После того, как микрокоманда выведена, она удаляется из буфера восстановления последовательности.

Операции записи в память откладываются до той поры, пока вызвавшая их микрокоманда не будет выведена. Для этого в P6 предусмотрен буфер упорядочения обращений к памяти (MOB - memory order buffer), в котором по командам, выдаваемым блоком записи в память, сохраняется информация о данных и адресах. Буфер упорядочения обращений к памяти пересылает данные в память только после того, как буфер восстановления последовательности уведомит его о том, что микрокоманда, произведшая запись в память, удаляется.

А теперь скажите на оснавании чего вы думаете, что ваши алгоритмы харрактеризуют именно
оценку потерь производительности от не предсказанных ветвлений, а не простую разницу скоростей работы того или иного процессора с этим алгоритмом?

Реклама
Партнер

Lev Dymchenko

Добавлено: 24.02.2006 15:56

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Потому, что природа алгоритмов сортировки случайных данных такова, что огромна доля случайных ветвлений, следовательно, не предсказанных ветвлений, и поэтому работа с ветвлениями и потери от ветвлений вносят решающий вклад в производительность. Других инструкция там не очень много, что позволяет выделить производительность обработки переходов разного рода. Таким образом, разница скоростей работы с условными переходами и вызывает разницу в производительности процессоров.
Добавлено спустя 2 минуты
Получилось в некотором соответствии с теоритически ожидаемыми, плюс некоторый шум от вызванного этими ветвлениями случайного доспа к памяти, плюс некие издержки на КЭШ.
Добавлено спустя 1 минуту, 18 секунд
В обычной программе есть только куски, полностью зависящие от скрости ветвлений, в каких-то приложениях больше таких кусков, в каких-то - меньше, а тут вся программа такая.
Добавлено спустя 1 минуту, 28 секунд
Вот известно, что длина сбрасываемой части конвейера Prescott в полтора рза больше northwood. Может ли это сказываться? Вот, дана оценка, как это может сказываться на некоторых частях программы, производительность которых входит в общую интегральную.

Locki

Добавлено: 24.02.2006 16:04

[профиль]

Member
Статус: Не в сети
Регистрация: 31.01.2004
Откуда: moskow

Ладно, а чем они лучше чем это:

Цитата:

Для практической оценки эффективности нового механизма предсказания ветвлений попробуем воспользоваться простеньким тестом Queens_CW4.exe - маленькой программкой, рассчитывающей знаменитую <задачу ферзей> (необходимо разместить N ферзей на поле размером NxN клеток так, чтобы ни один из них не атаковал другого, см., например, тут). Чтобы время вычислений было разумным (не очень долгим, но и достаточным для получения точности порядка нескольких десятых процента) мы ограничились N=32 (см. также www.terralab.ru/system/29375). Заметим, что эта программа выдает всегда одно и то же расположение ферзей, то есть время не зависит от произвола в решении задачи ферзей (в принципе, у этой задачи много равноценных решений). Результаты представлены на диаграмме (в трех нижних строчках на этой и последующих диаграммах мы в чистом виде для лучшей наглядности сравниваем три Pentium 4 на частоте 3,2 ГГц, тогда как в верхней части диаграмм результаты для всех процессоров проранжированы в порядке от худшего к лучшему).
[Тут диаграмма]
Предполагается, что программа настолько компактна, что полностью помещается в кэш-память первого уровня для всех современных процессоров, то есть мы исследуем почти в чистом виде производительность и масштабируемость целочисленного <вычислителя> с кэшом L1 (это, кстати, видно и по равенству в пределах погрешности результатов для Northwood и Extreme Edition). Оказывается, что Prescott катастрофически проигрывает в этом тесте не только прежней микроархитектуре Pentium 4, он и Athlon 64. Отставание от Northwood составляет 31,5%!!! Если же перевести это во время расчета, приходящееся на один такт работы конвейера, то у Northwood (20 ступеней) оно составит 0,236 нс, а у Prescott (31 ступень) - лишь 0,200 нс. То есть, на первый взгляд, по этой программе, которая использует возможности блока предсказания переходов заметно активнее, чем большинство реальных программ, можно сделать вывод, что блок предсказаний ветвлений в Prescott может работать лучше, чем у Northwood (на 15% меньше затрат времени в расчете на одну стадию конвейера), однако на самом деле это не совсем так - ведь частота сброса конвейера зависит не только от его полной длины J, но и от множества других факторов.

Lev Dymchenko

Добавлено: 24.02.2006 16:14

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Там тоже некоторая оценка, кстати, сходная. Но суть того алгоритма не вполне понятна, возможно, он так реагирует на увеличение латентности КЭШ первого или второго уровней. Там только предполагается, что программа помешается в КЭШ первого уровня, но из текста это никак не следует, в cpumdbpmtest исследуется поведение при различном объеме данных, чтобы в том числе проверить влияние КЭШ. И можно посмотреть, когда данные в КЭШ, а когда - нет.
Добавлено спустя 2 минуты, 1 секунду
Потом, там один алгоритм решает некую не очень популярную задачу, а тут собрано для надежности несколько разноплановых, но имеющих дело со случайными ветвлениями.
Добавлено спустя 2 минуты, 10 секунд
Потом, важно понимать, что точность предсказания ветвлений не абсолютна, а сильно зависит от приложения. На одном может быть 75%, а на другом - 95%.
Добавлено спустя 4 минуты, 25 секунд
Вообще, тамошний текст написан не корректно. Они слегка перепутали длину полного конвейера и его сбрасываемой части. Вывод о блоке предсказания сделать затруднительно. Хотя можно прикинуть, что если программа полностью лимитирована ветвлениями, то процент предсказания примерно одинаков.
Добавлено спустя 43 секунды
Там отличия в блоке предсказаний ни как не тянут на десятки процентов.

Locki

Добавлено: 24.02.2006 16:25

[профиль]

Member
Статус: Не в сети
Регистрация: 31.01.2004
Откуда: moskow

Жесть... Все так туманно и расплывчато в твоих ответах...
Получается, как я и писал выше, программа понятная только автору, нужна тоже только автору для повышения самомнения и удовлетворения амбиций...
Но при этом, вроде, как че то делает, в чем существенно отличается, от выкладываемого одним тут програмистом, "Теста Имени Меня"...
Практической пользы не вижу из-за скудности обьяснения (программа с ферзями и та вроде как обьяснена подробнее, что из чего и как). Тут нажал, дождался, посмотрел... и че? Ты конкретно скажи наколько один предсказывает эффективнее другого. Из четырех цифр программы я точно этого сказать не могу... а иначе нафига она? Ах да
программа понятная только автору, нужна тоже только автору для повышения самомнения и удовлетворения амбиций...

Lev Dymchenko

Добавлено: 24.02.2006 16:25

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Я, кстати, ниже в теме говорил, что Torobred может обыграть высокочастотный Prescott в шахматы. возможно, расстановка ферзей как-то к этому относится.
Добавлено спустя 5 минут, 27 секунд
Кто бы говорил про амбиции.

Задача сравнения чисто бренч предикторов не ставилась. Это само по себе действительно мало ценно пользователям и программистам. Потому, что по мимомо процента есть ещё потери, и все это важно в совокупности. Но если сделать примерную оценку, то предикторы примерно равны, различия не бог весть какие. Повторю в какой-то там раз, что ветвления со случайным поведением предсказать статистическими методами невозможно.
А вы скажите, кстати, зачем вам надо знать, увеличилась ли точность предсказания ветвлений в Prescott?
А тут практическая польза, как от любого теста.

Locki

Добавлено: 24.02.2006 16:47

[профиль]

Member
Статус: Не в сети
Регистрация: 31.01.2004
Откуда: moskow

Во-первых, предсказатель переходов работает не с данными, а только с кодом. Поэтому опус "если процессор предсказывает, то данные z,..z5 он сохраняет в кеше" - это полная ерунда, т.к. кэшировани данных происходит по свим законам и никак не связано с результатами ветвления кода. Процессор просто запоминает адреса переходов (вместе с адресами таргетов - куда происходит прыжок) и хранит для каждого перехода краткую историю чередований "переход-непереход" в BTB (branch target buffer). BTB стоит во главе всего конвеерного паровоза. Если при выборке инструкций из кэша BTB встречает знакомый адрес, соответсвующий уже хотя бы раз пройденному прыжку (jmp,jcc,call,ret), то он на основании истории прыжков для данного адреса BTB решает будет ли прыжок на этот раз или нет - если считает, что нет, значит выборка инструкций продолжается дальше, если считает, что должен быть переход, то выдается команда выборки инструкций с другого адреса, соответсвующего таргету перехода. Т.е. решение о том куда идти происходит в самом начале конвеера и ес-но никак не связано с обрабатываемыми данными. А подтвержение правильности происходит в конце конвеера на стадии анализа флагов и если предсказание оказывается неверным, то "сливай вода", точнее - весь неправильно загруженный конвеер и грузи заново с другого адреса - отсюда и штраф в тиках >= длины конвеера.
Отсюда выводы. 1) Проц хорошо предсказывает только регулярные последовательности чередования переход-непереход, а при случайном чередовании соответсвенно и результат предсказания получается случайным. 2) Ресурсы BTB (число запоминаемых адресов и длина истории для каждого адреса) ес-но ограничены. Например, в процах семейства P6 длина истории прыжков = 4, а в P4 Northwood = 16. Это означает, что если в P4 прыжок происходит регулярно один раз из N, где N > 17, то процессор его предсказать не может.

И последнее - если речь идет об эффективности ПРЕДСКАЗАНИЯ переходов (а не о потерях времени), то для РАЗНЫХ процев нельзя проводить сравнение по времени, т.к. штраф в тиках за непредсказанный переход у разных процев разный - не менее длины конвеера. Соответственно для P6 и Pentium M это >= 10-12 тиков, для AMD K7 >= 10-15, P4 0.18 и 0.13мкм (Willamette,Nortwood и т.д.) >=20, P4 0.09мкм (Prescott и т.п.) >= 30. Измеряя тики можно прийти к выводу, что простой предсказатель PIII "эффективнее" навороченного продвинутого предсказателя Prescott, хотя дело лишь в том что штраф за промах в Prescott в 3 раза больше, чем в PIII.

Если тебе нужно количество промахов, то и нужно его вытаскивать из соответсвующего каунтера процессора. Возьми программы пефоманс-мониторинга VTune от Intel или CodeAnalyst от AMD и получишь, то что тебе нужно

Ну или сам разбирайся с программированием MSR-регистров, IA-32-талмуды тебе в руки

))
Lev Dymchenko
Лирическое отступление: наглядный пример усовершенствования и "эффективности" предсказания переходов в P4.
Берем интеловскую статейку за февраль 2004 г., описывающую нововедения в P4 0.09 мкм (Prescott) по сравнению с 0.13 мкм (Northwood). По их словам благодаря усовершенствованию алгоритма предсказания удалось заметно уменьшить число промахов предсказания (mispredictions), и в докозательство приводят табличку результатов тестирования. На первый взгляд вроде как все замечательно - среднее количество промахов у Prescott меньше чем у Northwood и можно сказать что у него "предсказание более эффективно" (кстати они признаются, что "содрали" некоторые идеи у команды разработчиков Pentium M). Но пользователям внутренние тонкости реализации как правило до лампочки, им нужна не эффективность предсказания, а эффективность обработки переходов. Из приведенной таблички видно, что выигрыш в числе промахов колеблется от 1-2% до ~20% и в среднем составляет около 10%. Но позвольте, ведь у Northwood длина конвеера 20 стадий, а у Prescott более 30 !!! Получается, что 10% улучшение предсказания не может скомпенсировать 50% разницу в штрафах за промах. Поэтому в целом приходится признать, что Northwood в среднем меньше теряет на переходах, чем Prescott, а значит и более эффективен.
А несомненными лидерами по эффективности обработки переходов ес-но являются процы с умеренными конвеерами - AMD и Pentium M. К тому же пока команда разработчиков Prescott возилась со своим монструозным конвеером, надеясь перешагнуть заветный рубеж в 4ГГц, остальные тоже не дремали и вытягивали частоты за счет совершенствования техроцесса. В результате на сегодняшний день те же Northwood'ы незначительно уступают Prescott'ам по частоте, поэтому на обработку переходов они тратят не только меньше тиков, но и меньше времени - что в итоге и нужно пользователю.
Ладно там соперничество с AMD, но как в стенах Intel Corp. уживаются команды Prescott и Pentium M вообще интересно - ведь на некоторых задачах Pentium M при вдвое меньших частотах может запросто обставить этих неповоротливых монстров. Взять бы да и выбросить их на помойку, да нет - потраченных баксов жалко, да и юзверей приучили, что чем больше гигов тем лучше... А они наивные верят в "усовершенствования алгоритмов предсказания переходов" и прочую лабуду, забывая о том, что сколько какашку не совершенствуй и не облизывай, она конфеткой не станет

))

Lev Dymchenko

Добавлено: 24.02.2006 17:00

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

У Prescott свои достоинства по сравнению с PentiumM. Про оценку прироста от увеличения процента предсказания ветвлений вообще неправильно написано. Это вы с того asm форума взяли? И обсуждайте этот пост там или в специальной ветке здесь. Эту ересь про то, что 10% увеличения что-то там не компенсирует. Иногда компенсирует, иногда -нет.

White

Добавлено: 24.02.2006 17:23

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko Уважаемый, где ваши скрины? Вы попытаетесь доказать что вы не лгун? Где нормальные оп вашим словам результаты Прескотта 3,0? Где объективные посылы к проигрышу Прескоотаа относительно НАМНОГО менее частотного Норта?

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Lev Dymchenko

Добавлено: 24.02.2006 17:30

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Для вас, наверное, специально запостили два гигантских поста про некоторые детали работы процессоров. Что-то можно почерпнуть.

White

Добавлено: 24.02.2006 17:33

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko Ссылку раз. Скрины ВАШИ два. В противном случае вы лжёте.

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Lev Dymchenko

Добавлено: 24.02.2006 17:34

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Нормальные результаты Prescott3000E я привел в теме пару страниц назад. И на страничке теста они есть. Про предпосылки я сказал десять раз. Вы, к тому же, в плену абсолютных величин. 3000 всего на 25% больше 2400. А потенциальные потреи от ветвлений увеличились на 50%. Повторюсь, вы как-то поняли, непонятно, как, что Athlon с частотой в полтора раза ниже показывает сходную производительность, а тут всего 25%.
Добавлено спустя 31 секунду
Какую ссылку?
Добавлено спустя 1 минуту, 29 секунд
Значит, лгать я могу, а подделывать скриншоты - нет? Все равно, вы мне не верите. Ну скажите, чтоскриншоты где-то добыл. Это вы можете понять?
Добавлено спустя 2 минуты, 26 секунд
И в чем мне лгать? На чем меня легко поймать, любой может взять Northwood и запустить тест.

White

Добавлено: 24.02.2006 17:43

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko

Походу дела непонимаете тут только вы. С завидлным упрямством вы доказываете какие-то глупости. Я не верю лично вашим результатам. Я не верю ВСЕМ выложенным вами результатам.
Относительно ветвлений вам уже говорили выше. Вы же косите под ....

Вывод:

- Тест этот является бестолковой синтетикой
- Тест не отражает реальной производительности
- Тест допускает ошибки измерения внутри одного семейства процессоров
- Тест НЕ поддерживает мало мальски современные технологии

Пока я не получу строго обоснованые с точки зрения теории и практики, а также скриншотодоказаные опровержения данных фактов, то буду считать эти утверждения абсолютно верными.

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Lev Dymchenko

Добавлено: 24.02.2006 17:49

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Считаю, что я на все вопросы ответил. Подозревать, что я выдумал результаты, это невежливо и,честно говоря, глупо. Что мне тогда стоит взять скриншот Northwood2400C и скриншот теста c 1.0, тем более, если я его программирую? Вы можете представить себе диаграмму cpu-Z Northwood 2400C и разогнанного. И скриншот теста с 1.00 и 1.29 Ну выложите сами эти скриншоты.
Добавлено спустя 57 секунд
Но я все-таки выложу скриншоты, если это производит магическое действие.
Добавлено спустя 2 минуты, 14 секунд
Сегодня ещё не кончилось.

White

Добавлено: 24.02.2006 17:53

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko Может вы придумали этот результат? Я откуда знаю? А после ваших слов про Интелофилов, так вообще можно рещить что вы обиженый владелец Athlon на ядре Argon... Но никто до маразма не доходит и перестаньте лепить гнусные отмазки. Вам это не идёт.

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Lev Dymchenko

Добавлено: 24.02.2006 17:57

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

На ixbt форуме, тут была сслыка, тестили northwood. Я конечно в некотором роде глуп, но никак не могу взять в толк, если я придумал результат, то что мне мешает придумать скриншот?
Добавлено спустя 49 секунд
Чем screenshot лучше текстового сообщения?

White

Добавлено: 24.02.2006 19:33

[профиль]

Titan
Статус: Не в сети
Регистрация: 24.03.2004
Откуда: Москва

Lev Dymchenko

Всё ясно. Более мне не интересна эта тема, этот разговор и тем более этот тест.

Цитата:

Я конечно в некотором роде глуп

Заметьте, не я это сказал.

Я более не слежу за этой темой.

_________________
*Team MXS*, *Cofradia Intel*, Voodoo Masters

Lev Dymchenko

Добавлено: 24.02.2006 19:52

[профиль]

Member
Статус: Не в сети
Регистрация: 22.02.2006

Эх, я оказался плохим не опытным фальсификатором, скриншоты не заготовил. Разоблачили меня, что скриншотов-то и нету.

sergey2400

Добавлено: 24.02.2006 20:28

[профиль]

Member
Статус: Не в сети
Регистрация: 19.06.2003
Откуда: www.radeon.ru

white

white писал(а):

Всё ясно. Более мне не интересна эта тема, этот разговор и тем более этот тест.

Игорь, я думал, что ты это уже вчера понял... :hitrost:

Жаль, не успел сегодня модераторов застать, а то-бы ветка уже была в :rip:

_________________
Прощайте Лубянка, Петровка, Устал я от ваших забот,
Этапы, менты, уголовка, Ни кто больше брать не придёт.

1st SEA

Добавлено: 24.02.2006 20:59

[профиль]

Member
Статус: Не в сети
Регистрация: 25.08.2005

Люди не поняли, что тест не измеpяет пpоизводительность пpоцессоpов...
Как и не поняли pазницы между "эффективностью пpедсказания пеpеxодов" и "ценой потеpь от непpедсказанныx пеpеxодов".
Думаю, наглядно это можно показать так:

Пpедставим 2 гипотетичекиx пpоцессоpа pазной аpхитектуpы но пусть пpоцент пpедсказания пеpеxодов у ниx одинаков. Скажем, 85%. Заставим иx pаботать на однои частоте, для пpостоты. Так вот, когда пеpеxод НЕ пpедсказан, оба начинают подгpужать коды (И ДАННЫЕ!) для неугаданнои ветви. И вот тут оказываетса, что один пpоцессоp делает такую пеpегpузку быстpее дpугого (потому что конвееp короче, кеш2 или память быстpее).

_________________
Athlon 64 x2 4200+ (@2500=250x10) **
Gigabyte K8NS 939-Ultra ** 1 Gig DDR500 7-3-3-2.5 2x80GB ** Maxtor (PATA RAID0) ** Radeon X800XL

Новая тема /

Ответить

Сообщений: 238 • Страница 8 из 12 • < 1 ... 5 6 7 8 9 10 11 12 >

Список форумов » Специализированные форумы » Бенчмаркинг

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 10

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти: