*Cofradia Intel*
Статус: Не в сети Регистрация: 20.07.2006 Откуда: Донецк
Решил посмотреть насчет ошибок и прогнал этот тест на стандартных параметрах - проц 266x9=2,4 Ghz, память 800 со стандартными таймингами, на 2,2В.
Что получилось:
Intel(R) LINPACK data
Intel(R) Optimized LINPACK Benchmark 9.1
Current date/time: Tue Oct 30 13:42:05 2007
CPU frequency: 2.405 GHz
Number of CPUs: 4
Number of threads: 4
Parameters are set to:
Number of tests : 9
Number of equations to solve (problem size) : 15000 14000 13000 12000 11000 10000 8000 6000 1000
Leading dimension of array : 15000 14008 13000 12008 11000 10008 8008 6008 1000
Number of trials to run : 1 2 2 2 2 2 2 3 4
Data alignment value (in Kbytes) : 4 4 4 4 4 4 4 4 4
Maximum memory requested that can be used = 1569180224, at the size = 14000
============= Timing linear equation system solver =================
Максимум получилось 22,1914. То есть, если считать по той же формуле то 2,4*4*4=38,4. А тут - 22,1. Так что скорее всего формула дана слишком приблизительно.
2,4 - 22,2
3,2 - 29,5
3,6 - 33,8
можно протестировать на разных частотах - от 1,1 до 3,7 и получить те самые коэффициенты для 4 ядер 8 м кеша. Добавлено спустя 3 минуты, 20 секунд
Cronos писал(а):
mike02 Формула правильная. Просто 32bit версия намного медленнее -похоже она даже под SSE2 не оптимизирована.
Дикий народ - дети гор! (с)
Если уж интел выпускает свои тесты и не оптимизирует их?? Да уж..
С другой стороны им это не надо т.к. имеющиеся агены банально до уровня не дотягивают.
Жаль нет под рукой загрузочного диска с win64, интересно было бы сравнить результаты.
Member
Статус: Не в сети Регистрация: 08.01.2005 Откуда: Москва
mike02 писал(а):
Максимум получилось 22,1914. То есть, если считать по той же формуле то 2,4*4*4=38,4. А тут - 22,1. Так что скорее всего формула дана слишком приблизительно.
*Cofradia Intel*
Статус: Не в сети Регистрация: 20.07.2006 Откуда: Донецк
Intel(R) LINPACK data
Intel(R) Optimized LINPACK Benchmark 9.1
Current date/time: Tue Oct 30 15:35:33 2007
CPU frequency: 3.200 GHz RAM 1000Mhz@5-5-5-15 - 2.2V
Number of CPUs: 4
Number of threads: 4
Parameters are set to:
Number of tests : 9
Number of equations to solve (problem size) : 15000 14000 13000 12000 11000 10000 8000 6000 1000
Leading dimension of array : 15000 14008 13000 12008 11000 10008 8008 6008 1000
Number of trials to run : 1 2 2 2 2 2 2 3 4
Data alignment value (in Kbytes) : 4 4 4 4 4 4 4 4 4
Maximum memory requested that can be used = 1569180224, at the size = 14000
============= Timing linear equation system solver =================
Q6600 @ 3200 (356*9) 1.318В, RAM 4Гб @ 890 4-4-5-15 2.1В
Windows XP x64
Код:
CPU frequency: 3.204 GHz Number of CPUs: 4 Number of threads: 4 Parameters are set to:
Number of tests : 1 Number of equations to solve (problem size) : 20000 Leading dimension of array : 20000 Number of trials to run : 3 Data alignment value (in Kbytes) : 4
Maximum memory requested that can be used = 3200404096, at the size = 20000 ============= Timing linear equation system solver =================
Size LDA Align. Average Maximal 20000 20000 4 42.8461 42.8769
изучаем влияние FSB
Q6600 @ 3200 (457*7) 1.35В, RAM 4Гб @ 915 4-4-5-15 2.2В Windows XP x64
Код:
Number of tests : 1 Number of equations to solve (problem size) : 20000 Leading dimension of array : 20000 Number of trials to run : 3 Data alignment value (in Kbytes) : 4
Maximum memory requested that can be used = 3200404096, at the size = 20000 ============= Timing linear equation system solver =================
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
progn писал(а):
Есть мнение что квад лучше ставить на большую шину, при прочих равных, как видим это не подтверждается...
Уж конечно не в этом тесте это проверять. Это в основном BLAS level 3, а эти функции очень хорошо оптимизированы. Иначе не удалось бы получить столь высокой эффективности.
Чтобы тут что-то заметить, надо изменять ПСП в разы.
Проводите тестирование на 64 битном линуксе. Видел один такой обзор на одном китайском (или корейском или еще каком азиатском языке) сайте, там тестировались и атлоны и коре 2 дуо, и использовалась именно эта формула. Эффективность была высокой (от 75-95%).
2) # problem sizes -размеры матриц систем линейных уравнений. Чем это число больше, тем больше получится результат. Начиная с некоторого значения (примерно 10000), рост замедлится. Обьем памяти, который нужно для запуска, можно посчитать по формуле 8*N^2. Для 10000 получим 800Mb. Если задать больше чем реально установлено памяти, будет своп и тормоза -этого делать не стоит. Также стоит оставить что-то системе для работы, скажем 0.5 -1GB. 3) #leading dimensions -повторить вторую строку 4) #times - каждая задача с размером матрицы из соответствующего столбца #problem sizes будет повторена times раз. 5) #alignment -оставить 4
Насчёт пункта 2:
15000 14000 13000 12000 11000 10000 8000 6000 1000 # problem sizes
Это- матрицы которые будут запускатся по порядку? И для теста стабильности лучше поставить одну из них под память?
Насчёт пукта 4: приблизительно, чтоб прогреть квад в течении 30 минут, с размером матрицы 18000 (~1,5 гигов памяти?) сколько сюды надо писать?
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
moty писал(а):
Насчёт пункта 2: 15000 14000 13000 12000 11000 10000 8000 6000 1000 # problem sizes
Это- матрицы которые будут запускатся по порядку? И для теста стабильности лучше поставить одну из них под память?
Да. Лучше всего оставить одну -самую большую. Меньшие быстрее считаются, требуют меньше памяти, и дают меньший результат.
Цитата:
Насчёт пукта 4: приблизительно, чтоб прогреть квад в течении 30 минут, с размером матрицы 18000 (~1,5 гигов памяти?) сколько сюды надо писать?
Во первых, 18000 соответствует обьему памяти 8x18000^2 ~2.6GB
Во вторых, я не могу знать сколько времени на вашем железе займет решение одной задачи с такой матрицей. Просто поставьте 1 в #times, посмотрите сколько времени займет.
Думаю что за 3-5 минут все точно прогреется. Если хотите протестировать стабильность работы, можно оставить на ночь, задав большое количество итераций.
*Cofradia Intel*
Статус: Не в сети Регистрация: 20.07.2006 Откуда: Донецк
Cootri писал(а):
mike02 писал(а):
Так что тут скорее дело не в нестабильности а в ошибочности оценки в формуле.
Мне почему-то тоже кажется, что 3.2х4х4 неверно...
В принципе можно поизвращаться - на досуге потестировать квад с шиной от 200 до 450 и затем по полученым данным производительности составить таблицу, и далее провести интерполяцию методом лагранжа и получить функцию с коэффициентами.
То же самое можно сделать отключив 1 ядро у кента - получится статистика для Конро
*Cofradia Intel*
Статус: Не в сети Регистрация: 20.07.2006 Откуда: Донецк
Кстати, господа хорошие, а может найти и перекомпилить исходники, и далее померяться с владельцами АМДшных процов? Это ж не СуперПи в один поток на двух/четырехядернике считать? Как раз - реальная математическая производительность. Тем более для мультипотока - самое оно. Даже для феномов 3х - они ж скоро на подходе должны быть?
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 31
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения