Добавил в файловый архив Оверов несколько версий LinX на всяк пожарный и дал ссылки на них, чтобы было доступно хоть что-то в случае блокировки иностранных ресурсов (файлохранилищ). Позже ещё добавлю. На полноту коллекции, естественно, не претендую. I.N.
Последний раз редактировалось I.N. 07.05.2022 16:40, всего редактировалось 57 раз(а).
Здравствуйте, уважаемые специалисты. У меня I7 2600. Тест на 7 потоков (процессор имеет 4 физических ядра и 8 виртуальных ядер с hyperthreading'ом) в самом лучшем случае показывает около 50 Gflops. Не знаю, много это или мало. Процессор не разогнанный, реальная рабочая частота с Turbo boost'ом - около 3.5 Ghz. При попытке запустить все 8 потоков результат сильно падает, т.е. приходится жертвовать один поток Windows (Windows XP, 32 разряда). Самое смешное, что результат при 4 потоках с отключенным hyperthreading'ом примерно такой же - между двумя упомянутыми ранее результатами.
Intel(R) LINPACK 32-bit data - LinX 0.6.4
Current date/time: Thu Sep 01 19:58:40 2011
CPU frequency: 3.392 GHz Number of CPUs: 8 Number of threads: 7
Parameters are set to:
Number of tests : 1 Number of equations to solve (problem size) : 16134 Leading dimension of array : 16136 Number of trials to run : 20 Data alignment value (in Kbytes) : 4
Maximum memory requested that can be used = 2083032608, at the size = 16134
============= Timing linear equation system solver =================
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
ss16011973 писал(а):
Самое смешное, что результат при 4 потоках с отключенным hyperthreading'ом примерно такой же - между двумя упомянутыми ранее результатами.
А что в этом смешного? НТ ничем не поможет если программа грузит процессор на 100%. Вот если программа написана криво, не оптмизирована и не загружает ядра на 100% тогда остают свободные ресурсы на НТ и есть прирост. Когда процессор и 4-мя потоками загружен под завязку а на него вешают ещё 4 потока сверху - результат упадет. Это нормально.
Спасибо, я понял: максимальная теоретическая производительность составляет (частота)*(число физических ядер)*4, т.е. в моем случае 56 Gflops, т.к. в современных процесорах Intel в ядре 2 блока для сложения и 2 для умножения.
Только как насчет деления?
Кстати, у меня в некоторых тестах LinX показывл 60, 80, а один раз даже 118 Gflops, но это, наверное, ошибка, связанная с расчетом времени.
Добавлено спустя 1 час 9 минут 9 секунд: Кстати, я проверел, как влияет hyperthreading на реальную вычислительную задачу без распараллеливания (расчет водоема охладителя атомной электростанции на 10 дней). Казалось бы, если запущен только один поток, то hyperthreading должен только помешать. На деле же задача с включенным hyperthreading'ом выполняется за 5 мин. 52 сек., а с выключенным - за 6 мин. 20 сек. (6 мин. 23 сек. когда я еще делал что-то другое).
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
ss16011973 писал(а):
Кстати, я проверел, как влияет hyperthreading на реальную вычислительную задачу без распараллеливания (расчет водоема охладителя атомной электростанции на 10 дней). Казалось бы, если запущен только один поток, то hyperthreading должен только помешать. На деле же задача с включенным hyperthreading'ом выполняется за 5 мин. 52 сек., а с выключенным - за 6 мин. 20 сек. (6 мин. 23 сек. когда я еще делал что-то другое).
Надо неверное попробовать интелловский компилятор и SSE команды на векторах. Несколько блоков для математики и сделаны как раз для SSE вычислений.
Большое спасибо. Можно немножко поподробней? Я использую Windows XP (32 разрядную) и Delpgi 6 (наверное будете смеятся, но новое серьезное программное обеспечение стоит денег). Нет ли упомянутого Intel'овского копилятора под Pascal'евские программы?
Т.к. самому научиться распараллеливать расчеты не так просто, я решил что лучше буду запускать несколько расчетных вариантов сразу. В результате установил, что при запуске одновременно 8 расчетов время одного расчета увеличивается почти в 2 раза, зато количество расчетов за условную единицу времени увеличивается в 4.2 раза. Но это еще пройдет с двухмерной моделью, которая считается одну ночь (годовой цикл), а с трехмерной моделью уже могут возникнуть проблемы.
Кстати, запустил еще раз LinX без hyperthreading'а и получил > 51 Gflops, т.о. достигнуто условное КПД в 92% против 89% с hyperthreading'ом (и это при дешевой материнской плате, дешевой памяти, 32-х разрядной системе и при всех работающих службах Windows). Конечно, КПД моих собственных программ должно быть в разы меньше.
of threads: 4
Parameters are set to:
Number of tests : 1 Number of equations to solve (problem size) : 16134 Leading dimension of array : 16136 Number of trials to run : 20 Data alignment value (in Kbytes) : 4
Maximum memory requested that can be used = 2083032608, at the size = 16134
============= Timing linear equation system solver =================
Member
Статус: Не в сети Регистрация: 16.11.2007 Откуда: Крым, Земля! Фото: 4
4ever Young писал(а):
Есть ключи тихой установки?
Вы о чём? Программа работет без устанвоки. Запускется с "ГУИ" и считает если хотите - можете сами скачать консольный вариант от интела и пускать в таком режиме.
_________________ Хочешь сделать людям хорошо — сделай плохо, а потом верни, как было. Hi Jack - Hi! Hijack - Hi! Broni всех стран объединяйтесь!
Advokatvlad Рядом с указанием объема используемой памяти есть кнопка "Вся", ее нажать и тестить проходов 20. Но если надо тестировать память, лучше воспользоваться программой prime95.
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
Advokatvlad писал(а):
Она только для памяти годится, читал, что там можно процессор тестировать?
Можно. Последняя версия 26.6 и выше в 64-х битах греет не хуже линпака. Там надо дождаться 10-12 итерации, пойдет максимальный нагрев. гонял 945 фен, так прайм прогрел сильнее и потреление под праймом было на 15 ватт выше чем под линпаком.
Есть Athlon 64 3500+ 2211Mhz не разгонял ничего, периодически стал перезагружаться, по температуре все нормально, запустил linx, выдает ошибку. Что делать?
Memtest 86+ на втором прогоне выдал ошибку, всего 2 планки, 1 вынул и выдала ошибку на 1 прогоне, ща вторую проверяю.
Member
Статус: Не в сети Регистрация: 05.01.2011 Откуда: vologda Фото: 3
ктонибудь может обьяснить, как заставить работать linX 0.64+avx на амд(новые cpu серии FX-хххх? Тоесь я разобрался как заставить работать, но работает только fpu, а avx работать не хочет
Advanced member
Статус: Не в сети Регистрация: 02.01.2007 Откуда: Николаев
cannibal_pro ищи камрада Right о котором в шапке говорится... он наверно знает.
Добавлено спустя 3 минуты 12 секунд: cannibal_pro кстати включение AVX для буля может сильно поправить его репутацию . На i7 дает почти 2-хкратную прибавку. Да чуть не забыл - для работы AVX обязательное условие наличие Win7 sp1.
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
alex1974 писал(а):
cannibal_pro кстати включение AVX для буля может сильно поправить его репутацию . На i7 дает почти 2-хкратную прибавку. Да чуть не забыл - для работы AVX обязательное условие наличие Win7 sp1.
Интересно чем это поправит булю и чем помогает интелю? Есть хоть одна прилога приме линпаки которая AVX юзает?
Advanced member
Статус: Не в сети Регистрация: 02.01.2007 Откуда: Николаев
Andreika писал(а):
Интересно чем это поправит булю и чем помогает интелю?
Если судить по аналогии с SB включение AVX должно значительно увеличить прирост гигафлопс. В реальных приложениях конечно ничего не изменится... Хотя стоило бы сравнить производительность в Win 7 vs Win7 SP1... возможно какая то разница есть. (в SP1 как раз вводится поддержка AVX)
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 9
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения