Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 1612 • Страница 47 из 81<  1 ... 44  45  46  47  48  49  50 ... 81  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 
Прилепленное (важное) сообщение

Member
Статус: Не в сети
Регистрация: 16.08.2007
Откуда: Москва
Заметка: Linpack + GUI = LinX

Текущая версия отныне и впредь на GitHub: LinX 0.6.5

Изменения:
    • совместим с последними версиями Linpack
    • особо любознательные могут посмотреть неприлично страшный делфокод

Спасибо камраду Right, показавшему, как заставить Linpack поддерживать процессоры AMD! :applause:

Оригинальная ветка про Linpack и FAQ.
Для знающих английский — ветка на XtremeSystems.

=========================

LinX 0.9.8: https://overclockers.ru/files/download/2512
LinX 0.9.7 (Intel) Rus: https://overclockers.ru/files/download/2514
LinX 0.6.5 (AMD): https://overclockers.ru/files/download/2516

Добавил в файловый архив Оверов несколько версий LinX на всяк пожарный и дал ссылки на них, чтобы было доступно хоть что-то в случае блокировки иностранных ресурсов (файлохранилищ). Позже ещё добавлю. На полноту коллекции, естественно, не претендую.
I.N.


Последний раз редактировалось I.N. 07.05.2022 16:40, всего редактировалось 57 раз(а).
up



Партнер
 

Junior
Статус: Не в сети
Регистрация: 31.08.2011
Здравствуйте, уважаемые специалисты. У меня I7 2600. Тест на 7 потоков (процессор имеет 4 физических ядра и 8 виртуальных ядер с hyperthreading'ом) в самом лучшем случае показывает около 50 Gflops. Не знаю, много это или мало. Процессор не разогнанный, реальная рабочая частота с Turbo boost'ом - около 3.5 Ghz. При попытке запустить все 8 потоков результат сильно падает, т.е. приходится жертвовать один поток Windows (Windows XP, 32 разряда). Самое смешное, что результат при 4 потоках с отключенным hyperthreading'ом примерно такой же - между двумя упомянутыми ранее результатами.

Intel(R) LINPACK 32-bit data - LinX 0.6.4

Current date/time: Thu Sep 01 19:58:40 2011

CPU frequency: 3.392 GHz
Number of CPUs: 8
Number of threads: 7

Parameters are set to:

Number of tests : 1
Number of equations to solve (problem size) : 16134
Leading dimension of array : 16136
Number of trials to run : 20
Data alignment value (in Kbytes) : 4

Maximum memory requested that can be used = 2083032608, at the size = 16134

============= Timing linear equation system solver =================

Size LDA Align. Time(s) GFlops Residual Residual(norm)
16134 16136 4 56.097 49.9202 2.335223e-010 3.180849e-002
16134 16136 4 56.078 49.9371 2.335223e-010 3.180849e-002
16134 16136 4 56.393 49.6584 2.335223e-010 3.180849e-002
16134 16136 4 55.680 50.2939 2.335223e-010 3.180849e-002
16134 16136 4 56.086 49.9302 2.335223e-010 3.180849e-002
16134 16136 4 55.944 50.0571 2.335223e-010 3.180849e-002
16134 16136 4 56.570 49.5028 2.335223e-010 3.180849e-002
16134 16136 4 55.985 50.0200 2.335223e-010 3.180849e-002
16134 16136 4 55.927 50.0721 2.335223e-010 3.180849e-002
16134 16136 4 56.059 49.9541 2.335223e-010 3.180849e-002
16134 16136 4 56.001 50.0056 2.335223e-010 3.180849e-002
16134 16136 4 55.946 50.0547 2.335223e-010 3.180849e-002
16134 16136 4 55.947 50.0537 2.335223e-010 3.180849e-002
16134 16136 4 56.523 49.5442 2.335223e-010 3.180849e-002
16134 16136 4 56.357 49.6897 2.335223e-010 3.180849e-002
16134 16136 4 56.008 49.9998 2.335223e-010 3.180849e-002
16134 16136 4 55.950 50.0510 2.335223e-010 3.180849e-002
16134 16136 4 55.554 50.4083 2.335223e-010 3.180849e-002
16134 16136 4 56.408 49.6446 2.335223e-010 3.180849e-002
16134 16136 4 56.108 49.9103 2.335223e-010 3.180849e-002

Performance Summary (GFlops)

Size LDA Align. Average Maximal
16134 16136 4 49.9354 50.4083

End of tests


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
ss16011973 писал(а):
Самое смешное, что результат при 4 потоках с отключенным hyperthreading'ом примерно такой же - между двумя упомянутыми ранее результатами.


А что в этом смешного? НТ ничем не поможет если программа грузит процессор на 100%. Вот если программа написана криво, не оптмизирована и не загружает ядра на 100% тогда остают свободные ресурсы на НТ и есть прирост. Когда процессор и 4-мя потоками загружен под завязку а на него вешают ещё 4 потока сверху - результат упадет. Это нормально.


 

Junior
Статус: Не в сети
Регистрация: 31.08.2011
Спасибо, я понял: максимальная теоретическая производительность составляет (частота)*(число физических ядер)*4, т.е. в моем случае 56 Gflops, т.к. в современных процесорах Intel в ядре 2 блока для сложения и 2 для умножения.

Только как насчет деления?

Кстати, у меня в некоторых тестах LinX показывл 60, 80, а один раз даже 118 Gflops, но это, наверное, ошибка, связанная с расчетом времени.

Добавлено спустя 1 час 9 минут 9 секунд:
Кстати, я проверел, как влияет hyperthreading на реальную вычислительную задачу без распараллеливания (расчет водоема охладителя атомной электростанции на 10 дней). Казалось бы, если запущен только один поток, то hyperthreading должен только помешать. На деле же задача с включенным hyperthreading'ом выполняется за 5 мин. 52 сек., а с выключенным - за 6 мин. 20 сек. (6 мин. 23 сек. когда я еще делал что-то другое).


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
ss16011973 писал(а):
Кстати, я проверел, как влияет hyperthreading на реальную вычислительную задачу без распараллеливания (расчет водоема охладителя атомной электростанции на 10 дней). Казалось бы, если запущен только один поток, то hyperthreading должен только помешать. На деле же задача с включенным hyperthreading'ом выполняется за 5 мин. 52 сек., а с выключенным - за 6 мин. 20 сек. (6 мин. 23 сек. когда я еще делал что-то другое).


Надо неверное попробовать интелловский компилятор и SSE команды на векторах. Несколько блоков для математики и сделаны как раз для SSE вычислений.


 

Junior
Статус: Не в сети
Регистрация: 31.08.2011
Большое спасибо. Можно немножко поподробней? Я использую Windows XP (32 разрядную) и Delpgi 6 (наверное будете смеятся, но новое серьезное программное обеспечение стоит денег). Нет ли упомянутого Intel'овского копилятора под Pascal'евские программы?

Т.к. самому научиться распараллеливать расчеты не так просто, я решил что лучше буду запускать несколько расчетных вариантов сразу. В результате установил, что при запуске одновременно 8 расчетов время одного расчета увеличивается почти в 2 раза, зато количество расчетов за условную единицу времени увеличивается в 4.2 раза. Но это еще пройдет с двухмерной моделью, которая считается одну ночь (годовой цикл), а с трехмерной моделью уже могут возникнуть проблемы.

Кстати, запустил еще раз LinX без hyperthreading'а и получил > 51 Gflops, т.о. достигнуто условное КПД в 92% против 89% с hyperthreading'ом (и это при дешевой материнской плате, дешевой памяти, 32-х разрядной системе и при всех работающих службах Windows). Конечно, КПД моих собственных программ должно быть в разы меньше.

of threads: 4

Parameters are set to:

Number of tests : 1
Number of equations to solve (problem size) : 16134
Leading dimension of array : 16136
Number of trials to run : 20
Data alignment value (in Kbytes) : 4

Maximum memory requested that can be used = 2083032608, at the size = 16134

============= Timing linear equation system solver =================

Size LDA Align. Time(s) GFlops Residual Residual(norm)
16134 16136 4 55.453 50.5003 2.437332e-010 3.319933e-002
16134 16136 4 54.629 51.2621 2.437332e-010 3.319933e-002
16134 16136 4 54.201 51.6660 2.437332e-010 3.319933e-002
16134 16136 4 54.216 51.6526 2.437332e-010 3.319933e-002
16134 16136 4 54.720 51.1763 2.437332e-010 3.319933e-002
16134 16136 4 54.583 51.3049 2.437332e-010 3.319933e-002
16134 16136 4 54.703 51.1921 2.437332e-010 3.319933e-002
16134 16136 4 54.857 51.0487 2.437332e-010 3.319933e-002
16134 16136 4 54.727 51.1702 2.437332e-010 3.319933e-002
16134 16136 4 54.734 51.1630 2.437332e-010 3.319933e-002
16134 16136 4 54.858 51.0475 2.437332e-010 3.319933e-002
16134 16136 4 54.709 51.1866 2.437332e-010 3.319933e-002
16134 16136 4 54.194 51.6731 2.437332e-010 3.319933e-002
16134 16136 4 54.804 51.0983 2.437332e-010 3.319933e-002
16134 16136 4 54.304 51.5686 2.437332e-010 3.319933e-002
16134 16136 4 54.709 51.1865 2.437332e-010 3.319933e-002
16134 16136 4 54.309 51.5636 2.437332e-010 3.319933e-002
16134 16136 4 54.193 51.6744 2.437332e-010 3.319933e-002
16134 16136 4 54.205 51.6627 2.437332e-010 3.319933e-002
16134 16136 4 54.703 51.1922 2.437332e-010 3.319933e-002

Performance Summary (GFlops)

Size LDA Align. Average Maximal
16134 16136 4 51.2995 51.6744

End of tests


 

Junior
Статус: Не в сети
Регистрация: 31.08.2011
Дополнение: КПД расчетных программ написанных на Delphi (7.0) как минимум в 7 раз меньше чем у LinX.

И еще, сравнение производительности разных компьютеров с помощью расчетной программы написанной на Delphi:

#77


 

Member
Статус: Не в сети
Регистрация: 17.07.2006
Есть ключи тихой установки?

_________________
Do you rely want to live forever?...


 

Member
Статус: Не в сети
Регистрация: 16.11.2007
Откуда: Крым, Земля!
Фото: 4
4ever Young писал(а):
Есть ключи тихой установки?

Вы о чём? Программа работет без устанвоки. Запускется с "ГУИ" и считает :) если хотите - можете сами скачать консольный вариант от интела и пускать в таком режиме.

_________________
Хочешь сделать людям хорошо — сделай плохо, а потом верни, как было.
Hi Jack - Hi! Hijack - Hi!
Broni всех стран объединяйтесь!


 

Member
Статус: Не в сети
Регистрация: 17.07.2006
Сам нашёл /S

_________________
Do you rely want to live forever?...


 

Member
Статус: Не в сети
Регистрация: 18.02.2010
Откуда: Минск
Фото: 0
могу я пользоваться настройками по-умолчанию? Для моего профиля см. Просто лень разбираться в ещё одной программе.

_________________
AMD FX-8350/ASUS SABERTOOTH 990FX R2.0/HyperX Fury Black 2x8GB PC3-14900/Sapphire Radeon HD 5770 1GB GDDR5/Plextor M9PeY 256GB/Chieftec CFT-650-14CS


 

Member
Статус: Не в сети
Регистрация: 15.10.2004
Advokatvlad Рядом с указанием объема используемой памяти есть кнопка "Вся", ее нажать и тестить проходов 20. Но если надо тестировать память, лучше воспользоваться программой prime95.


 

Member
Статус: Не в сети
Регистрация: 18.02.2010
Откуда: Минск
Фото: 0
Цитата:
Но если надо тестировать память, лучше воспользоваться программой prime95.

Она только для памяти годится, читал, что там можно процессор тестировать?

_________________
AMD FX-8350/ASUS SABERTOOTH 990FX R2.0/HyperX Fury Black 2x8GB PC3-14900/Sapphire Radeon HD 5770 1GB GDDR5/Plextor M9PeY 256GB/Chieftec CFT-650-14CS


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Advokatvlad писал(а):
Она только для памяти годится, читал, что там можно процессор тестировать?


Можно. Последняя версия 26.6 и выше в 64-х битах греет не хуже линпака.
Там надо дождаться 10-12 итерации, пойдет максимальный нагрев. гонял 945 фен, так прайм прогрел сильнее и потреление под праймом было на 15 ватт выше чем под линпаком.


 

Member
Статус: Не в сети
Регистрация: 18.02.2010
Откуда: Минск
Фото: 0
Цитата:
Там надо дождаться 10-12 итерации

А что это такое? Вы на Blende греете?

_________________
AMD FX-8350/ASUS SABERTOOTH 990FX R2.0/HyperX Fury Black 2x8GB PC3-14900/Sapphire Radeon HD 5770 1GB GDDR5/Plextor M9PeY 256GB/Chieftec CFT-650-14CS


 

Junior
Статус: Не в сети
Регистрация: 10.10.2010
Есть Athlon 64 3500+ 2211Mhz не разгонял ничего, периодически стал перезагружаться, по температуре все нормально, запустил linx, выдает ошибку. Что делать?

Memtest 86+ на втором прогоне выдал ошибку, всего 2 планки, 1 вынул и выдала ошибку на 1 прогоне, ща вторую проверяю.


 

Member
Статус: Не в сети
Регистрация: 05.01.2011
Откуда: vologda
Фото: 3
ктонибудь может обьяснить, как заставить работать linX 0.64+avx на амд(новые cpu серии FX-хххх? Тоесь я разобрался как заставить работать, но работает только fpu, а avx работать не хочет

_________________
Разгоним даже «Запорожец»


 

Advanced member
Статус: Не в сети
Регистрация: 02.01.2007
Откуда: Николаев
cannibal_pro ищи камрада Right о котором в шапке говорится... он наверно знает.

Добавлено спустя 3 минуты 12 секунд:
cannibal_pro кстати включение AVX для буля может сильно поправить его репутацию :). На i7 дает почти 2-хкратную прибавку. Да чуть не забыл - для работы AVX обязательное условие наличие Win7 sp1.

_________________
http://people.overclockers.ru/alex1974/record27


 

Member
Статус: Не в сети
Регистрация: 05.01.2011
Откуда: vologda
Фото: 3
alex1974 спасибо за совет, а прибавка должна быть

_________________
Разгоним даже «Запорожец»


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
alex1974 писал(а):
cannibal_pro кстати включение AVX для буля может сильно поправить его репутацию :). На i7 дает почти 2-хкратную прибавку. Да чуть не забыл - для работы AVX обязательное условие наличие Win7 sp1.


Интересно чем это поправит булю и чем помогает интелю?
Есть хоть одна прилога приме линпаки которая AVX юзает?


 

Advanced member
Статус: Не в сети
Регистрация: 02.01.2007
Откуда: Николаев
Andreika писал(а):
Интересно чем это поправит булю и чем помогает интелю?

Если судить по аналогии с SB включение AVX должно значительно увеличить прирост гигафлопс. В реальных приложениях конечно ничего не изменится... Хотя стоило бы сравнить производительность в Win 7 vs Win7 SP1... возможно какая то разница есть. (в SP1 как раз вводится поддержка AVX)

_________________
http://people.overclockers.ru/alex1974/record27


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 1612 • Страница 47 из 81<  1 ... 44  45  46  47  48  49  50 ... 81  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 9


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan