Текущая версия 0.4.1, графический интерфейс на С#, так что потребуется .NETFramework. (Присутствует по умолчанию начиная с Win XP SP2) Рекомендуется использовать драйвера 25Х.ХХ.
Программа считает факториал в 16-ричном виде, может делать это используя CPU, либо с расчётом особо тяжеловесных операций на GPU.
Сравнивает полученные скорости и расчитывает получившееся ускорение расчета.
Некоторые нововведения:
Начиная с версии 0.4.0 введена полная поддержка мульти GPU систем, в том числе гетерогенных(например комбинация 9800 GT и GTX 295).
Начиная с версии 0.3.0 введена полная поддержка многоядерных CPU, и симметричных многопроцессорных систем(например по состоянию на 2010.01.31 мировой рекорд на CPU принадлежал системе основанной на четырёх четырёхядерных процессорах Xeon).
Кому интересно и есть желание прогнать, прошу выкладывать сюда результаты в таком виде:
250000! CPU time = 22.146 s, GPU time = 18.547 s, Acceleration = x1.3
Т.е. сначала версия программы, затем инфа по CPU и GPU, ОС, драйвер, затем получившиеся попугаи.
Пожалуйста не пишите "на профильной машине", т.к. я просто сохраняю страницу форума с вашими результатами, очень неудобно по каждому пользователю смотреть профиль.
Возможно для работы этой штуки понадобится устанавливать драйвер NVIDIA PhysX, если драйвер GeForce старой версии.
Работать должно на всех видюхах начиная с 8-й серии GeForce начиная с 8400 GS для десктопных карт, 8400 M GT - в мобильной линейке и возможно даже на интегрированных видео начиная с 8100.
Сравнительная гистограмма некоторых результатов:
#77
Будет изредка дополняться новыми результатами и заменяться результатами на свежих версиях.
Последний раз редактировалось Mathematic 05.09.2010 18:38, всего редактировалось 24 раз(а).
250000 CPU time = 19.125 s, GPU time = 5.963 s, Acceleration = x3.3
300000 CPU time = 28.472 s, GPU time = 8.720 s, Acceleration = x3.3
400000 CPU time = 53.746 s, GPU time = 16.152 s, Acceleration = x3.4
500000 CPU time = 1m 26.551 s, GPU time = 26.134 s, Acceleration = x3.4
Mathematic Как и просили:
AMD Athlon x2 7750BE
CPU 3 GHz
NB 2.2GHz
DDR2 667MHz (5-5-5-15) 1Gb x 3 unganged
Video XFX GTX260 (GX-260X-ADJF) 216 sp (nominal)
#77 Атлоны тоже могут побороться в этом бенчмарке. Как мне кажется, что в этом тесте немаловажно стабильность и скорость работы с памятью...
Member
Статус: Не в сети Регистрация: 04.01.2008 Откуда: Самара
комп в профиле, проц на 3.1 ггц
результаты на версии 0.3.1
при 250000
цпу 4потока 11.627с
гпу 17.470с
итого 0.7х
при 500000
цпу 4потока 55.787с
гпу 1м18.693с
итого0.8х
при 750000
цпу 4потока 2м32.650с
гпу 0.023с
итого 6814х
это нормально?
_________________ Мыши кололись, плевались, но продолжали жрать кактус... (с)
ALL Я вспомнил, почему могут быть проблемы при расчёте 750К.
750К - это как раз то самое пороговое значение при котором 512Мб памяти на видяхе уже может не хватить. Проверьте - если у вас 512 МБ оперативы и 700К считается, значет дело в этом, а вообще по-хорошему нужна проверка ошибок, которая скоро будет сделана.
_________________ Разработчик бенчмарка CUDA Factorial Benchmark.
Mathematic Согласен, это нехватка памяти, потому как на моей (почти 900 Метрововой) 750 тыс считает 1 м. 8 сек , 1000000 за 2 м. 16 сек, а вот 1500000 уже за 0.016 сек.
Как я понял, для моего объема памяти предел 1375000 знаков, при 1400000 уже зависание расчетов, при 1425000 счет за 0.0хх сек.
Mathematic можешь залить на "персональную страницу"? Твой сайт что-то не открывается сейчас.
Код:
ping total-oc.com
Обмен пакетами с total-oc.com [88.84.152.148] с 32 байтами данных: Превышен интервал ожидания для запроса. Превышен интервал ожидания для запроса. Ответ от 89.202.113.22: Заданный узел недоступен. Ответ от 89.202.113.22: Заданный узел недоступен.
Теперь критика: 1) Разница между 200 000 и 250 000 почти в 2 раза. Как так может быть?? 2) GPU считает почти так же как и 4-х ядерник, тоесть разница невелика. 3) Если расчитать один и тот же результат пару раз, то он в достаточной степени разный. 4) Прога вообще отличная, но немного недоработаная. Mathematic, желаю удачи в твоих разработках, надеюсь прога в ближайшее время начнёт функционировать на все 100!! ))
_________________ i9 10900k@4900 (Liquid Metal) / MSI Z490 GP / MSI RTX4070 Super / HyperX 32GB DDR4@4000 / CPU+GPU Custom Water Cooling / Lian Li O11D Evo XL + EDGE 850W
Заблокирован Статус: Не в сети Регистрация: 05.01.2009 Откуда: France
Mathematic Сделай, пожалуйста, под 16 потоков или более. Хочу попробовать какие результаты на серверах получатся. Четыре четырёхядерных Xeon 2.13ГГц считают 250000 за 5,997s. А ещё есть из 16 штук - хотелось бы на этом попробовать. Заранее благодарен!
В этом нет необходимости, Вам достаточно руками написать "16 threads" и всё прекрасно заработает, более того, даже "128 threads" отработает прекрасно. Причем это было начиная с первой версии в которой появилась функция multiCPU - v0.3.0, так что сервера без проблем могут быть по максимому загружены.
PSA_OC писал(а):
Четыре четырёхядерных Xeon 2.13ГГц считают 250000 за 5,997s. А ещё есть из 16 штук - хотелось бы на этом попробовать. Заранее благодарен!
С Вас пожалуйста скриншоты результатов прогонов на таких конфигурациях! Взаимно, заранее спасибо !
Добавлено спустя 4 минуты 56 секунд: {~Шок~}
Отпишусь позже.
_________________ Разработчик бенчмарка CUDA Factorial Benchmark.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 11
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения