Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 288 • Страница 1 из 151  2  3  4  5 ... 15  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 
Прилепленное (важное) сообщение

Member
Статус: Не в сети
Регистрация: 14.08.2008
Сделал бенч, выложил, вот ссылка http://total-oc.ru/download.php?id=101

Резервная ссылка[персональная страница на оверах] http://people.overclockers.ru/Mathematic/files

Текущая версия 0.4.1, графический интерфейс на С#, так что потребуется .NETFramework. (Присутствует по умолчанию начиная с Win XP SP2)
Рекомендуется использовать драйвера 25Х.ХХ.

Программа считает факториал в 16-ричном виде, может делать это используя CPU, либо с расчётом особо тяжеловесных операций на GPU.

Сравнивает полученные скорости и расчитывает получившееся ускорение расчета.

Некоторые нововведения:

Начиная с версии 0.4.0 введена полная поддержка мульти GPU систем, в том числе гетерогенных(например комбинация 9800 GT и GTX 295).

Начиная с версии 0.3.0 введена полная поддержка многоядерных CPU, и симметричных многопроцессорных систем(например по состоянию на 2010.01.31 мировой рекорд на CPU принадлежал системе основанной на четырёх четырёхядерных процессорах Xeon).

Кому интересно и есть желание прогнать, прошу выкладывать сюда результаты в таком виде:

v0.4.0

CPU: Intel Core 2 Duo E7200 @ 400x7 = 2.8 GHz,
MEM: Dual Channel DDR2 800 MHz (4-4-4-12)

GPU: GeForce 9600 GT(64SP,512Mb) @ 2000 MHz Shader Clock, 2000 MHz Memory Clock

WinXP SP2, GeForce 195.21

250000! CPU time = 22.146 s, GPU time = 18.547 s, Acceleration = x1.3

Т.е. сначала версия программы, затем инфа по CPU и GPU, ОС, драйвер, затем получившиеся попугаи.

Пожалуйста не пишите "на профильной машине", т.к. я просто сохраняю страницу форума с вашими результатами, очень неудобно по каждому пользователю смотреть профиль.

Возможно для работы этой штуки понадобится устанавливать драйвер NVIDIA PhysX, если драйвер GeForce старой версии.

Работать должно на всех видюхах начиная с 8-й серии GeForce начиная с 8400 GS для десктопных карт, 8400 M GT - в мобильной линейке и возможно даже на интегрированных видео начиная с 8100.

Сравнительная гистограмма некоторых результатов:

#77

Будет изредка дополняться новыми результатами и заменяться результатами на свежих версиях.


Последний раз редактировалось Mathematic 05.09.2010 18:38, всего редактировалось 24 раз(а).


Партнер
 

Member
Статус: Не в сети
Регистрация: 05.12.2005
Откуда: Rostov-on-Don
CPU: Core i7 920 @ 3400
MEM: Triple Chanell DDR3 1600 7-7-7-21

#77

Программа весьма интересна. Если есть желание развивать её на более серьезном уровне - посмотри это :)

_________________
Intel Inside ;-)


 

Member
Статус: Не в сети
Регистрация: 16.11.2007
Откуда: Крым, Земля!
Фото: 4
Mathematic Эм, а у меня ругается на отсутствие "кударат.ДЛЛ" - де его брать?

_________________
Хочешь сделать людям хорошо — сделай плохо, а потом верни, как было.
Hi Jack - Hi! Hijack - Hi!
Broni всех стран объединяйтесь!


 

Member
Статус: Не в сети
Регистрация: 05.12.2005
Откуда: Rostov-on-Don
Megagad писал(а):
Эм, а у меня ругается на отсутствие "кударат.ДЛЛ" - де его брать?

У меня тоже ругался. Попробуйте поиском по папке с Виндой - найти должен. Или с любым CUDA приложением. Лично я взял библиотеку, которая идет с этим бенчем.

_________________
Intel Inside ;-)


 

Member
Статус: Не в сети
Регистрация: 16.11.2007
Откуда: Крым, Земля!
Фото: 4
Foxtrot А куда его ложить? Эту дллку?

_________________
Хочешь сделать людям хорошо — сделай плохо, а потом верни, как было.
Hi Jack - Hi! Hijack - Hi!
Broni всех стран объединяйтесь!


 

Member
Статус: Не в сети
Регистрация: 05.12.2005
Откуда: Rostov-on-Don
Megagad Прям туда же, где экзешник программы.

_________________
Intel Inside ;-)


 

Member
Статус: Не в сети
Регистрация: 16.11.2007
Откуда: Крым, Земля!
Фото: 4
Хм, на профильной машине:
250000 ЦПУ - 204295мс, ГПУ - 17520мс - Acceleration = x11,7 :) Нда, как я понял, программа загружает только одно ядро у процессора??

_________________
Хочешь сделать людям хорошо — сделай плохо, а потом верни, как было.
Hi Jack - Hi! Hijack - Hi!
Broni всех стран объединяйтесь!


 

Megagad писал(а):
Нда, как я понял, программа загружает только одно ядро у процессора??


Уменя 2 ядра из 4 юзало


 

Member
Статус: Не в сети
Регистрация: 07.05.2008
Откуда: Откуда и все
на профильной машине:

CUDA Accelerated Hex Factorial Calculator v0.1.0

Using Device 0: "GeForce 8800 GT"

Enter number(1..1000000) to calculate factorial 250000

Calculating 250000!

Calculating on CPU using sequential multiplications ... done

Calculating on GPU using parallel multiplications ... done


CPU time = 133105.578125 <ms>
GPU time = 17086.990234 <ms>
Acceleration = x7.8 faster

По показаниям RightMark CPU Clock Utility программа загружает оба ядра на 60-80%, в том числе и при расчете на GPU.
ЗЫ:Поставил сразу на миллион - да терпения ждать не хватило.
Я использовал другую dll-ку из OCCT-она более поздняя по дате и чуть большего размера.


 

Member
Статус: Не в сети
Регистрация: 16.11.2007
Откуда: Крым, Земля!
Фото: 4
TVS Это так кажется :) загрузка очень "временная" и быстро меняющаяся(винда быстро перекидывает поток).

_________________
Хочешь сделать людям хорошо — сделай плохо, а потом верни, как было.
Hi Jack - Hi! Hijack - Hi!
Broni всех стран объединяйтесь!


 

Member
Статус: Не в сети
Регистрация: 17.10.2005
CPU: AX2 2.9Ghz
GPU: 9800GT 112sp*1500mhz

#77
#77


 

Member
Статус: Не в сети
Регистрация: 25.09.2006
Откуда: П-Камчатский
Mathematic библиотеку в архив доложи , напиши bat-ник (или тп) который автоматизирует расчеты и выведет их в итоге в один файл, что бы потом копи пастом запостить здесь (для удобства)

_________________
"...Я смотрю на свое тело,наверно это просто сеть, Я ненавижу его,оно должно умереть..."-гр. 7Раса, | Разгон - это всегда лотерея


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
ALL: ну во первых, спасибо всем отписавшимся!

далее по порядку

Foxtrot писал(а):
Программа весьма интересна. Если есть желание развивать её на более серьезном уровне - посмотри это

Желание есть, свободного времени мало. Тем не менее в планах по развитию как минимум следующие пункты:
1) приделать гуёвый интерфейс,
2) улучшить алгоритм расчёта,
3) при вычислении на CPU использовать не один поток(и следовательно одно ядро проца), а настраиваемое количество
4) сделать тертий режим расчёта - CPU+GPU - когда максимально нагружаются оба.
5) расчёт с использованием нескольких GPU(ну это очень не скоро, т.к. надо системник посерьёзнее собрать).


Megagad писал(а):
как я понял, программа загружает только одно ядро у процессора??

При расчёте на CPU одно, при расчёте на GPU лично я использую один поток, который подготавливает данные для GPU, но сама библиотека CUDA запускает свои потоки, так что у меня в программе одновременно происходит расчёт на GPU и подготовка данных на проце. А вот уж сколько там потоков на проце запустит CUDA - это не ко мне вопрос. Но в текущей версии похоже что загружает она ~ 1.3 ядер.

JOHN_16 писал(а):
Mathematic библиотеку в архив доложи , напиши bat-ник (или тп) который автоматизирует расчеты и выведет их в итоге в один файл, что бы потом копи пастом запостить здесь (для удобства)


Библиотеку доложу завтра. Про батник не очень понимаю что именно требуется? Там же диалог с пользователем, не могу я просто перенаправить вывод в файл.

2 ALL: пожалуйста пишите обязательно частоты памяти и шейдерного домена GPU, и можете с ними поиграть т.к. они влияют на производительность.

Я постараюсь сделать так чтобы бенч выводил частоту шейдерного домена, как то там вроде можно это сделать. Но вот насчёт памяти не уверен.
Добавлено спустя 9 минут, 7 секунд
caraput писал(а):
Поставил сразу на миллион - да терпения ждать не хватило.


А я дождался, но когда дошло до расчёта на GPU вылезли ошибки - не хватило памяти видеокарты(у меня 512mb). Память там используется хорошо :)
Максимум у меня получалось 700000!.
Думаю над отображением прогресса, точный там сложно сделать, но хоть какой-то не помешает.


 

Member
Статус: Не в сети
Регистрация: 25.09.2006
Откуда: П-Камчатский
Mathematic писал(а):
Про батник не очень понимаю что именно требуется? Там же диалог с пользователем, не могу я просто перенаправить вывод в файл

я имел ввиду что бы запустить прогу - она сама оттестила в режимах 250,300...600! и для каждого теста в файл записывала результаты вида: N! , CPU time , GPU time, Accelerate ... т.е. поставил прогу тестить, а сам ушел по своим делам - а потом готовый результат для всех режимов отпостить.

_________________
"...Я смотрю на свое тело,наверно это просто сеть, Я ненавижу его,оно должно умереть..."-гр. 7Раса, | Разгон - это всегда лотерея


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
JOHN_16 Понятно, попробую.

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
Выложил новую версию 0.1.1

Что нового:
- добавлен cudart.dll
- добавлен индикатор прогресса вычисления как на CPU так и на GPU.
- расчитанный факториал числа N сохраняется в файл с именем "factorial_N.hex"

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.


 

Member
Статус: Не в сети
Регистрация: 19.10.2008
В профиле:
250000| CPU time = 248880 ms, GPU time = 24043 ms, Acceleration = x10.4

Вопрос: Почему есть небольшая странность, что при размерности расчетов до 500 коэффициент ускорения больше 1. А после 500 замедление работы ГПУ в сравнении с CPU аж в 40 раз?? И ситуация исправляется, то есть коэффициент становится больше единицы в ускорение после 6000?

_________________
Core i3 2120/Deepcool Gamma Blade @FAN off/Gigabyte GA-P75-D3/4x2Gb Samsung ori/MSI N450GTS-MD1GD5/Palit GT440 MD1GD3 LP passive


 

Member
Статус: Не в сети
Регистрация: 17.10.2005
Mathematic
Цитата:
А я дождался, но когда дошло до расчёта на GPU вылезли ошибки - не хватило памяти видеокарты(у меня 512mb). Память там используется хорошо

ну, 16мегов для 1000000! разве это много? :) даже если прикинуть, то длина 1M! - 5565709 знаков, при длине числа 3 знака нужен массив из ~2млн лонг-чисел = 2*4=8мбайт.
считаю уже час наверно 1M!, 89% выполнено. Прогресс, кстати, нелинейный выходит.

(1)player
при малых вычислениях много времени теряется на копирование данных (относительно времени самых вычислений, которое ->0). я думаю из-за этого.


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
Выложил новую версию 0.1.2

Что нового:
- добавлен вывод информации о частоте шэйдерного домена,
- исправлен баг: ошибка расчета 537! на GPU,
- изменился формат вывода длительностей вычислений на XXh XXm XX.XXXs,
например '03m 23.147s' вместо '203146.89765 <ms>'.

(1)player писал(а):
Вопрос: Почему есть небольшая странность, что при размерности расчетов до 500 коэффициент ускорения больше 1. А после 500 замедление работы ГПУ в сравнении с CPU аж в 40 раз?? И ситуация исправляется, то есть коэффициент становится больше единицы в ускорение после 6000?


Текущий алгоритм таков: если быть точным, при расчёте до 536! включительно видеокарточка не задействуется, т.к. особо параллелить нечего, поэтому скорости примерно одинаковы, далее расчёты начинаются на GPU, но, т.к. много времени уходит на загрузку данных на GPU, её дальнейшее обратное копирование, то происходит падение производительности, далее в зависимости от конфигурации при увеличении расчитываемого факториала расчёт c использованием GPU начинает выполняться быстрее чем на CPU, у меня например с примерно 5000! Delin правильно предположил.

Delin писал(а):
ну, 16мегов для 1000000! разве это много?даже если прикинуть, то длина 1M! - 5565709 знаков, при длине числа 3 знака нужен массив из ~2млн лонг-чисел = 2*4=8мбайт.


При чем здесь сколько памяти занимает сам 1000000!, при расчётах памяти используется гораздо больше, в текущей версии алгоритма примерно в 128 раз больше, иначе не распараллелить, елси считать последоватлеьно, то пожалуйста - будет памяти мало кушать, а работать очень медленно.

Delin писал(а):
считаю уже час наверно 1M!, 89% выполнено. Прогресс, кстати, нелинейный выходит.


А разве кто-то обещал что он будет точным? См. history.txt из дистрибутива. Поясняю, прогресс 89% при расчёте 1000000 говорит о том что уже 1000000*89% = 890000 первых чисел перемножились, осталось этот результат умножить ещё на 1000000*11% = 110000 чисел, очевидно, что более поздние умножения гораздо более трудоёмки т.к. накопленное значение велико(чем дальше в лес тем толще партизаны).

Добавлено спустя 7 минут, 7 секунд
Мой последний результат:

v0.1.0

Core 2 Duo E7200 @ 4.3 GHz = 450x9.5
Dual Channel DDR2 @ 1080 MHz 5-5-5-13
GeForce 9600 GT @ 2.1 GHz ShaderClock, 2.0 GHz MemoryClock

#77


 

Junior
Статус: Не в сети
Регистрация: 10.04.2009
Откуда: Новосибирск
Привет.
Классная прога.
А не думал её за opensource и в svn выложить....
Сделали бы толпой классный бенчмарк.....прикрутили бы туда и для ати .....


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 288 • Страница 1 из 151  2  3  4  5 ... 15  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan