[CUDA Factorial Benchmark] Бенч, расчитывающий факториал, используя мощности GPU от NVIDIA(технология CUDA)

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 17.04.2024 23:52

Сообщения без ответов | Активные темы

Список форумов » Специализированные форумы » Бенчмаркинг

Часовой пояс: UTC + 3 часа

Новая тема /

Ответить

Сообщений: 286 • Страница 2 из 15 • < 1 2 3 4 5 ... 15 >

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Mathematic

Добавлено: 16.04.2009 8:17

[профиль]

Member
Статус: Не в сети
Регистрация: 14.08.2008

Сделал бенч, выложил, вот ссылка http://total-oc.ru/download.php?id=101

Резервная ссылка[персональная страница на оверах] http://people.overclockers.ru/Mathematic/files

Текущая версия 0.4.1, графический интерфейс на С#, так что потребуется .NETFramework. (Присутствует по умолчанию начиная с Win XP SP2)
Рекомендуется использовать драйвера 25Х.ХХ.

Программа считает факториал в 16-ричном виде, может делать это используя CPU, либо с расчётом особо тяжеловесных операций на GPU.

Сравнивает полученные скорости и расчитывает получившееся ускорение расчета.

Некоторые нововведения:

Начиная с версии 0.4.0 введена полная поддержка мульти GPU систем, в том числе гетерогенных(например комбинация 9800 GT и GTX 295).

Начиная с версии 0.3.0 введена полная поддержка многоядерных CPU, и симметричных многопроцессорных систем(например по состоянию на 2010.01.31 мировой рекорд на CPU принадлежал системе основанной на четырёх четырёхядерных процессорах Xeon).

Кому интересно и есть желание прогнать, прошу выкладывать сюда результаты в таком виде:

v0.4.0

CPU: Intel Core 2 Duo E7200 @ 400x7 = 2.8 GHz,
MEM: Dual Channel DDR2 800 MHz (4-4-4-12)

GPU: GeForce 9600 GT(64SP,512Mb) @ 2000 MHz Shader Clock, 2000 MHz Memory Clock

WinXP SP2, GeForce 195.21

250000! CPU time = 22.146 s, GPU time = 18.547 s, Acceleration = x1.3

Т.е. сначала версия программы, затем инфа по CPU и GPU, ОС, драйвер, затем получившиеся попугаи.

Пожалуйста не пишите "на профильной машине", т.к. я просто сохраняю страницу форума с вашими результатами, очень неудобно по каждому пользователю смотреть профиль.

Возможно для работы этой штуки понадобится устанавливать драйвер NVIDIA PhysX, если драйвер GeForce старой версии.

Работать должно на всех видюхах начиная с 8-й серии GeForce начиная с 8400 GS для десктопных карт, 8400 M GT - в мобильной линейке и возможно даже на интегрированных видео начиная с 8100.

Сравнительная гистограмма некоторых результатов:

#77

Будет изредка дополняться новыми результатами и заменяться результатами на свежих версиях.

Последний раз редактировалось Mathematic 05.09.2010 18:38, всего редактировалось 24 раз(а).

Реклама
Партнер

Mathematic

Добавлено: 20.04.2009 11:00

[профиль]

Member
Статус: Не в сети
Регистрация: 14.08.2008

LORiOchar писал(а):

Классная прога.

спасибо

LORiOchar писал(а):

А не думал её за opensource и в svn выложить....Сделали бы толпой классный бенчмарк.....прикрутили бы туда и для ати .....

Честно говоря, не хочется, всё таки это интеллектуальная собственность. Цели сделать классный бенчмарк нет, но по крайней мере в планах графический интерфейс, задействование нескольких ядер CPU, сделать режим GPU+CPU. Поддержку карт ати тоже можно устроить, всего-то надо купить затычку 4000 серии, чтобы отлаживать

А что мешает вашей толпе сейчас взять и сделать классный бенчмарк на эту тему ?

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.

LORiOchar

Добавлено: 20.04.2009 11:19

[профиль]

Junior
Статус: Не в сети
Регистрация: 10.04.2009
Откуда: Новосибирск

собранность и время)
а так бы можно народ(студентов) привлеч , студентов из лабы intel-НГУ

Если хочешь можно разделить ветки, отдельно бенчмарк свободный, отдельно то что у тебя в Интеллек собственности.

Mathematic

Добавлено: 20.04.2009 11:25

[профиль]

Member
Статус: Не в сети
Регистрация: 14.08.2008

LORiOchar писал(а):

Если хочешь можно разделить ветки, отдельно бенчмарк свободный, отдельно то что у тебя в Интеллек собственности.

У меня в интеллектуальной собственности собственно сам алгоритм расчёта на GPU, так что отделить можно максимум расчет на CPU, а он настолько прост, что даже нет смысла его отделять, его любой второкурсник факультета по направлению ИТ сделает.

LORiOchar

Добавлено: 20.04.2009 11:49

[профиль]

Junior
Статус: Не в сети
Регистрация: 10.04.2009
Откуда: Новосибирск

давай в аське?
244174900

Mathematic

Добавлено: 20.04.2009 12:21

[профиль]

Member
Статус: Не в сети
Регистрация: 14.08.2008

LORiOchar сейчас времени нет, давай вечером часов в 11...

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.

Fraunhofer

Добавлено: 20.04.2009 12:23

[профиль]

Member
Статус: Не в сети
Регистрация: 05.01.2008

LORiOchar
Боже мой. Как люди любят халяву... Тебе нужен классный бенчмарк? Садись и пиши его или собирай толпу, как ты говоришь. Что ты к человеку пристал?

_________________
Человеческая глупость даёт представление о бесконечности.

LORiOchar

Добавлено: 20.04.2009 12:25

[профиль]

Junior
Статус: Не в сети
Регистрация: 10.04.2009
Откуда: Новосибирск

я не на халяву.....

я про грамотно построенный процесс, и студентов научить чему-нибудь полезному, а не тупые лабы писать!!!

когда есть идея и цель тогда и легче учиться и пишется...

Megagad

Добавлено: 20.04.2009 12:31

[профиль]

Member

Статус: Не в сети
Регистрация: 16.11.2007
Откуда: Крым, Земля!

LORiOchar Мне интересно - а как вы "КУДА" собрались на АМД(АТИ) запускать??? Или там своё чтото будет?

_________________
Хочешь сделать людям хорошо — сделай плохо, а потом верни, как было.
Hi Jack - Hi! Hijack - Hi!
Broni всех стран объединяйтесь!

LORiOchar

Добавлено: 20.04.2009 12:34

[профиль]

Junior
Статус: Не в сети
Регистрация: 10.04.2009
Откуда: Новосибирск

модуль ДЛЯ куда, модуль ати, модуль лараби, модуль для процов

ATI.HeNRy

Добавлено: 21.04.2009 14:17

[профиль]

Member
Статус: Не в сети
Регистрация: 23.07.2007

Mathematic молодец, но вот есть не большое замечание тебе надо немного подумать как оптимизировать процесс вычисления. на maple которой не блещет скоростью расчетов делает 600000! за 2 секунды (core 2 duo e4300 в номинале) обновляй постепенно версию.
зы:

Mathematic писал(а):

мне кажется на бейсике факториал в 9 классе делали а на 1 м курсе sin; cos через ряд тейлора считали с заданой точностью.

Mathematic

Добавлено: 21.04.2009 21:34

[профиль]

Member
Статус: Не в сети
Регистрация: 14.08.2008

ATI.HeNRy Мне честно говоря не интересно как там считает мапл, у меня не было цели написать программу которая быстрее всех считает факториал, я использовал самый простой алгоритм для ЦПУ и свой собственный на ГПУ, который распараллеливает вычисления. Главное, что делает бенчмарк - он определяет кто быстрее, а кто медленнее

Не так ли ? Сидеть и до посинения точить расчёт на ассемблере чтобы у меня скорость была быстрее чем у мапла я не собираюсь.
Добавлено спустя 15 минут, 25 секунд

ATI.HeNRy писал(а):

мне кажется на бейсике факториал в 9 классе делали

А ине кажется, что на бейсике в 9-м классе факториал больший чем помещающийся в 64-битное целое не делали

Добавлено спустя 1 час, 34 минуты, 32 секунды
ATI.HeNRy
И вообще может мапл использует заранее подготовленный опорные константы, типа перемноженные первая 1000 чисел, вторая 1000 чисел и тэпэ, и хранит их у себя и использует при необходимости.

Мой же бенч честно умножает начиная с 2*3*4 и так далее.

Сейчас прогнали 600000! на ГТХ 285, получилось 29.92 сек. и честно говоря мне это не кажется медленным, количество операций умножения и сложения в этой задаче большое.
Добавлено спустя 3 минуты, 6 секунд
На Athlon 850, виндозный калькулятор считает 60000! (шестьдесят тысяч) за 3 минуты

и выводит он только первые несколько цифр и потом степень

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.

ATI.HeNRy

Добавлено: 21.04.2009 23:54

[профиль]

Member
Статус: Не в сети
Регистрация: 23.07.2007

Mathematic писал(а):

А ине кажется, что на бейсике в 9-м классе факториал больший чем помещающийся в 64-битное целое не делали

Естественно, я думаю мы даже не знали тогда что такое 64 битное целое.
я тебе не говорю сидеть до посинения и боже упаси делать на ассемблере, ты и так молодец. просто обновляй ,оптимизируй свою версию. Просто преимущество видеокарт может оказаться не от того что они сильнее, а из-за того что

Mathematic писал(а):

я использовал самый простой алгоритм для ЦП и свой собственный на ГПУ, который распараллеливает вычисления.

зы: в моем дипломе мне нужно посчитать около 100000 значений функций бесселя на не оптимизированном коде это заняло бы около 3 часов - это была первая версия программы, после оптимизации она считает около 2 минут.
Добавлено спустя 26 минут, 13 секунд
Mathematic
если дальше будешь развивать свой бенчмарк не зацикливайся только на факториале, есть много других вариантов например SuperPi for gpu или что нибудь подобное, а сама идея очень классная что сказать молодец!!!

Mathematic

Добавлено: 22.04.2009 17:55

[профиль]

Member
Статус: Не в сети
Регистрация: 14.08.2008

ATI.HeNRy
Я прекрасно знаю, что существуют другие более быстрые алгоритмы вычисления, например методом разделяй и властвуй, когда чтобы перемножить два числа, состоящих из двух цифр каждое, экономится одно элементарное умножение,т.е. вместо четырёх используется три. Далее, есть ещё более быстрый метод с использованием быстрого преобразования фурье. Но эти методы(особенно последний) сами по себе уже настолько сложны в реализации даже на CPU, что делать их ещё и под GPU будет крайне трудоёмко, в силу специфичности программирования последнего.

Моя же цель, как я говорил уже, корректно сравнивать производительность CPU и GPU. Вот я взял единый базовый простой метод - перемножение всех чисел от 1 до N, и сделал его реализацию на CPU и на GPU, таким образом хоть алгоритмы для CPU и GPU у меня разные, метод лежащий в их основе один. А именно это и дает возможность адекватно сравнивать скорости работы на CPU и GPU. Так что считаю мою цель вполне разумной.

Насчёт расчёта Пи на ГПУ, я уже думал, может руки дойдут когда-нибудь.

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.

Mathematic

Добавлено: 27.04.2009 8:06

[профиль]

Member
Статус: Не в сети
Регистрация: 14.08.2008

Выложил новую версию 0.2.0

Что нового:
- нарисовался графический интерфейс,
- можно выбирать на чем выполнять расчёт.

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.

AzaZeo

Добавлено: 20.05.2009 21:02

[профиль]

Member
Статус: Не в сети
Регистрация: 23.12.2004
Откуда: Беларусь, Минск

AMD Turion TK-55 (x64 1.8Ghz)
8400G mobile
#77
Ждать при 150000 чисел надоедало...

_________________
ASUS A4M88T-M, Athlon II X3 425, 2GB NCP, video - internal ATI 4250, 200GB Samsung HDD, Win7 x64

Mathematic

Добавлено: 21.05.2009 12:21

[профиль]

Member
Статус: Не в сети
Регистрация: 14.08.2008

AzaZeo Установите драйвера посвежее, вша карта не определилась программой - видите надпись "Device Emulation" рядом с галочкой GPU, в этом месте должно быть написано что-то вроде "GeForce 8400G M"

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.

psycontroll

Добавлено: 21.05.2009 16:03

[профиль]

Junior
Статус: Не в сети
Регистрация: 06.06.2008
Откуда: Moscow/Perovo

Processor: Intel(R) Core(TM)2 Quad CPU Q9650 @ 3.00GHz (4 CPUs), ~3.17GHz
Memory: 4094MB RAM Samsung DDR3 1333 DIMM 2Gb
Video Card: XFX NVIDIA GeForce GTX 280
V0.2.0
#77

AzaZeo

Добавлено: 21.05.2009 20:55

[профиль]

Member
Статус: Не в сети
Регистрация: 23.12.2004
Откуда: Беларусь, Минск

Mathematic писал(а):

Установите драйвера посвежее

хм... с сайта нВидии не ставится - говорит, дуй на сайт Асера, и юзай модифицированные ими дрова. А тем дровам уже полтора года минимум...

_________________
ASUS A4M88T-M, Athlon II X3 425, 2GB NCP, video - internal ATI 4250, 200GB Samsung HDD, Win7 x64

ATIUser

Добавлено: 02.06.2009 2:59

[профиль]

Member
Статус: Не в сети
Регистрация: 04.12.2003
Откуда: Israel

http://s52...radikal.ru/i138/0906/26/663da4ce99bd.jpg вот мое результато) системма в профилеюю и карта тож неопределяеться) ну и лан) зато интересно)

_________________
CPU,Video,Sound...Главное хвост!!!:)

xguyver

Добавлено: 02.06.2009 6:06

[профиль]

Member
Статус: Не в сети
Регистрация: 06.11.2003
Откуда: Самара

Mathematic писал(а):

На Athlon 850, виндозный калькулятор считает 60000! (шестьдесят тысяч) за 3 минуты

А в Win7 RC переполнение после 10 сек рассчёта

Новая тема /

Ответить

Сообщений: 286 • Страница 2 из 15 • < 1 2 3 4 5 ... 15 >

Список форумов » Специализированные форумы » Бенчмаркинг

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 33

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:

[CUDA Factorial Benchmark] Бенч, расчитывающий факториал, используя мощности GPU от NVIDIA(технология CUDA)

Кто сейчас на конференции

Лаборатория

Обзор ноутбука ASUS Zenbook DUO (UX8406)

Обзор и тестирование модульного блока питания MSI MAG A850GL PCIE5

Обзор и тестирование процессорного кулера APNX AP1-V

Обзор и тестирование материнской платы MSI Z790 Gaming Plus WIFI

Обзор и тестирование смартфона Honor X9b 5G

Новости