Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 288 • Страница 6 из 15<  1 ... 3  4  5  6  7  8  9 ... 15  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 
Прилепленное (важное) сообщение

Member
Статус: Не в сети
Регистрация: 14.08.2008
Сделал бенч, выложил, вот ссылка http://total-oc.ru/download.php?id=101

Резервная ссылка[персональная страница на оверах] http://people.overclockers.ru/Mathematic/files

Текущая версия 0.4.1, графический интерфейс на С#, так что потребуется .NETFramework. (Присутствует по умолчанию начиная с Win XP SP2)
Рекомендуется использовать драйвера 25Х.ХХ.

Программа считает факториал в 16-ричном виде, может делать это используя CPU, либо с расчётом особо тяжеловесных операций на GPU.

Сравнивает полученные скорости и расчитывает получившееся ускорение расчета.

Некоторые нововведения:

Начиная с версии 0.4.0 введена полная поддержка мульти GPU систем, в том числе гетерогенных(например комбинация 9800 GT и GTX 295).

Начиная с версии 0.3.0 введена полная поддержка многоядерных CPU, и симметричных многопроцессорных систем(например по состоянию на 2010.01.31 мировой рекорд на CPU принадлежал системе основанной на четырёх четырёхядерных процессорах Xeon).

Кому интересно и есть желание прогнать, прошу выкладывать сюда результаты в таком виде:

v0.4.0

CPU: Intel Core 2 Duo E7200 @ 400x7 = 2.8 GHz,
MEM: Dual Channel DDR2 800 MHz (4-4-4-12)

GPU: GeForce 9600 GT(64SP,512Mb) @ 2000 MHz Shader Clock, 2000 MHz Memory Clock

WinXP SP2, GeForce 195.21

250000! CPU time = 22.146 s, GPU time = 18.547 s, Acceleration = x1.3

Т.е. сначала версия программы, затем инфа по CPU и GPU, ОС, драйвер, затем получившиеся попугаи.

Пожалуйста не пишите "на профильной машине", т.к. я просто сохраняю страницу форума с вашими результатами, очень неудобно по каждому пользователю смотреть профиль.

Возможно для работы этой штуки понадобится устанавливать драйвер NVIDIA PhysX, если драйвер GeForce старой версии.

Работать должно на всех видюхах начиная с 8-й серии GeForce начиная с 8400 GS для десктопных карт, 8400 M GT - в мобильной линейке и возможно даже на интегрированных видео начиная с 8100.

Сравнительная гистограмма некоторых результатов:

#77

Будет изредка дополняться новыми результатами и заменяться результатами на свежих версиях.


Последний раз редактировалось Mathematic 05.09.2010 18:38, всего редактировалось 24 раз(а).


Партнер
 

Member
Статус: Не в сети
Регистрация: 04.12.2005
Откуда: Е-бург
Фото: 0
#77
e6750@3200 и 8800GT в стоке, на SLI эта штука никак не отриагировала :)

_________________
there's no greater power than the power off ©


 

Member
Статус: Не в сети
Регистрация: 17.03.2009
Результаты мои говорю слабенькие по отношению к другим :(


 

Member
Статус: Не в сети
Регистрация: 03.05.2008
Откуда: Первоуральск
v0.3.1
это при 2 потоках

DualCore Intel Core 2 Duo E8400, 3766 MHz (9 x 418)
MEM: Dual Channel DDR2 1112 MHz (5-5-5-15)

GPU: ASUS ENGTX260 TOP/HTDP/896M @ 1404 MHz Shader Clock, 2304 MHz Memory Clock

250000 CPU time = 19.125 s, GPU time = 5.963 s, Acceleration = x3.3
300000 CPU time = 28.472 s, GPU time = 8.720 s, Acceleration = x3.3
400000 CPU time = 53.746 s, GPU time = 16.152 s, Acceleration = x3.4
500000 CPU time = 1m 26.551 s, GPU time = 26.134 s, Acceleration = x3.4

_________________
Все получится.


 

Member
Статус: Не в сети
Регистрация: 31.03.2007
Откуда: рукав Ориона
Было на первой версии:
X2 5200 @ 3058 MHz
9800GT 601/1512/1800
MEM Dual Channel 5-5-5-18-1T
250000! CPU 6m20.127s
GPU 20.124
ACCELERATION x18.9

Стало на 0.3.0:
250000!
2 threads CPU 38.163 s
GPU 20.383 s

Таким образом, для меня смысл в технологии CUDA уменьшился ровно в 10 раз:)

_________________
Любой Гондор со временем превращается в Гондурас (эльфийская пословица).


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
Kibershaman я проводил оптимизации только на CPU, до GPU очередь тоже дойдёт.

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.


 

Member
Статус: Не в сети
Регистрация: 19.10.2008
Mathematic
Как и просили:
AMD Athlon x2 7750BE
CPU 3 GHz
NB 2.2GHz
DDR2 667MHz (5-5-5-15) 1Gb x 3 unganged
Video XFX GTX260 (GX-260X-ADJF) 216 sp (nominal)
#77
Атлоны тоже могут побороться в этом бенчмарке. Как мне кажется, что в этом тесте немаловажно стабильность и скорость работы с памятью...


 

Member
Статус: Не в сети
Регистрация: 04.01.2008
Откуда: Самара
комп в профиле, проц на 3.1 ггц
результаты на версии 0.3.1
при 250000
цпу 4потока 11.627с
гпу 17.470с
итого 0.7х
при 500000
цпу 4потока 55.787с
гпу 1м18.693с
итого0.8х
при 750000
цпу 4потока 2м32.650с
гпу 0.023с
итого 6814х
это нормально?

_________________
Мыши кололись, плевались, но продолжали жрать кактус... (с)


 

Member
Статус: Не в сети
Регистрация: 19.10.2008
int21h Это говорит о том, что для ГПУ алгоритм не оптимизирован.

_________________
Core i3 2120/Deepcool Gamma Blade @FAN off/Gigabyte GA-P75-D3/4x2Gb Samsung ori/MSI N450GTS-MD1GD5/Palit GT440 MD1GD3 LP passive


 

Member
Статус: Не в сети
Регистрация: 04.01.2008
Откуда: Самара
(1)player или вобще некорректно работает, т.к. 500тыс считается на гпу за 78.693с, а 750тыс за 0.023с

_________________
Мыши кололись, плевались, но продолжали жрать кактус... (с)


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
ALL Я вспомнил, почему могут быть проблемы при расчёте 750К.

750К - это как раз то самое пороговое значение при котором 512Мб памяти на видяхе уже может не хватить. Проверьте - если у вас 512 МБ оперативы и 700К считается, значет дело в этом, а вообще по-хорошему нужна проверка ошибок, которая скоро будет сделана.

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.


 

Member
Статус: Не в сети
Регистрация: 19.10.2008
Mathematic
Согласен, это нехватка памяти, потому как на моей (почти 900 Метрововой) 750 тыс считает 1 м. 8 сек , 1000000 за 2 м. 16 сек, а вот 1500000 уже за 0.016 сек.
Как я понял, для моего объема памяти предел 1375000 знаков, при 1400000 уже зависание расчетов, при 1425000 счет за 0.0хх сек.

_________________
Core i3 2120/Deepcool Gamma Blade @FAN off/Gigabyte GA-P75-D3/4x2Gb Samsung ori/MSI N450GTS-MD1GD5/Palit GT440 MD1GD3 LP passive


 

Member
Статус: Не в сети
Регистрация: 07.05.2008
Откуда: Откуда и все
Цитата:
Core2Duo E8200 2667@3608
Gigabyte GA-P35-DS3L
2x1Gb G Skill F2-8500CL5-1GBPK 5-5-5-15
1128 Perf.Level 7
Leadtek WinFast PX8800 GT 512MB 770-1728-908 (35-40-25-10-10-5-5) VID:1.12,1.17,1.22,1.27
ST3250823AS (232 Гб)
NEC DVD_RW ND-4570A
Enermax MODU 82+ 425


#77

#77

#77

_________________
Fortuna non penis, in manus non recepi.


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
Последняя версия 0.3.2 - http://total-oc.com/download.php?id=101

Подробности о нововведениях:

http://total-oc.com/soft-news.php?id=804

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.


 

Junior
Статус: Не в сети
Регистрация: 10.06.2008
Mathematic можешь залить на "персональную страницу"? Твой сайт что-то не открывается сейчас.

Код:
ping total-oc.com

Обмен пакетами с total-oc.com [88.84.152.148] с 32 байтами данных:
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Ответ от 89.202.113.22: Заданный узел недоступен.
Ответ от 89.202.113.22: Заданный узел недоступен.

Статистика Ping для 88.84.152.148:
    Пакетов: отправлено = 4, получено = 2, потеряно = 2
    (50% потерь)


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
Ссылка на последнюю версию 0.3.2 на персональной странице:

http://cp.people.overclockers.ru/cgi-bi ... torial.zip

Информация по нововведениям прилагается(внутри архива).


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
Вышла новая версия 0.3.3

http://www.total-oc.ru/soft-news.php?id=797

Ссылки на последнюю версию

http://total-oc.ru/download.php?id=101

http://people.overclockers.ru/Mathematic/files

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
обновил гистограмму

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.


 

Member
Статус: Не в сети
Регистрация: 06.03.2008
Откуда: Краснодар
Фото: 13
Сначала о результатах.

CUDA Factorial Benchmark ver. 0.3.3
Intel Core 2 Quad Q9550@3910 MHz (460*8.5)
MSI P35 Neo2-FR; ver. 1.2; BIOS Ver 1.10; PCI-E Freqency - 140 MHz
MSI GTX260; 192sp; 65nm; 783/1566/2430
Hynix DDR2 2*2Gb PC6400 920 MHz 6-6-6-15 2T
Maxtor 2*160Gb (non RAID) 8Mb Chache
AcBel Intellegent 560 - 510W
Force Ware 190.38
Windows Vista Ultimate x32 SP2
RivaTuner 2.24
EVGA GVT 1.0 + unlocked patch

Результаты:

50 000:
CPU: 0.322s
GPU: 0.310s


#77

100 000:
CPU: 1.297s
GPU: 0.991s


#77

200 000:
CPU: 5.632s
GPU: 3.977s


#77

250 000:
CPU: 9.025s
GPU: 6.325s


#77

500 000:
CPU: 40.349s
GPU: 27.344s


#77

750 000:
CPU: 1m 39.856s
GPU: 1m 4.850s


#77


Теперь критика:
1) Разница между 200 000 и 250 000 почти в 2 раза. Как так может быть??
2) GPU считает почти так же как и 4-х ядерник, тоесть разница невелика.
3) Если расчитать один и тот же результат пару раз, то он в достаточной степени разный.
4) Прога вообще отличная, но немного недоработаная. Mathematic, желаю удачи в твоих разработках, надеюсь прога в ближайшее время начнёт функционировать на все 100!! :)))

_________________
i9 10900k@4900 (Liquid Metal) / MSI Z490 GP / MSI RTX4070 Super / HyperX 32GB DDR4@4000 / CPU+GPU Custom Water Cooling / Lian Li O11D Evo XL + EDGE 850W


 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 05.01.2009
Откуда: France
Mathematic
Сделай, пожалуйста, под 16 потоков или более.
Хочу попробовать какие результаты на серверах получатся.
Четыре четырёхядерных Xeon 2.13ГГц считают 250000 за 5,997s. А ещё есть из 16 штук - хотелось бы на этом попробовать. :oops:
Заранее благодарен!


 

Member
Статус: Не в сети
Регистрация: 14.08.2008
PSA_OC
PSA_OC писал(а):
Сделай, пожалуйста, под 16 потоков или более.

В этом нет необходимости, Вам достаточно руками написать "16 threads" и всё прекрасно заработает, более того, даже "128 threads" отработает прекрасно. Причем это было начиная с первой версии в которой появилась функция multiCPU - v0.3.0, так что сервера без проблем могут быть по максимому загружены.

PSA_OC писал(а):
Четыре четырёхядерных Xeon 2.13ГГц считают 250000 за 5,997s. А ещё есть из 16 штук - хотелось бы на этом попробовать. Заранее благодарен!


С Вас пожалуйста скриншоты результатов прогонов на таких конфигурациях!
Взаимно, заранее спасибо !

Добавлено спустя 4 минуты 56 секунд:
{~Шок~}

Отпишусь позже.

_________________
Разработчик бенчмарка CUDA Factorial Benchmark.


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 288 • Страница 6 из 15<  1 ... 3  4  5  6  7  8  9 ... 15  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 11


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan