Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 90 • Страница 2 из 5<  1  2  3  4  5  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 23.01.2008
Откуда: Отовсюду
bi6a
Вот прогончик:
Warning: test must be run on CPU with 512kb L2 cache minimum for correct results
in DataInCache subtests

Processor: Intel(R) Core(TM)2 Quad CPU Q9505 @ 2.83GHz

SSE found
SSE2 found
SSE4 found

Press any key to start or Esc to exit...

DataInMem:
4x3 matrices by vecs through x87: 11060 milliseconds
4x3 matrices by vecs through SSE: 4305 milliseconds
4x3 matrices by vecs through SSE4: 4291 milliseconds
Normalize vecs through x87: 5444 milliseconds
Normalize vecs through SSE: 2528 milliseconds
Normalize vecs approximate through SSE: 2153 milliseconds
4x3 matrices by 4x3 matrices through x87: 3027 milliseconds
4x3 matrices by 4x3 matrices through SSE2: 2824 milliseconds
sorting floats: 11794 milliseconds

DataInCache:
4x3 matrices by vecs through x87: 6942 milliseconds
4x3 matrices by vecs through SSE: 1919 milliseconds
4x3 matrices by vecs through SSE4: 1654 milliseconds
Normalize vecs through x87: 4321 milliseconds
Normalize vecs through SSE: 1857 milliseconds
Normalize vecs approximate through SSE: 1045 milliseconds
4x3 matrices by 4x3 matrices through x87: 4992 milliseconds
4x3 matrices by 4x3 matrices through SSE2: 1342 milliseconds
sorting floats: 5757 milliseconds

_________________
-I count six shots, nigger
-I count two guns, nigger



Партнер
 

Member
Статус: Не в сети
Регистрация: 19.01.2011
Ноутбучный i5-2430M для статистики :D
#77

_________________
i5-8400 / Gigabyte Z370P D3 / 16 Gb DDR4 / Zalman CNPS10X Performa+ / Palit GTX 1080 GameRock / Chieftec GPS-700A8 / 120 Gb SSD / 27" FHD


 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 19.02.2012
#77
2500к 4.8ггц

_________________
2500K@5280mhz,12Gb@2300mhz 7-10-7-27,Corsair H100,GA-Z68X-UD4,OCZ Vertex 3 60gb,EAH6970 DCII 2048Mb@ 980\5980 1.225v,Corsair 600T
Xbox 360


 

Member
Статус: Не в сети
Регистрация: 17.02.2008
Фото: 0
Darth_Maul_x3 писал(а):
старым коркам нужен тонкий тюнинг памяти, в правильных руках старые корки еще огого :gun:[/off]

как мертвому припарки с таким северником и устаревшей архитектурой (склейка)
второй тест, 4.7
Warning: test must be run on CPU with 512kb L2 cache minimum for correct results
in DataInCache subtests

Processor: Intel(R) Core(TM) i5-2500K CPU @ 3.30GHz

SSE found
SSE2 found
SSE4 found

Press any key to start or Esc to exit...

DataInMem:
4x3 matrices by vecs through x87: 2496 milliseconds
4x3 matrices by vecs through SSE: 1919 milliseconds
4x3 matrices by vecs through SSE4: 1919 milliseconds
Normalize vecs through x87: 4009 milliseconds
Normalize vecs through SSE: 2574 milliseconds
Normalize vecs approximate through SSE: 998 milliseconds
4x3 matrices by 4x3 matrices through x87: 1404 milliseconds
4x3 matrices by 4x3 matrices through SSE2: 686 milliseconds
sorting floats: 10093 milliseconds

DataInCache:
4x3 matrices by vecs through x87: 1529 milliseconds
4x3 matrices by vecs through SSE: 1186 milliseconds
4x3 matrices by vecs through SSE4: 1185 milliseconds
Normalize vecs through x87: 3292 milliseconds
Normalize vecs through SSE: 2121 milliseconds
Normalize vecs approximate through SSE: 796 milliseconds
4x3 matrices by 4x3 matrices through x87: 2683 milliseconds
4x3 matrices by 4x3 matrices through SSE2: 967 milliseconds
sorting floats: 5070 milliseconds

Press any key to exit..


 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 23.01.2008
Откуда: Отовсюду
wertmur писал(а):
как мертвому припарки с таким северником и устаревшей архитектурой (склейка)

Давайте не будем рассказывать, как круто получить +2fps и 400 попугвйчиков в марке11, вбросив деньгу в сенди. Припарка мёртвому - брать i5 при наличии нормального йорика, просто невыгодная тема. Для обыденных задач - где самое тяжёлое - поиграть, хватает с головою.

_________________
-I count six shots, nigger
-I count two guns, nigger


 

Member
Статус: Не в сети
Регистрация: 17.02.2008
Фото: 0
Darth_Maul_x3
твоему процу i3 бы догнать, не говоря о чем-то более серьезном :facepalm:


 

Member
Статус: Не в сети
Регистрация: 06.11.2007
Фото: 9
math3d.exe - типичный пример как пишутся игры и тестовые пакеты =) вроде и поддерживает расширенные наборы инструкций, но почему то на буле результат ссе4 хуже результата ссе2 фактически в 2 раза :D наверное потому, что используется generic code path с mmx или вобще х87 а человек ведь парился, преобразования матриц кодил, вектора, сортировку массива забабахал, а в итоге тест дает не понятно что... между моим тестом и этим тестом, не смотря на то, что последний можно сказать профессиональный, просто пропасть, а все потому что передо мной стояла цель заставить делать одно и то же разными процессорами при помощи того набора команд, который он поддерживает, а потом уже только написать тест, а у этого теста похоже цель - тест ради теста *)

зы простите, никого не хотел обидеть, если что...


 

Member
Статус: Не в сети
Регистрация: 01.12.2007
Откуда: В.Новгород53рус
Sulphide ну так человек ток первую и единственную версию выпустил в 2008г.под вульфика пытался заточить.завалялась у меня на винте.кстати,сравни свой авторазгон множителем и норм разгон по шине+разгон нб?отключи в биос в разделе питания функцию APM и еще разок пройди тест.

Добавлено спустя 11 минут 22 секунды:
Sulphide писал(а):
а у этого теста похоже цель - тест ради теста

он так и писал-буду точить под интел,амд не интересует.

_________________
"х264 под AMD заточен".@Trump
"Получается ниша Intel Celeron G1610 определена-высокопроизводительная рабочая система".@Kost Troll


 

Member
Статус: Не в сети
Регистрация: 28.04.2004
Откуда: Россия, Орен
Фото: 0
Второй тест, X6@3.9Ghz, NB2600, Mem 1740
#77

_________________
RagePro>2MX>Rage128 Pro>4MX>4Ti4200>X1950Pro>HD4850>HD4870CF>560Ti>570>570SLI>R9-290X>980Ti>1080Ti>RX6750GRE


 

Member
Статус: Не в сети
Регистрация: 06.11.2007
Фото: 9
Усложнил тест, добавил отсечение дробной части и логарифм, исправил ошибки страшные (видимо был пьян когда писал :D), результаты с первым тестом не равны! хотя и первый тест отражал соответствие процессоров правильно.
Новый тест здесь: http://ubuntuone.com/40xbwEDGJtbm6e53VCDIcK

v2.0
Running 100 million iterations of modf() floor() sin()*cos() log()
Using single thread.
Please wait..

AVX, PCLMUL and AES instructions set supported.

Note: max CPU code path is SSE4.2

First run:
Time in ms: 5913
Control value 1: 2.76632
Control value 2: -0.341019

Second run:
Time in ms: 5959
Control value 1: 2.76632
Control value 2: -0.341019

Press any key to exit...


 

Member
Статус: Не в сети
Регистрация: 01.12.2007
Откуда: В.Новгород53рус
Sulphide когда до х86 руки дойдут?моим советом воспользовался,насчет отключения APM(advanced power managment)?

_________________
"х264 под AMD заточен".@Trump
"Получается ниша Intel Celeron G1610 определена-высокопроизводительная рабочая система".@Kost Troll


 

Member
Статус: Не в сети
Регистрация: 06.11.2007
Фото: 9
32 bit версия, кому интересно.

почему х32 версия медленнее:
в х32 конвенция вызовов процедур подразумевает передачу параметров через стек, а это значит что больше записи в память и чтения из памяти. в х64, первые параметры передаются через регистры. большинство процедур используют до четырех параметров и все они передаются через регистры.


Последний раз редактировалось Sulphide 06.03.2012 23:00, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 20.11.2006
Откуда: не от мира сего
Pavelbel писал(а):
i7-950@4000
1- 3276
2- 3261

ку9650 4000 - 2964.. оба прохода :) первая версия теста
5242-5288 вторая версия теста.


 

Member
Статус: Не в сети
Регистрация: 06.11.2007
Фото: 9
bi6a писал(а):
Sulphide когда до х86 руки дойдут?моим советом воспользовался,насчет отключения APM(advanced power managment)?

с АРМ еще не игрался... завтра уже))


 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 23.01.2008
Откуда: Отовсюду
Тест v2. Жду очередного тролля
Running 100 million iterations of modf() floor() sin()*cos() log()
Using single thread.
Please wait..

SSE4.1 instructions set supported.

Note: max CPU code path is SSE4.2

First run:
Time in ms: 5054
Control value 1: 2.76632
Control value 2: -0.341019

Second run:
Time in ms: 5070
Control value 1: 2.76632
Control value 2: -0.341019

_________________
-I count six shots, nigger
-I count two guns, nigger


 

Member
Статус: Не в сети
Регистрация: 06.11.2007
Фото: 9
Пока получается следующее:
Почти весь тест состоит из потока SIMD инструкций.

Функции получающие ускорение:
floor - sse4.1 версия всего 4 комманды, версия для SSE3 где то раз в 15-20 больше.
sin/cos - sse4.1 и меньше
log - sse3 версия и меньше
modf - sse3 и меньше

c AVX я перемудрил, поддержка есть, но результаты хуже, AVX использует 256 бит регистры, поэтому медленнее.
завтра, попытаюсь добавить функции использующие AVX.


 

Member
Статус: Не в сети
Регистрация: 22.12.2007
Q9450 @3.66 GHz

v2.0
Running 100 million iterations of modf() floor() sin()*cos() log()
Using single thread.
Please wait..

SSE4.1 instructions set supported.

Note: max CPU code path is SSE4.2

First run:
Time in ms: 5819
Control value 1: 2.76632
Control value 2: -0.341019

Second run:
Time in ms: 5896
Control value 1: 2.76632
Control value 2: -0.341019

Press any key to exit...


 

Member
Статус: Не в сети
Регистрация: 28.10.2007
Откуда: Ижевск (АК-47)
Фото: 34
для буле-водов 2ой тест c поддержкой AVX+FMA4+XOP(Win64):
http://www.2shared.com/file/DYiEQtE6/xe2_fma4.html
пробуйте.

зы. мат. библиотека последняя от AMD(amdlibm 3.0.2 от 29.02.2012).

_________________
MythBuster (с) HertZ


 

Member
Статус: Не в сети
Регистрация: 01.12.2007
Откуда: В.Новгород53рус
xxl_izh писал(а):
пробуйте.

а сам почему не выложил результат?

_________________
"х264 под AMD заточен".@Trump
"Получается ниша Intel Celeron G1610 определена-высокопроизводительная рабочая система".@Kost Troll


 

Member
Статус: Не в сети
Регистрация: 28.10.2007
Откуда: Ижевск (АК-47)
Фото: 34
bi6a
FX 8120 4.0GHz(Stock Turbo)
v2.0
Running 100 million iterations of modf() floor() sin()*cos() log()
Using single thread.
Please wait..

Note: max CPU code path is AVX/XOP/FMA4

First run:
Time in ms: 3385
Control value 1: 2.76632
Control value 2: -0.341019

Second run:
Time in ms: 3370
Control value 1: 2.76632
Control value 2: -0.341019

Press any key to exit...

_________________
MythBuster (с) HertZ


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 90 • Страница 2 из 5<  1  2  3  4  5  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 81


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan