Заблокирован Статус: Не в сети Регистрация: 23.01.2008 Откуда: Отовсюду
wertmur писал(а):
как мертвому припарки с таким северником и устаревшей архитектурой (склейка)
Давайте не будем рассказывать, как круто получить +2fps и 400 попугвйчиков в марке11, вбросив деньгу в сенди. Припарка мёртвому - брать i5 при наличии нормального йорика, просто невыгодная тема. Для обыденных задач - где самое тяжёлое - поиграть, хватает с головою.
_________________ -I count six shots, nigger -I count two guns, nigger
Member
Статус: Не в сети Регистрация: 06.11.2007 Фото: 9
math3d.exe - типичный пример как пишутся игры и тестовые пакеты =) вроде и поддерживает расширенные наборы инструкций, но почему то на буле результат ссе4 хуже результата ссе2 фактически в 2 раза наверное потому, что используется generic code path с mmx или вобще х87 а человек ведь парился, преобразования матриц кодил, вектора, сортировку массива забабахал, а в итоге тест дает не понятно что... между моим тестом и этим тестом, не смотря на то, что последний можно сказать профессиональный, просто пропасть, а все потому что передо мной стояла цель заставить делать одно и то же разными процессорами при помощи того набора команд, который он поддерживает, а потом уже только написать тест, а у этого теста похоже цель - тест ради теста *)
Member
Статус: Не в сети Регистрация: 01.12.2007 Откуда: В.Новгород53рус
Sulphideну так человек ток первую и единственную версию выпустил в 2008г.под вульфика пытался заточить.завалялась у меня на винте.кстати,сравни свой авторазгон множителем и норм разгон по шине+разгон нб?отключи в биос в разделе питания функцию APM и еще разок пройди тест.
Добавлено спустя 11 минут 22 секунды:
Sulphide писал(а):
а у этого теста похоже цель - тест ради теста
он так и писал-буду точить под интел,амд не интересует.
Member
Статус: Не в сети Регистрация: 06.11.2007 Фото: 9
Усложнил тест, добавил отсечение дробной части и логарифм, исправил ошибки страшные (видимо был пьян когда писал ), результаты с первым тестом не равны! хотя и первый тест отражал соответствие процессоров правильно. Новый тест здесь: http://ubuntuone.com/40xbwEDGJtbm6e53VCDIcK
v2.0 Running 100 million iterations of modf() floor() sin()*cos() log() Using single thread. Please wait..
AVX, PCLMUL and AES instructions set supported.
Note: max CPU code path is SSE4.2
First run: Time in ms: 5913 Control value 1: 2.76632 Control value 2: -0.341019
Second run: Time in ms: 5959 Control value 1: 2.76632 Control value 2: -0.341019
почему х32 версия медленнее: в х32 конвенция вызовов процедур подразумевает передачу параметров через стек, а это значит что больше записи в память и чтения из памяти. в х64, первые параметры передаются через регистры. большинство процедур используют до четырех параметров и все они передаются через регистры.
Последний раз редактировалось Sulphide 06.03.2012 23:00, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 06.11.2007 Фото: 9
Пока получается следующее: Почти весь тест состоит из потока SIMD инструкций.
Функции получающие ускорение: floor - sse4.1 версия всего 4 комманды, версия для SSE3 где то раз в 15-20 больше. sin/cos - sse4.1 и меньше log - sse3 версия и меньше modf - sse3 и меньше
c AVX я перемудрил, поддержка есть, но результаты хуже, AVX использует 256 бит регистры, поэтому медленнее. завтра, попытаюсь добавить функции использующие AVX.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 81
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения