Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 2089 • Страница 60 из 105<  1 ... 57  58  59  60  61  62  63 ... 105  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 10.01.2012
LSIchip писал(а):
2 Xeon'a 6-ти ядерных +6 потоков ещё в каждом, т.е. суммарно 24 потока

полный конфиг системы выложы



Партнер
 

Junior
Статус: Не в сети
Регистрация: 12.03.2010
Чипсет Intel® 5520
Процессор Dual Intel® Xeon® X5650 Six-Core (2.66GHz, 12Mb, 6.4 GT/sec) Max. memory speed 1333MHz
Оперативная память 18GB DDR3-1333 ECC REG
Контроллер Adaptec ASR-5805Z 8 port SATA/SAS, RAID 0,1,10,5,6,50, 512Mb
Дисковый массив "2 x 2.5"" 120Gb OCZ Agility 3 [AGT3-25SAT3-120G] (R525/W500MB/s); 2 x 1000GB SATA III hard drive (7200rpm)"


 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 10.01.2012
LSIchip
загрузи последний LinX
http://www.gigaflopd.com/downloads/linx/
должно быть где-то 140 при 24 потоках


 

Junior
Статус: Не в сети
Регистрация: 12.03.2010
ACidos
а как тогда люди на обычных домашних машинках с 8-ю потоками, максимум, добиваются подобных цифр?)) нипанятна


 

Member
Статус: Не в сети
Регистрация: 10.02.2007
Откуда: Москва
LSIchip
у вас кукурузные мигагерцы... а они гонят процессоры до 5ГГц, и память на нормальных частотах, а именно она даёт значительный прирост
p.s. у серверов как бы другие задачи....


 

Member
Статус: Не в сети
Регистрация: 07.02.2011
Откуда: 78rus
ASRock Z68 Extreme3 Gen3
i5-2500K@5.2GHz-1.5v
Samsung Original 2x4GB@1866Mhz 9-9-9-24-1.52v
132ГФлопс
#77


 

Junior
Статус: Не в сети
Регистрация: 12.03.2010
unknown-guest
да оно понятно что серваки для других целей)) просто есть например комп на i5, который больше выдает, но при этом практически любую задачу запусти на серваке, так она в разы быстрее выполняется. я просто полагал, что такое большое кол-во потоков должно себя оправдать в таком тесте, но не тут то было...


 

Member
Статус: Не в сети
Регистрация: 10.02.2007
Откуда: Москва
LSIchip
да кстати у вас устаревшие процессоры без AVX


 

Junior
Статус: Не в сети
Регистрация: 12.03.2010
unknown-guest
разве? вроде их не так давно выпускать то начали.


 

Member
Статус: Не в сети
Регистрация: 10.02.2007
Откуда: Москва
LSIchip писал(а):
разве? вроде их не так давно выпускать то начали.

так прогресс то не стоит на месте)))


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
LSIchip писал(а):
unknown-guest
да оно понятно что серваки для других целей)) просто есть например комп на i5, который больше выдает, но при этом практически любую задачу запусти на серваке, так она в разы быстрее выполняется. я просто полагал, что такое большое кол-во потоков должно себя оправдать в таком тесте, но не тут то было...


Во-первых НТ - полная туфта. Когда софт неоптимизирован и не нагружает физ ядро на 100% - НТ помогает. В случае линпака дополнительный поток наоборот тормозит. Отключи НТ в биосе и увидишь прирост 30-40%.
Во-вторых AVX - дает удвоение по показателям, но в реале нигде не используется. Без AVX кора и7-2600 на 5ГГц выкакивает жалкие 50-60Гфлопсов. Поэтому можно смело делить резалты на 2 для процов с AVX.

Я не знаю ни одной задачи кроме линпака где надо одновременно умножить или сложить 8 чисел. Даже если эти задачи и есть, выйгрышь в 0.1% приложений за счёт AVX можно считать бесполезным.
Ну а сервак есть сервак. кучя памяти + 2 проца..... Возможно ещё приоритет плохо расставлен и фоновые прилоги тупят в бэкграунде.


 

Member
Статус: Не в сети
Регистрация: 31.03.2012
откуда вы взяли цифру 8? из максимального количества операндов?

Цитата:
allows instructions to have more than two operands

это вовсе не то же самое, что "поддерживаются только операции с 8 операндами" :?:


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
PusiX писал(а):
это вовсе не то же самое, что "поддерживаются только операции с 8 операндами" :?:


С двумя ещё и ММХ умела. С 4-мя SSE? c 8-мью - AVX. Максимальный прирост будет на 8-ми числах.


 

Member
Статус: Не в сети
Регистрация: 31.03.2012
Вы немного ошибаетесь. SSE умели операции максимум с 2мя операндами и 16 128-битных регистров, тогда как AVX умеют инструкции с 3мя (и, потенциально, более) операндами и тоже 16 но уже 256-битных регистров (с потенциальным расширением до 1024-битных), с увеличением параллелизации. Это не просто какие-то специфические действия типа сложить за такт 8 чисел - это куда более многообразный прогресс, чем вам кажется.

Добавлено спустя 8 минут 25 секунд:
а, вы о содержимом регистров, понял... ну вообще-то векторы не обязательно 32-битные (4 на старый регистр, 8 на новый), были еще 64-битные (2 на старый регистр, 4 на новый), а теперь вот и поддержка 128-битных (2 на новый регистр). Ну уж никак не 8 на всех операциях - только на 32-битных векторах. Сейчас уже куча сфер куда более эффективного применения векторов выше 32-битных.

Ну и разумеется, пока софт под это дело не оптимизируют - это будет бесполезно. Ну так это всегда так было при старте новых технологий, т.ч. думаю, эффективные реализации на AVX мы скоро увидим.


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
PusiX писал(а):
Это не просто какие-то специфические действия типа сложить за такт 8 чисел - это куда более многообразный прогресс, чем вам кажется.


Поконкретнее можно? на примере операндов с ASM командами. Я к примеру кроме SSE_ADD, SSE_MULT на 4 вектора незнаю. Реализация одинаковая, добавили инструкции, расширили количество векторов и назвали AVX.


 

Member
Статус: Не в сети
Регистрация: 31.03.2012
http://software.intel.com/en-us/article ... -mkl-v103/
80% overall efficiency

Конкретный пример :)

Ладно, если конкретно асмом, то для конкретных данных надо подробно анализировать набор инструкций, а мне откровенно влом. Откройте гугл - уверен, за меня это уже давно проанализировали. Даже тут http://habrahabr.ru/post/99367/

P.S. Я не утверждаю, что AVX - такое супергениальное изобретение интел - очевидно, что это не так, просто банальное расширение всё того же старого sse. Но это уже другая тема. Я говорю лишь, что польза будет заметней куда чаще, чем в "сложить 8 чисел".

Добавлено спустя 7 минут 26 секунд:
самый очевидный пример наверно - банальное вдвое большее распараллеливание каких-либо соотв. операций. Обработка данных, мультимедиа, всякие вычисления типа вот этой матлаб, и тд.тп.


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
PusiX писал(а):
http://software.intel.com/en-us/article ... -mkl-v103/
80% overall efficiency

Конкретный пример :)

Ладно, если конкретно асмом, то для конкретных данных надо подробно анализировать набор инструкций, а мне откровенно влом. Откройте гугл - уверен, за меня это уже давно проанализировали. Даже тут http://habrahabr.ru/post/99367/

P.S. Я не утверждаю, что AVX - такое супергениальное изобретение интел - очевидно, что это не так, просто банальное расширение всё того же старого sse. Но это уже другая тема. Я говорю лишь, что польза будет заметней куда чаще, чем в "сложить 8 чисел".

Добавлено спустя 7 минут 26 секунд:
самый очевидный пример наверно - банальное вдвое большее распараллеливание каких-либо соотв. операций. Обработка данных, мультимедиа, всякие вычисления типа вот этой матлаб, и тд.тп.


Кроме работы с матрицами с одновременным сложением и умножением 8-ми чисел даже для ссе применения не было. для АVX тем более. почитай. Между шагами вычислений ничего другого больше сделать нельзя. Так что линпак со своими матрицами там себя прекрасно чувствует. Остальные проги которыене используют матричные вычисления - ничего не выйграют.


 

Junior
Статус: Не в сети
Регистрация: 08.12.2009
#77
197.784Gflops 3930k 1.408


 

Member
Статус: Не в сети
Регистрация: 20.08.2007
polirol90201, увеличь объём используемой памяти до 14 GiB и до 200 GFlops дотянешь

_________________
i5-2500K + TRUE Spirit 120 | ECS P67H2-A2 | 4×4 GiB | GTX 580 + Spitfire + VRM-G2 | X-Fi Ti HD + Edifier S2000 | PX-128M3 + WD20EARX | Seasonic X-660


 

Member
Статус: Не в сети
Регистрация: 20.12.2011
2x xeon ES 8\16 3.0ghz-3.3ghz turbo 242Gflops
http://s2.ipicture.ru/uploads/20120414/AW7uvFSR.png


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 2089 • Страница 60 из 105<  1 ... 57  58  59  60  61  62  63 ... 105  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan