Member
Статус: Не в сети Регистрация: 10.02.2007 Откуда: Москва
LSIchip у вас кукурузные мигагерцы... а они гонят процессоры до 5ГГц, и память на нормальных частотах, а именно она даёт значительный прирост p.s. у серверов как бы другие задачи....
unknown-guest да оно понятно что серваки для других целей)) просто есть например комп на i5, который больше выдает, но при этом практически любую задачу запусти на серваке, так она в разы быстрее выполняется. я просто полагал, что такое большое кол-во потоков должно себя оправдать в таком тесте, но не тут то было...
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
LSIchip писал(а):
unknown-guest да оно понятно что серваки для других целей)) просто есть например комп на i5, который больше выдает, но при этом практически любую задачу запусти на серваке, так она в разы быстрее выполняется. я просто полагал, что такое большое кол-во потоков должно себя оправдать в таком тесте, но не тут то было...
Во-первых НТ - полная туфта. Когда софт неоптимизирован и не нагружает физ ядро на 100% - НТ помогает. В случае линпака дополнительный поток наоборот тормозит. Отключи НТ в биосе и увидишь прирост 30-40%. Во-вторых AVX - дает удвоение по показателям, но в реале нигде не используется. Без AVX кора и7-2600 на 5ГГц выкакивает жалкие 50-60Гфлопсов. Поэтому можно смело делить резалты на 2 для процов с AVX.
Я не знаю ни одной задачи кроме линпака где надо одновременно умножить или сложить 8 чисел. Даже если эти задачи и есть, выйгрышь в 0.1% приложений за счёт AVX можно считать бесполезным. Ну а сервак есть сервак. кучя памяти + 2 проца..... Возможно ещё приоритет плохо расставлен и фоновые прилоги тупят в бэкграунде.
Вы немного ошибаетесь. SSE умели операции максимум с 2мя операндами и 16 128-битных регистров, тогда как AVX умеют инструкции с 3мя (и, потенциально, более) операндами и тоже 16 но уже 256-битных регистров (с потенциальным расширением до 1024-битных), с увеличением параллелизации. Это не просто какие-то специфические действия типа сложить за такт 8 чисел - это куда более многообразный прогресс, чем вам кажется.
Добавлено спустя 8 минут 25 секунд: а, вы о содержимом регистров, понял... ну вообще-то векторы не обязательно 32-битные (4 на старый регистр, 8 на новый), были еще 64-битные (2 на старый регистр, 4 на новый), а теперь вот и поддержка 128-битных (2 на новый регистр). Ну уж никак не 8 на всех операциях - только на 32-битных векторах. Сейчас уже куча сфер куда более эффективного применения векторов выше 32-битных.
Ну и разумеется, пока софт под это дело не оптимизируют - это будет бесполезно. Ну так это всегда так было при старте новых технологий, т.ч. думаю, эффективные реализации на AVX мы скоро увидим.
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
PusiX писал(а):
Это не просто какие-то специфические действия типа сложить за такт 8 чисел - это куда более многообразный прогресс, чем вам кажется.
Поконкретнее можно? на примере операндов с ASM командами. Я к примеру кроме SSE_ADD, SSE_MULT на 4 вектора незнаю. Реализация одинаковая, добавили инструкции, расширили количество векторов и назвали AVX.
Ладно, если конкретно асмом, то для конкретных данных надо подробно анализировать набор инструкций, а мне откровенно влом. Откройте гугл - уверен, за меня это уже давно проанализировали. Даже тут http://habrahabr.ru/post/99367/
P.S. Я не утверждаю, что AVX - такое супергениальное изобретение интел - очевидно, что это не так, просто банальное расширение всё того же старого sse. Но это уже другая тема. Я говорю лишь, что польза будет заметней куда чаще, чем в "сложить 8 чисел".
Добавлено спустя 7 минут 26 секунд: самый очевидный пример наверно - банальное вдвое большее распараллеливание каких-либо соотв. операций. Обработка данных, мультимедиа, всякие вычисления типа вот этой матлаб, и тд.тп.
Ладно, если конкретно асмом, то для конкретных данных надо подробно анализировать набор инструкций, а мне откровенно влом. Откройте гугл - уверен, за меня это уже давно проанализировали. Даже тут http://habrahabr.ru/post/99367/
P.S. Я не утверждаю, что AVX - такое супергениальное изобретение интел - очевидно, что это не так, просто банальное расширение всё того же старого sse. Но это уже другая тема. Я говорю лишь, что польза будет заметней куда чаще, чем в "сложить 8 чисел".
Добавлено спустя 7 минут 26 секунд: самый очевидный пример наверно - банальное вдвое большее распараллеливание каких-либо соотв. операций. Обработка данных, мультимедиа, всякие вычисления типа вот этой матлаб, и тд.тп.
Кроме работы с матрицами с одновременным сложением и умножением 8-ми чисел даже для ссе применения не было. для АVX тем более. почитай. Между шагами вычислений ничего другого больше сделать нельзя. Так что линпак со своими матрицами там себя прекрасно чувствует. Остальные проги которыене используют матричные вычисления - ничего не выйграют.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения