Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 280 • Страница 13 из 14<  1 ... 10  11  12  13  14  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Asilus писал(а):
а реальности там кое-каково выходит.

ты понимаешь что такое стандарт? что вообще означает поддержка апи / инструкций?

_________________
Мертвый киберпанк с улыбкой мутанта... (:



Партнер
 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
Микропроцессоры с AVX2

Intel Haswell
AMD Steamroller

Первый уже полгода продают про второй я упомянул выше, в плане Кавери (у него ядра катка). Поскольку при текущей реализации и AVX кое-каково, то с AVX2 там вообще будет смех.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Asilus писал(а):
2. FMAC якобы даже могут склеивать инструкции 128+128, на деле при работе с AVX (ещё первой итерацией) получается пшик


Не, там реально быстрее (в пределах одного потока). Но основная подстава в том, что AVX в одном потоке редко встречается - почти весь софт, который умеет в AVX умеет в многопоток.
И получается на FX, что 8 потоков AVX128 = 4 потока AVX256 = 8 потоков AVX256 (просто потому что FPU забит и они простаивают).

mag_ai, AVX2 будет у Excavator. У стима - всё тот же блок, что и у вишеры (ну разве что более плотно скомпонован).

Я вот удивлён, почему AMD до сих пор не выложила документацию по оптимизации софта под Kaveri.


Последний раз редактировалось devl547 09.01.2014 0:29, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Asilus писал(а):
Поскольку при текущей реализации и AVX кое-каково, то с AVX2 там вообще будет смех.

ты еще у нас и программист? лол а еще какие профессии знаешь?

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
ты понимаешь что такое стандарт? что вообще означает поддержка апи / инструкций?

Я понимаю что такое исправления ошибок в убогой архитектуре. Скажем так:

"AMD обнаружила, что в некоторых случаях Bulldozer не мог обнаружить сохраненные данные в регистровом файле, которые там уже находились. После исправления, инструкции попадают в целочисленный блок быстрее."

Ты понял чунча? Там даже целочисленка кое-каково) А ты про AVX что-то там пыхтишь)

devl547 писал(а):
Не, там реально быстрее (в пределах одного потока). Но основная подстава в том, что AVX в одном потоке редко встречается - почти весь софт, который умеет в AVX умеет в многопоток.
И получается на FX, что 8 потоков AVX128 = 4 потока AVX256 = 8 потоков AVX256 (просто потому что FPU забит и они простаивают).

Реально\нереально, но предпочтительнее для АМД использовать FMA (если есть возможность).


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
devl547 да я как бэ и не вкурсах какой разрядности у стимроллера fmac. это я тип просто скопировал из вики и все (:

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 23.07.2013
Asilus писал(а):
Ох там и тупые

да нет конечно, что вы. Там очень умные люди сидят не чета тупым инженерам из амд :lol: :lol: :lol:
Ведь счастье было так возможно - феном на 32 ннм и усе, победа, а они дураки взялись новую архитктуру лепить, вот балбесы :lol:

ЗЫ ну так где тесты то 8080 против фенома? Мне вот очень любопытно как там они на 1 частоте то :haha:


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Asilus писал(а):
Я понимаю что такое исправления ошибок в убогой архитектуре.

я знаю что святой интел на уровне проектирования не меньше ошибок совершает а может и больше пример с пентиумом - http://ru.wikipedia.org/wiki/Pentium_4# ... 0.BA.D0.B8
если табличка не откроется сразу раздел "исправление ошибок" вот это лол да? 81 одна ошибка в первых пнях 4! я думаю сейчас у них этих ошибок не меньше.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
Kotory писал(а):
да нет конечно, что вы. Там очень умные люди сидят не чета тупым инженерам из амд :lol: :lol: :lol:
Ведь счастье было так возможно - феном на 32 ннм и усе, победа, а они дураки взялись новую архитктуру лепить, вот балбесы

А почему только АМД? :lol: Интел тоже под раздачу попал, могу ещё статейки выложить скажем где Иви Бридж с Коре Дуо сравнвиают)

Добавлено спустя 1 минуту 13 секунд:
Kotory писал(а):
Ведь счастье было так возможно - феном на 32 ннм и усе, победа, а они дураки взялись новую архитктуру лепить, вот балбесы

Я лично не апологет того мнения что Феномы нужно было модернизировать и.т.д. Наоборот проявили волю, создали что-то новое, да херово вышло, но работа над ошибками идёт, профит есть.


Последний раз редактировалось Asilus 09.01.2014 0:39, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 23.07.2013
Asilus
так это, еще ж не поздно, давай им намекнем что ли чтобы они феномы теперь уже на 22 или 28 ннм переводили, и ворвутся же сразу :lol: Тебе даже наверно премию дадут за такое научное открытие, и возьмут на работу :lol:


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
я знаю что святой интел на уровне проектирования не меньше ошибок совершает а может и больше пример с пентиумом - http://ru.wikipedia.org/wiki/Pentium_4# ... 0.BA.D0.B8
если табличка не откроется сразу раздел "исправление ошибок" вот это лол да? 81 одна ошибка в первых пнях 4! я думаю сейчас у них этих ошибок не меньше.

Хех, так к слову же. Убогих решений и вообще ошибок в мире много. Я тебе это привёл для того чтобы ты понял, AVX в АМД не просто так плохо работают (ибо и в других блоках ошибки), и там прикладывают колоссальные усилия чтобы решить эту проблему.

Добавлено спустя 30 секунд:
Kotory писал(а):
так это, еще ж не поздно, давай им намекнем что ли чтобы они феномы теперь уже на 22 или 28 ннм переводили, и ворвутся же сразу :lol: Тебе даже наверно премию дадут за такое научное открытие, и возьмут на работу

Не понял? Я же написал тебе выше:

Asilus писал(а):
Я лично не апологет того мнения что Феномы нужно было модернизировать и.т.д. Наоборот проявили волю, создали что-то новое, да херово вышло, но работа над ошибками идёт, профит есть.


 

Member
Статус: Не в сети
Регистрация: 23.07.2013
А вообще мы помоему открыл новый научный подход 8-)
1 - делаем процессор с удачной архитектурой
2 - переводим его до усрачки на новые техпроцессы
3 - профит :super:
:lol:


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
Kotory писал(а):
делаем процессор с удачной архитектурой
2 - переводим его до усрачки на новые техпроцессы
3 - профит

Ну как бэ Корки к этому действу относят, с бесконечной модернизацией и интеграцией чипсетных блоков, GPU и.т.д. А некоторые родословную этой линейки аж от PIII ведут.

Добавлено спустя 8 минут 13 секунд:
Кстати смех смехом, но в ближайшие дни буду покупать систему с FX 8350 для рендеринга, вот такие дела пироги. Сам и проверю что там к чему, хотя в принципе знаком немного по опыту использования Тринити, но 4 модуля это не 2, да и вообще. Как бы месяца через 2-3 АМД каток не выкатила, вот это будет облом так облом.


Последний раз редактировалось Asilus 09.01.2014 0:51, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Asilus писал(а):
Я тебе это привёл для того чтобы ты понял, AVX в АМД не просто так плохо работают (ибо и в других блоках ошибки), и там прикладывают колоссальные усилия чтобы решить эту проблему.

где хоть проблема? я вижу только что бредой 1 тест сбоит - все. еще есть софт где поддержка avx от амд сбоит?
Цитата:
Но более важен вопрос, насколько хорошо Bulldozer поддерживает инструкции AVX по сравнению с Intel? Sandy Bridge выдаёт две 256-битные операции AVX за такт, а Bulldozer обеспечивает только одну.

Цитата:
В операции копирования формата Int24 в Float64 процессор Intel Core i7-2600K показывает 69% прирост производительности, AMD FX-8150 обеспечил не менее впечатляющий прирост 61%. Что на самом деле означает слово "прирост"? Мы говорим о тактах CPU, количество которых поддержка AVX помогает снизить, увеличивая таким образом потенциальную пропускную способность процессора. Выражаясь другими словами, архитектура Sandy Bridge урезала количество потребовавшихся тактов в 1,69 раза, а Bulldozer уменьшила их количество в 1,61.
С другой стороны, в операции копирования формата Float32 в Float64, процессор Core i7-2600K смог обеспечить 14% прирост, в то время как FX-8150 показал 77% потери. Если попытаться объяснить эту потерю, то, кажется, что встроенные средства Visual Studio 2010 не оптимизированы под архитектуру AMD. В любом случае, требуется патч приложения или пакет обновления Visual Studio.

http://www.thg.ru/cpu/obzor_amd_fx_8150 ... 50-02.html
что то про плохо работающий avx особенно тесты санды не показывают.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
где хоть проблема? я вижу только что бредой 1 тест сбоит - все. еще есть софт где поддержка avx от амд сбоит?

Я не специалист, где проблема не знаю, но встречаю упоминания про сей момент. Характерно, что для АМД тест-пакет Линкс с FMA рекомендован.

mag_ai писал(а):
С другой стороны, в операции копирования формата Float32 в Float64, процессор Core i7-2600K смог обеспечить 14% прирост, в то время как FX-8150 показал 77% потери. Если попытаться объяснить эту потерю, то, кажется, что встроенные средства Visual Studio 2010 не оптимизированы под архитектуру AMD. В любом случае, требуется патч приложения или пакет обновления Visual Studio.

Что там и где не оптимизировано что аж 77% потерь (это вместо прироста у Сэнди???) специалисты должны быть в курсе, но такой информацией не очень-то и делятся, по крайней мере до тех пор пока не выходят новые CPU.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Asilus писал(а):
Характерно что для АМД тест-пакет Линкс с FMA рекомендован.


Я к сожалению сейчас не могу собрать hpl с acml.
Но эта либа по тестам быстрее, чем интеловская mkl даже на интеловских процессорах.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Asilus писал(а):
АМД тест-пакет Линкс с FMA рекомендован.

и все и где еще некие фейлы? я вам щас тож кривой код накидаю вообще не запуститься - хотите?
Asilus писал(а):
Что там и где не оптимизировано что аж 77% потерь (это вместо прироста у Сэнди???) специалисты должны быть в курсе, но такой информацией не очень-то и делятся, по крайней мере до тех пор пока не выходят новые CPU.

не тупите сбор софтины - самопал на старой визуал студии. ее компилятор сбоит а не процессор.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
devl547 писал(а):
Но эта либа по тестам быстрее, чем интеловская mkl даже на интеловских процессорах.

! Неплохо, собственно если даже решить проблему с потерями то даже параллельное ускорение процессоров Интел уже вторично, ибо есть ещё вопрос цены)))


 

Member
Статус: Не в сети
Регистрация: 23.07.2013
Asilus писал(а):
Как бы месяца через 2-3 АМД каток не выкатила

ага, только он у них видимо своим ходом едет :D к моменту выпуска интелем на своих "интеловских" 5 ннм хоть бы доехал :D


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
и все и где еще некие фейлы? я вам щас тож кривой код накидаю вообще не запуститься - хотите?

А что ещё нужно? Вам их нужна тысяча, миллион? Я где-то в аналогичной теме выкладывал сообщения одного человека который видимо плотно с этим вопросом знаком (в теме про процессоры АМД на ixbt обсуждали) и как я понял многие заинтересованные в курсе. Сходите пообщайтесь.

"Интересно, починят в Steamroller багу Piledriver с очень медленной записью из 256-битных AVX регистров в память? А то пока AMD и AVX - вещи малосовместимые."

"не только AVX, но и вообще запись в кэши сильно хромает. Да и чтение не блещет… Переделывать всю кэш-систему надо."

Это у автора статей ixbt по архитектурам CPU спрашивали, т.е. не только анонимусы типа нас с вами беседовали.

mag_ai писал(а):
не тупите сбор софтины - самопал на старой визуал студии. ее компилятор сбоит а не процессор.

Нет сам процессор, об этом данные и не только здесь. Даже при работе с целочисленкой узких мест наплодили.

Добавлено спустя 57 секунд:
Kotory писал(а):
ага, только он у них видимо своим ходом едет :D к моменту выпуска интелем на своих "интеловских" 5 ннм хоть бы доехал :D

Возможно) Но ядра-то давно готовы, ибо первые образцы Кавери ещё в июне предоставили прессе и производителям материнок.


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 280 • Страница 13 из 14<  1 ... 10  11  12  13  14  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 12


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan