Member
Статус: Не в сети Регистрация: 23.02.2013 Откуда: г. Орел
Asilus писал(а):
не только AVX, но и вообще запись в кэши сильно хромает. Да и чтение не блещет… Переделывать всю кэш-систему надо.
хоботе такие уникумы щас сидят что и на оверах - форум скатился в уг у них... я вам и не такое найду. система кешей само по себе медленная и тут проблема не в AVX а вообще в латентности кешей у новой архитектуры - для него это открытие видимо что не только AVX пишется в кеши процессора. более того латентность от части проблема "высочастотности" и в то же время высокочастностность и метод решения проблемы - тыдыщ! да одна команда записывается долго если вообще смотреть сколько исполнительных тактов тратиться, но буль имеет 4ггц а интел только при бусте 3,9 и понятно его спасает это.
Добавлено спустя 5 минут 21 секунду: эксперты блин а капнешь гуманитарное образование журналиста / филолога эксперты блин...
_________________ Мертвый киберпанк с улыбкой мутанта... (:
Member
Статус: Не в сети Регистрация: 24.11.2007 Откуда: Самара
mag_ai писал(а):
хоботе такие уникумы щас сидят что и на оверах - форум скатился в уг у них...
Это не уникумы были, люди которые разбираются в вопросе. Т.е. скажем на фоне вас объявившего инструкцию FMA4 вычислительным блоком несколько более грамотные.
mag_ai писал(а):
я вам и не такое найду. система кешей само по себе медленная и тут проблема не в AVX а вообще в латентности кешей у новой архитектуры - для него это открытие видимо что не только AVX пишется в кеши процессора.
Найдите, кто-то против?
mag_ai писал(а):
тыдыщ! да одна команда записывается долго если вообще смотреть сколько исполнительных тактов тратиться, но буль имеет 4ггц а интел только при бусте 3,9 и понятно его спасает это.
Не спасает даже кочегарки 9590, они медленнее стоковых интелов на таких задачах с AVX. А уж разница в 100-300 Mhz вообще несерьезна если сравнивать бульки-пильки с корками.
mag_ai писал(а):
эксперты блин а капнешь гуманитарное образование журналиста / филолога эксперты блин...
Так копните, мы то анонимусы, а вот там беседовали с автором статей крупного IT ресурса.
Добавлено спустя 42 секунды:
devl547 писал(а):
this. И вообще там походу L3 подрублен через IMC, отсюда и тормоза.
Явно ещё на этапе склейки 128+128 затык и медленный кэш лишь усугубляет картину. ИМХО.
Member
Статус: Не в сети Регистрация: 23.02.2013 Откуда: г. Орел
Asilus писал(а):
Т.е. скажем на фоне вас объявившего инструкцию FMA4 вычислительным блоком несколько более грамотные.
я не называл fma4 блоком - если вы не поняли мысль это ваши проблемы. да надо больше знаком влепить в предложение но я не думал что тут такой тупой контингент.
Asilus писал(а):
Найдите, кто-то против?
это даже в обзоре архитектуры есть:
Цитата:
Большие задержки при обращении к данным в Bulldozer могут быть компенсированы лишь высокой тактовой частотой этих CPU. Что, впрочем, и планировалось изначально — по частотам новые восьмиядерники должны были превосходить Phenom II на 30 %. Однако AMD так и не смогла спроектировать полупроводниковые кристаллы, способные стабильно работать при столь высоких значениях частоты. В результате высокая латентность кеш-памяти способна нанести системам на базе Bulldozer определённый урон. в самом низу последняя таблица - http://www.3dnews.ru/618486
Asilus писал(а):
Не спасает даже кочегарки 9590, они медленнее стоковых интелов на таких задачах с AVX. А уж разница в 100-300 Mhz вообще несерьезна если сравнивать бульки-пильки с корками.
госпади постом выше:
Цитата:
Но более важен вопрос, насколько хорошо Bulldozer поддерживает инструкции AVX по сравнению с Intel? Sandy Bridge выдаёт две 256-битные операции AVX за такт, а Bulldozer обеспечивает только одну.
http://www.thg.ru/cpu/obzor_amd_fx_8150 ... 50-02.html я по 10 раз сссылки копировать не буду. то есть 2 ггц санди бридж = 4ггц булю по количеству операций. но в реальности такой код найти сложно. поэтому в синтетики (санда - там же) остование буля в вещ. операциях не настолько сильное. 157 у буля у кор ай5 - 206 у кор ай7 - 287... могу проценты кинуть 287/100=2.87 и 157/2,87=54,7% что и есть ровное на 1 и 2 операции за такт. приведенный devl547 кодек h264 к слову всегда кодировался плохо на амд вообще кодирование видео / звука у них слабо.
Asilus писал(а):
Так копните, мы то анонимусы, а вот там беседовали с автором статей крупного IT ресурса.
да мне плевать у меня есть кумиры средь ит журналистов но они не российские ибо все что наши это переводы зарубежных статей.
Добавлено спустя 2 минуты 28 секунд: devl547 ну в декодере там не особо много проблем выборка из оперативки у амд всегда слабое место как и блок предсказаний ветвлений... так что тут понятно дело что не блещит и в буле и пилидрайве и стимроллере и экскаватор тож будет точно таким же тормозом.
_________________ Мертвый киберпанк с улыбкой мутанта... (:
Member
Статус: Не в сети Регистрация: 24.11.2007 Откуда: Самара
mag_ai писал(а):
я не называл fma4 блоком - если вы не поняли мысль это ваши проблемы. да надо больше знаком влепить в предложение но я не думал что тут такой тупой контингент.
Называли. Если вы не поняли что врать не хорошо, то это ваши проблемы.
В одном предложении адски сжечь оппонентов напалмом только вы смогли:
"то есть fpu у буля нет там fmac причем у первых булей это вообще fma4" Оказывается и FPU пропал и FMA4 это вместо FPU, а не банальная инструкция.
mag_ai писал(а):
это даже в обзоре архитектуры есть:
Там нет абсолютно ничего про работу AVX. То что убогость пытались компенсировать высокими частотами все в курсе с 2011 года.
mag_ai писал(а):
госпади постом выше:
Опять врёте, не постом выше, в любом тесте отлично видно что с их кукурузой не о какой компенсации за счёт частоты в работе c AVX говорить нельзя, ничего выгорит - абсолютно.
Добавлено спустя 5 минут 43 секунды:
mag_ai писал(а):
да мне плевать у меня есть кумиры средь ит журналистов но они не российские ибо все что наши это переводы зарубежных статей.
Вы в плевках не захлебнётесь? Может вам с простого начать чего-нибудь прежде чем с авторами статей побеседовать. И да, приличные тесты (того же Ф-Центр) это оригинальные тесты, а не переводы. Ах да, CPU разрабатывают в США (у Интел некоторые подразделения в Израиле), так что не читая зарубежных статей об архитектуре сложно что компетентно изобразить. Вы можете попробывать.
Member
Статус: Не в сети Регистрация: 23.02.2013 Откуда: г. Орел
Asilus писал(а):
Вы можете попробывать.
поверьте я перевод от реальных тестов за версту чувствую не первый год читаю тот же хобот (2005) оверы (2006) ф-центры и тхг и схожие с ними (2007-2008). сейчас даже тестового на хоботе мало о чем говорить что ф-центр? лол да всякую бюджетную лабудень они могут тестировать вот и все... дальше у них ни у хобота руки только ну очень редко дотягиваются. часто - перевод причем настолько шаблонный что я даже иногда нахожу статьи с которых сделан.
Asilus писал(а):
Там нет абсолютно ничего про работу AVX.
там есть про кеши вы просили найти про кеши я нашел в чем проблема? или вы думаете кеш под avx какой то иной?
Asilus писал(а):
Опять врёте, не постом выше, в любом тесте отлично видно что с их кукурузой не о какой компенсации за счёт частоты в работе c AVX ничего выгорит - абсолютно.
бред какой - половинки мыслей в одном предложении.
Добавлено спустя 1 минуту 43 секунды:
devl547 писал(а):
Блоки предсказания и префетча у них сейчас классные, лучше чем были у Phenom II.
где можно прочитать?
_________________ Мертвый киберпанк с улыбкой мутанта... (:
Member
Статус: Не в сети Регистрация: 24.11.2007 Откуда: Самара
mag_ai писал(а):
оверьте я перевод от реальных тестов за версту чувствую не первый год читаю тот же хобот (2005) оверы (2006) ф-центры и тхг и схожие с ними (2007-2008). сейчас даже тестового на хоботе мало о чем говорить что ф-центр? лол да всякую бюджетную лабудень они могут тестировать вот и все... дальше у них ни у хобота руки только ну очень редко дотягиваются. часто - перевод причем настолько шаблонный что я даже иногда нахожу статьи с которых сделан.
Да в любой крупной статье есть переводы, ибо продукт не российский. Разница в том что кто-то изучает информацию, а не выкладывает пересказ. Ну, а в нормальных тестах, никаких переводов не бывает, наоборот если автор толковый там есть вещи кои в англо-франко-германоязычных статьях не встретишь.
mag_ai писал(а):
там есть про кеши вы просили найти про кеши я нашел в чем проблема? или вы думаете кеш под avx какой то иной?
Там нет ничего про ошибки работы их юнитов FMA. Кэши не интересны, только в контексте работы с инструкциями AVX что мы и обсуждаем. 128+128 работает плохо, не только кэш в этом виноват.
Добавлено спустя 48 секунд:
mag_ai писал(а):
бред какой - половинки мыслей в одном предложении.
В вашем?
Последний раз редактировалось Asilus 09.01.2014 3:29, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 23.02.2013 Откуда: г. Орел
mag_ai писал(а):
то есть fpu у буля нет там fmac причем у первых булей это вообще fma4
я мыслю суперскалярно - vliw имхо команды длинные бить сложно на куски, но суть понятна и 100 граммов -
mag_ai писал(а):
то есть fpu у буля нет - там fmac. причем у первых булей может fma4
второпях чего не настрочишь - было бы у меня времени больше мысли бы красивше оформлял, но нет ни времени ни желания.
Цитата:
Ну, а в нормальных тестах, никаких переводов не бывает, наоборот если автор толковый там есть вещи кои в англо-франко-германоязычных статьях не встретишь.
читайте хорошие сайты.
Цитата:
Там нет ничего про ошибки работы их юнитов FMA. Кэши не интересны, только в контексте работы с инструкциями AVX что мы и обсуждаем. 128+128 работает плохо, не только кэш в этом виноват.
вы достанете мертвого - несколькими постами выше я привел почему буль обрабатывает avx медленней санди бриджа - если вам еще раз нужно носом ткнуть уж увольте уже любой школьник такой маленький отрезок наизусть выучил. бридж делает 2 операции за такт буль 1 операцию. медленней санди бриджа (кор ай7) в тесте сандры на 54% что и есть разница между исполнением 1 и 2 инструкций за такт. ни о каких ошибках при исполнении avx у процессоров амд речи идти и не может.
_________________ Мертвый киберпанк с улыбкой мутанта... (:
Последний раз редактировалось mag_ai 09.01.2014 3:43, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 24.11.2007 Откуда: Самара
mag_ai писал(а):
я мыслю суперскалярно - vliw имхо команды длинные бить сложно на куски, но суть понятна и 100 граммов -
Надо было мыслить правильно, а не жечь напалмом.
mag_ai писал(а):
второпях чего не настрочишь - было бы у меня времени больше мысли бы красивше оформлял, но нет ни времени ни желания.
Вот ты угорь лживый. Там и до этого ты вбросил есть FPU или нет, просто в том предложении доказал так сказать уже натурально что вы мисье просто сказочный *** .
mag_ai писал(а):
читайте хорошие сайты.
Самые разные читаю от харваэ. франс до овреклокеров.ру. А вот вам бы посоветовал читать хоть что-нибудь.
mag_ai писал(а):
вы достанете мертвого - несколькими постами выше я привел почему буль обрабатывает avx медленней санди бриджа - если вам еще раз нужно носом ткнуть уж увольте уже любой школьник такой маленький отрезок наизусть выучил.
Хрень там была, а не причина плохой работы с AVX.
mag_ai писал(а):
бридж делает 2 операции за такт буль 1 операцию медленные санди бриджа кор ай7 в тесте сандры на 54% что и есть разница между исполнением 1 и 2 инструкций за такт. ни о каких ошибках при исполнении avx у процессоров амд речи идти и не может.
Да, да все в курсе что у булек-пилек отвратительный IPC хуже чем у старых феномов. И да, ошибки там были даже при работе целочисленных юнитов (!), с AVX вообще же бяда, да такая что для FX не рекомендуют их применение, вспомним тот же Линкс.
Последний раз редактировалось psilocebin 09.01.2014 15:31, всего редактировалось 3 раз(а).
Member
Статус: Не в сети Регистрация: 24.11.2007 Откуда: Самара
mag_ai писал(а):
все пожизненный ЧС. я думал я погорячился первый раз... а нет реально так.
О как. Где же можно ваши статьи прочитать по микроархитектурам CPU? Нигде?
Цитата:
Asilus, ты какой-то бред несешь про ошибки, про IPC фенома и прочее. Доказательства хотя бы в виде таблицы предоставь, а?
Какой ещё бред??? Про разницу в IPC ты не в курсе??? Про ошибки в работе юнитов fmac на AVX это моё личное ИМХО, раз уж исправляли ошибки в целочисленных блоках, то в данном случае дело явно похуже и требует серьёзной допилки.
Member
Статус: Не в сети Регистрация: 24.11.2007 Откуда: Самара
devl547 писал(а):
Разница там из-за спаренности ядер. Однопоток емнип быстрее.
Это без сомнений, я везде указываю что ИМХО проблема начинается при склейке на полной нагрузке юнитов fmac. Могу конечно ошибаться, но дело явно не только в кэше.
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Asilus писал(а):
ИМХО проблема начинается при склейке на полной нагрузке юнитов fmac.
Разница между AVX128 и AVX256 в пределах 2-3%.
Asilus писал(а):
Выше же приводил. С обзора thg выдрал.
Что-то я там не увидел ошибок.
Добавлено спустя 1 час 27 минут 41 секунду: А вот этого кадра я не видел. Кто что скажет насчет последнего пункта? Правильно понимаю, что с повышением частоты и напруги у них TDP поднимается быстрее, чем у Richland?
Member
Статус: Не в сети Регистрация: 24.11.2007 Откуда: Самара
devl547 писал(а):
Разница между AVX128 и AVX256 в пределах 2-3%.
Хотите сказать и без склейки всё уныло? Это вряд ли) Из-за такой мелочи никто не стал бы заморачиваться. Я так понимаю между 256 и 512 тоже 2-3%?) Вероятно есть какие-то нюансы, возможно кое-что узнаем после релиза катка.
devl547 писал(а):
Что-то я там не увидел ошибок.
Шутки шутите? В теме же выкладывал.
"AMD обнаружила, что в некоторых случаях Bulldozer не мог обнаружить сохраненные данные в регистровом файле, которые там уже находились. После исправления, инструкции попадают в целочисленный блок быстрее." А сколько ещё не обнаружила? Тем паче в более сложных задачах с плавучкой, ведь всю архитектуру перешили - ошибки просто неизбежны. Собственно главное чтобы их исправляли, во время.
devl547 писал(а):
Правильно понимаю, что с повышением частоты и напруги у них TDP поднимается быстрее, чем у Richland?
Возможно тот же эффект, что проявился у кристаллов Иви и Хасси. CPU часть стала плотнее, а GPU наоборот увеличилась.
К слову ходят упорные слухи, что там какой-то специфический контролер памяти, самые смелые утверждают что возможно уже реализована поддержка DDR4.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 14
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения