Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 280 • Страница 14 из 14<  1 ... 10  11  12  13  14
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Asilus писал(а):
но и вообще запись в кэши сильно хромает.


this. И вообще там походу L3 подрублен через IMC, отсюда и тормоза.



Партнер
 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Asilus писал(а):
не только AVX, но и вообще запись в кэши сильно хромает. Да и чтение не блещет… Переделывать всю кэш-систему надо.

хоботе такие уникумы щас сидят что и на оверах - форум скатился в уг у них... я вам и не такое найду. система кешей само по себе медленная и тут проблема не в AVX а вообще в латентности кешей у новой архитектуры - для него это открытие видимо что не только AVX пишется в кеши процессора. более того латентность от части проблема "высочастотности" и в то же время высокочастностность и метод решения проблемы - тыдыщ! да одна команда записывается долго если вообще смотреть сколько исполнительных тактов тратиться, но буль имеет 4ггц а интел только при бусте 3,9 и понятно его спасает это.

Добавлено спустя 5 минут 21 секунду:
эксперты блин а капнешь гуманитарное образование журналиста / филолога :D эксперты блин...

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
хоботе такие уникумы щас сидят что и на оверах - форум скатился в уг у них...

Это не уникумы были, люди которые разбираются в вопросе. Т.е. скажем на фоне вас объявившего инструкцию FMA4 вычислительным блоком несколько более грамотные.

mag_ai писал(а):
я вам и не такое найду. система кешей само по себе медленная и тут проблема не в AVX а вообще в латентности кешей у новой архитектуры - для него это открытие видимо что не только AVX пишется в кеши процессора.

Найдите, кто-то против?

mag_ai писал(а):
тыдыщ! да одна команда записывается долго если вообще смотреть сколько исполнительных тактов тратиться, но буль имеет 4ггц а интел только при бусте 3,9 и понятно его спасает это.

Не спасает даже кочегарки 9590, они медленнее стоковых интелов на таких задачах с AVX. А уж разница в 100-300 Mhz вообще несерьезна если сравнивать бульки-пильки с корками.

mag_ai писал(а):
эксперты блин а капнешь гуманитарное образование журналиста / филолога :D эксперты блин...

Так копните, мы то анонимусы, а вот там беседовали с автором статей крупного IT ресурса.

Добавлено спустя 42 секунды:
devl547 писал(а):
this. И вообще там походу L3 подрублен через IMC, отсюда и тормоза.

Явно ещё на этапе склейки 128+128 затык и медленный кэш лишь усугубляет картину. ИМХО.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
mag_ai писал(а):
более того латентность от части проблема "высочастотности"


Там всё в куче - и тормозная память, и тормозной L3, и кэш у них 4-way/2-way, и L1I обьединенный, и тормоза в декодере.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Asilus писал(а):
Т.е. скажем на фоне вас объявившего инструкцию FMA4 вычислительным блоком несколько более грамотные.

я не называл fma4 блоком - если вы не поняли мысль это ваши проблемы. да надо больше знаком влепить в предложение но я не думал что тут такой тупой контингент.
Asilus писал(а):
Найдите, кто-то против?

это даже в обзоре архитектуры есть:
Цитата:
Большие задержки при обращении к данным в Bulldozer могут быть компенсированы лишь высокой тактовой частотой этих CPU. Что, впрочем, и планировалось изначально — по частотам новые восьмиядерники должны были превосходить Phenom II на 30 %. Однако AMD так и не смогла спроектировать полупроводниковые кристаллы, способные стабильно работать при столь высоких значениях частоты. В результате высокая латентность кеш-памяти способна нанести системам на базе Bulldozer определённый урон.
в самом низу последняя таблица - http://www.3dnews.ru/618486

Asilus писал(а):
Не спасает даже кочегарки 9590, они медленнее стоковых интелов на таких задачах с AVX. А уж разница в 100-300 Mhz вообще несерьезна если сравнивать бульки-пильки с корками.

госпади постом выше:
Цитата:
Но более важен вопрос, насколько хорошо Bulldozer поддерживает инструкции AVX по сравнению с Intel? Sandy Bridge выдаёт две 256-битные операции AVX за такт, а Bulldozer обеспечивает только одну.

http://www.thg.ru/cpu/obzor_amd_fx_8150 ... 50-02.html
я по 10 раз сссылки копировать не буду.
то есть 2 ггц санди бридж = 4ггц булю по количеству операций. но в реальности такой код найти сложно. поэтому в синтетики (санда - там же) остование буля в вещ. операциях не настолько сильное. 157 у буля у кор ай5 - 206 у кор ай7 - 287... могу проценты кинуть 287/100=2.87 и 157/2,87=54,7% что и есть ровное на 1 и 2 операции за такт.
приведенный devl547 кодек h264 к слову всегда кодировался плохо на амд вообще кодирование видео / звука у них слабо.
Asilus писал(а):
Так копните, мы то анонимусы, а вот там беседовали с автором статей крупного IT ресурса.

да мне плевать у меня есть кумиры средь ит журналистов но они не российские ибо все что наши это переводы зарубежных статей.

Добавлено спустя 2 минуты 28 секунд:
devl547 ну в декодере там не особо много проблем выборка из оперативки у амд всегда слабое место как и блок предсказаний ветвлений... так что тут понятно дело что не блещит и в буле и пилидрайве и стимроллере и экскаватор тож будет точно таким же тормозом.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
mag_ai писал(а):
как и блок предсказаний ветвлений


Блоки предсказания и префетча у них сейчас классные, лучше чем были у Phenom II.


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
я не называл fma4 блоком - если вы не поняли мысль это ваши проблемы. да надо больше знаком влепить в предложение но я не думал что тут такой тупой контингент.

Называли. Если вы не поняли что врать не хорошо, то это ваши проблемы.

В одном предложении адски сжечь оппонентов напалмом только вы смогли:

"то есть fpu у буля нет там fmac причем у первых булей это вообще fma4"
Оказывается и FPU пропал и FMA4 это вместо FPU, а не банальная инструкция. :lol: :lol: :lol:

mag_ai писал(а):
это даже в обзоре архитектуры есть:

Там нет абсолютно ничего про работу AVX. То что убогость пытались компенсировать высокими частотами все в курсе с 2011 года.

mag_ai писал(а):
госпади постом выше:

Опять врёте, не постом выше, в любом тесте отлично видно что с их кукурузой не о какой компенсации за счёт частоты в работе c AVX говорить нельзя, ничего выгорит - абсолютно.

Добавлено спустя 5 минут 43 секунды:
mag_ai писал(а):
да мне плевать у меня есть кумиры средь ит журналистов но они не российские ибо все что наши это переводы зарубежных статей.

Вы в плевках не захлебнётесь? Может вам с простого начать чего-нибудь прежде чем с авторами статей побеседовать. И да, приличные тесты (того же Ф-Центр) это оригинальные тесты, а не переводы. Ах да, CPU разрабатывают в США (у Интел некоторые подразделения в Израиле), так что не читая зарубежных статей об архитектуре сложно что компетентно изобразить. Вы можете попробывать.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Asilus писал(а):
Вы можете попробывать.

поверьте я перевод от реальных тестов за версту чувствую не первый год читаю тот же хобот (2005) оверы (2006) ф-центры и тхг и схожие с ними (2007-2008). сейчас даже тестового на хоботе мало о чем говорить что ф-центр? лол да всякую бюджетную лабудень они могут тестировать вот и все... дальше у них ни у хобота руки только ну очень редко дотягиваются. часто - перевод причем настолько шаблонный что я даже иногда нахожу статьи с которых сделан.

Asilus писал(а):
Там нет абсолютно ничего про работу AVX.

там есть про кеши вы просили найти про кеши я нашел в чем проблема? или вы думаете кеш под avx какой то иной?
Asilus писал(а):
Опять врёте, не постом выше, в любом тесте отлично видно что с их кукурузой не о какой компенсации за счёт частоты в работе c AVX ничего выгорит - абсолютно.

бред какой - половинки мыслей в одном предложении.

Добавлено спустя 1 минуту 43 секунды:
devl547 писал(а):
Блоки предсказания и префетча у них сейчас классные, лучше чем были у Phenom II.

:?: где можно прочитать?

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
оверьте я перевод от реальных тестов за версту чувствую не первый год читаю тот же хобот (2005) оверы (2006) ф-центры и тхг и схожие с ними (2007-2008). сейчас даже тестового на хоботе мало о чем говорить что ф-центр? лол да всякую бюджетную лабудень они могут тестировать вот и все... дальше у них ни у хобота руки только ну очень редко дотягиваются. часто - перевод причем настолько шаблонный что я даже иногда нахожу статьи с которых сделан.

Да в любой крупной статье есть переводы, ибо продукт не российский. Разница в том что кто-то изучает информацию, а не выкладывает пересказ. Ну, а в нормальных тестах, никаких переводов не бывает, наоборот если автор толковый там есть вещи кои в англо-франко-германоязычных статьях не встретишь.

mag_ai писал(а):
там есть про кеши вы просили найти про кеши я нашел в чем проблема? или вы думаете кеш под avx какой то иной?

Там нет ничего про ошибки работы их юнитов FMA. Кэши не интересны, только в контексте работы с инструкциями AVX что мы и обсуждаем. 128+128 работает плохо, не только кэш в этом виноват.

Добавлено спустя 48 секунд:
mag_ai писал(а):
бред какой - половинки мыслей в одном предложении.

В вашем?


Последний раз редактировалось Asilus 09.01.2014 3:29, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
mag_ai писал(а):
где можно прочитать?


Техдокументацию и рекомендации по оптимизации софта под FX.
На сайте AMD есть кучка pdfок.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
mag_ai писал(а):
то есть fpu у буля нет там fmac причем у первых булей это вообще fma4

я мыслю суперскалярно - vliw имхо команды длинные бить сложно на куски, но суть понятна и 100 граммов -
mag_ai писал(а):
то есть fpu у буля нет - там fmac. причем у первых булей может fma4

второпях чего не настрочишь - было бы у меня времени больше мысли бы красивше оформлял, но нет ни времени ни желания.

Цитата:
Ну, а в нормальных тестах, никаких переводов не бывает, наоборот если автор толковый там есть вещи кои в англо-франко-германоязычных статьях не встретишь.

читайте хорошие сайты.
Цитата:
Там нет ничего про ошибки работы их юнитов FMA. Кэши не интересны, только в контексте работы с инструкциями AVX что мы и обсуждаем. 128+128 работает плохо, не только кэш в этом виноват.

вы достанете мертвого - несколькими постами выше я привел почему буль обрабатывает avx медленней санди бриджа - если вам еще раз нужно носом ткнуть уж увольте уже любой школьник такой маленький отрезок наизусть выучил.
бридж делает 2 операции за такт буль 1 операцию. медленней санди бриджа (кор ай7) в тесте сандры на 54% что и есть разница между исполнением 1 и 2 инструкций за такт. ни о каких ошибках при исполнении avx у процессоров амд речи идти и не может.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


Последний раз редактировалось mag_ai 09.01.2014 3:43, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
я мыслю суперскалярно - vliw имхо команды длинные бить сложно на куски, но суть понятна и 100 граммов -

Надо было мыслить правильно, а не жечь напалмом.

mag_ai писал(а):
второпях чего не настрочишь - было бы у меня времени больше мысли бы красивше оформлял, но нет ни времени ни желания.

Вот ты угорь лживый. Там и до этого ты вбросил есть FPU или нет, просто в том предложении доказал так сказать уже натурально что вы мисье просто сказочный *** . :lol:

mag_ai писал(а):
читайте хорошие сайты.

Самые разные читаю от харваэ. франс до овреклокеров.ру. А вот вам бы посоветовал читать хоть что-нибудь.

mag_ai писал(а):
вы достанете мертвого - несколькими постами выше я привел почему буль обрабатывает avx медленней санди бриджа - если вам еще раз нужно носом ткнуть уж увольте уже любой школьник такой маленький отрезок наизусть выучил.

Хрень там была, а не причина плохой работы с AVX.

mag_ai писал(а):
бридж делает 2 операции за такт буль 1 операцию медленные санди бриджа кор ай7 в тесте сандры на 54% что и есть разница между исполнением 1 и 2 инструкций за такт. ни о каких ошибках при исполнении avx у процессоров амд речи идти и не может.

Да, да все в курсе что у булек-пилек отвратительный IPC хуже чем у старых феномов. И да, ошибки там были даже при работе целочисленных юнитов (!), с AVX вообще же бяда, да такая что для FX не рекомендуют их применение, вспомним тот же Линкс. :-)


Последний раз редактировалось psilocebin 09.01.2014 15:31, всего редактировалось 3 раз(а).
3.14. Мат, ЖК неделя.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
:bandhead: все пожизненный ЧС. я думал я погорячился первый раз... а нет реально так.
предлагаю обоюдный ЧС чтоб вообще без претензий.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


Последний раз редактировалось mag_ai 09.01.2014 3:43, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Asilus, ты какой-то бред несешь про ошибки, про IPC фенома и прочее.
Доказательства хотя бы в виде таблицы предоставь, а?


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
mag_ai писал(а):
все пожизненный ЧС. я думал я погорячился первый раз... а нет реально так.

О как. Где же можно ваши статьи прочитать по микроархитектурам CPU? Нигде?


Цитата:
Asilus, ты какой-то бред несешь про ошибки, про IPC фенома и прочее.
Доказательства хотя бы в виде таблицы предоставь, а?

Какой ещё бред??? Про разницу в IPC ты не в курсе??? Про ошибки в работе юнитов fmac на AVX это моё личное ИМХО, раз уж исправляли ошибки в целочисленных блоках, то в данном случае дело явно похуже и требует серьёзной допилки.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Asilus писал(а):
Про разницу в IPC ты не в курсе???


Разница там из-за спаренности ядер. Однопоток емнип быстрее.

Asilus писал(а):
раз уж исправляли ошибки в целочисленных блоках


Пруф, такого я не видел.


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
devl547 писал(а):
Разница там из-за спаренности ядер. Однопоток емнип быстрее.

Это без сомнений, я везде указываю что ИМХО проблема начинается при склейке на полной нагрузке юнитов fmac. Могу конечно ошибаться, но дело явно не только в кэше.

devl547 писал(а):
Пруф, такого я не видел.

Выше же приводил. С обзора thg выдрал.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Asilus писал(а):
ИМХО проблема начинается при склейке на полной нагрузке юнитов fmac.


Разница между AVX128 и AVX256 в пределах 2-3%.

Asilus писал(а):
Выше же приводил. С обзора thg выдрал.


Что-то я там не увидел ошибок.

Добавлено спустя 1 час 27 минут 41 секунду:
А вот этого кадра я не видел. Кто что скажет насчет последнего пункта?
Правильно понимаю, что с повышением частоты и напруги у них TDP поднимается быстрее, чем у Richland?

#77


 

Member
Статус: Не в сети
Регистрация: 24.11.2007
Откуда: Самара
devl547 писал(а):
Разница между AVX128 и AVX256 в пределах 2-3%.

Хотите сказать и без склейки всё уныло? Это вряд ли) Из-за такой мелочи никто не стал бы заморачиваться. Я так понимаю между 256 и 512 тоже 2-3%?) Вероятно есть какие-то нюансы, возможно кое-что узнаем после релиза катка.

devl547 писал(а):
Что-то я там не увидел ошибок.

Шутки шутите? В теме же выкладывал.

"AMD обнаружила, что в некоторых случаях Bulldozer не мог обнаружить сохраненные данные в регистровом файле, которые там уже находились. После исправления, инструкции попадают в целочисленный блок быстрее."
А сколько ещё не обнаружила? Тем паче в более сложных задачах с плавучкой, ведь всю архитектуру перешили - ошибки просто неизбежны. Собственно главное чтобы их исправляли, во время.

devl547 писал(а):
Правильно понимаю, что с повышением частоты и напруги у них TDP поднимается быстрее, чем у Richland?

Возможно тот же эффект, что проявился у кристаллов Иви и Хасси. CPU часть стала плотнее, а GPU наоборот увеличилась.

К слову ходят упорные слухи, что там какой-то специфический контролер памяти, самые смелые утверждают что возможно уже реализована поддержка DDR4.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Asilus писал(а):
Шутки шутите? В теме же выкладывал.


Да, нашел эту информацию в оригинале.

Asilus писал(а):
там какой-то специфический контролер памяти


Я тоже на эту картинку наткнулся. С виду - 2 контроллера. Или спаренный. Или один для CPU, второй для GPU. Или хз что там вообще.


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 280 • Страница 14 из 14<  1 ... 10  11  12  13  14
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 14


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan