Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 70 • Страница 3 из 4<  1  2  3  4  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 01.06.2011
Откуда: Кривий Рiг UA
Фото: 1
mag_ai http://www.realworldtech.com/haswell-cpu/4/ тут интересная статья, расписали почему Хасвел теоретически вдвое быстрее Сандика, я даже расчувствовался (хотя ничерта не понял, если честно, кроме добавления способности считать целочисленные штучки в FPU у Хасвела)... а потом вспомнил, что на практике никто там и не увидел разницы в этих самых, игорЪях. Видимо, нужны всяческие целочисленные криптографии и прочие AVX2

_________________
По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif



Партнер
 

Member
Статус: Не в сети
Регистрация: 12.01.2005
Renegade1979 писал(а):
Видимо, нужны всяческие целочисленные криптографии и прочие AVX2

Ну циферок в линксе haswell всегда набирал почти в 2 раза больше, а толку, даже AVX1 бесполезен чуть менее, чем полностью. А из-за этой бесполезной лажы, в интел, якобы, меняли сокет с 1156 на 1155.

_________________
Солдатушки-ребятушки, нашему царю показали фигу. Умрём все до последнего!


 

Member
Статус: Не в сети
Регистрация: 16.03.2015
Откуда: Ванкувер
Renegade1979

Ну вот в демке system shock на новом unity5 многопоточность и одновременно мощность haswell проявляются :-)

#77

_________________
Люблю старые игры,старые машины,старое кино


 

Member
Статус: Не в сети
Регистрация: 01.06.2011
Откуда: Кривий Рiг UA
Фото: 1
mag_ai писал(а):
просто реально сложно бить игровой код на 8 потоков (в ядре по 2 алу) и поэтому 4 ядерники с 4 алу выигрывают
впрочем, обычно у нас же дх11, там все остальные потоки, даже если и набивают 8 ядер Вишеры, ждут исполнения основного рендерного потока. Нужно побольше тестов честного дх12, то есть не такого как в Гирзе и Квантум Шлаке, где один рендерный тред, а честного :D
prototype7 шо, опять 2600К усех нагнув? Ну хоть i5 бородатого года обогнали, это уже прогресс, учитывая что игра странным образом идёт лучше на двухмодульнике

_________________
По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif


 

Member
Статус: Не в сети
Регистрация: 16.03.2015
Откуда: Ванкувер
Renegade1979

Ну там альфа версия,среди амд странно конечно,но среди интелов реальный расклад хорошо показывает,3970 упал сразу когда новые инструкции работают :-) Причем там все 16 потоков используются
#77#77

_________________
Люблю старые игры,старые машины,старое кино


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Renegade1979 haswell заимел +1 алу на ядро плюсом к этому 128 битные авх расширили до 256 битных плюсом поработали над кешами и прибавим к этому более высокий частотный потенциал = в синтетики вполне может быть. в реальности я даже сейчас не знаю ни одной программы которая юзала авх но не использовала sse (то и то 128 битное в первой версии). загрузить четвертое алу в ядре не так просто поэтому прирост в старых (коими являются игры) приложениях рост будет символический - да стало лучше. вообще х86 топчется на месте уже много лет - и винда этому способствует ведь любое крупное изменение в ахритектуре это вероятней всего утрата совместимости "со старыми программными решениями". так что интел развивается в векторном плане и все...

Renegade1979 я не верю что апи может исправить положение - это абстракция слишком высокого уровня и если движок сам не может параллелить себя то ни одно апи за него это не сделает. массовый сегмент это 2-4 ядра и я вполне понимаю что можно повесить на 4 ядра в игре но я не переставляю что можно повесить на 6-10 ядер так что вероятней всего профита будет меньше чем кажется (игры все же не видеорендеры архиваторы и тд).

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 01.06.2011
Откуда: Кривий Рiг UA
Фото: 1
mag_ai писал(а):
и я вполне понимаю что можно повесить на 4 ядра в игре но я не переставляю что можно повесить на 6-10 ядер так что вероятней всего профита будет меньше чем кажется (игры все же не видеорендеры архиваторы и тд).
так оно ж очевидно, что дх12 у нас создан ради хвохопе, хотя бы ограничение в 6 ядер для рендерных потоков c этими пресловутыми draw calls, оно возникло не на пустом месте - ящику под игорЪи как раз 6 ядер и выделяют и не больше :D , и значит в дх12 играх это распараллеливание рендера можно будет встретить, может годом позже. Инструкции AVX и SSE там в яще, как и в Вишерах, уже пользуют, а AVX2 ещё нет. Посему Фенумы уже могут и выкинуть даже из минималок (MGS V до патчей, было дело), а сандики, ежели не сгорят до 2021го, будут как минимум тащить базовый функционал кривых портов, прогресса в игорЪях не будет. Особенно понравился Вулкантуз - ограничение в 16 ядер на потоки рендера, почему 16? потому что у процессоров АМД сроду не было больше 16 ядер, даже в Оптеронах :D . Владельцы рабстанций на зионах/квадро негодуэ. Впрочем, всё ж лучше, чем ОпенПД в один поток

_________________
По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif


 

Member
Статус: Не в сети
Регистрация: 16.03.2015
Откуда: Ванкувер
Renegade1979

Да даже нехалем/блумфилд будут спокойно работать пока не сгорят :-)

_________________
Люблю старые игры,старые машины,старое кино


 

Member
Статус: Не в сети
Регистрация: 02.05.2008
Откуда: скрепы
Фото: 54
prototype7
Мда...проц за 15т = процу за 120т.Где-то нас обманывают

_________________
Запахло рывком.....


 

Member
Статус: Не в сети
Регистрация: 16.03.2015
Откуда: Ванкувер
Ecowar

Ну там и i3 haswell очень хорошо работает,видимо в движке avx2 инструкции :-) А так там выходит i5 haswell=i7 haswell(8 ядерный)что говорит о том что 4 ядер достаточно ;)

_________________
Люблю старые игры,старые машины,старое кино


 

Member
Статус: Не в сети
Регистрация: 01.06.2011
Откуда: Кривий Рiг UA
Фото: 1
prototype7 писал(а):
Ну там и i3 haswell очень хорошо работает,видимо в движке avx2 инструкции :-)
:D это всё равно никак не отменяет того факта, что i3 у нас всего с двумя ядрами и соотв. позорная затычка, пусть это для офиса берут. Реализацию гипертрединга придумали ещё IBM, берём второй счётчик инструкций и добавляем туда регистров. Ядро может исполнять второй тред только при условии, что конвейер первого треда простаивает, а он там может быть в 30 стадий и разумеется 10-20% времени простаивает, по теории вероятности даже. Вдобавок тут ничего сверхъестественного, Хуанг давно юзает гипертрединг у себя в варп-планировщиках, с тех пор как мидловым Ферми выдали 2 диспетчера инструкций, вкупе с 24 ядра на планировщик. Лишние 8 ядрей, разумеется в GF100/110 были блоками двойной точности. В итоге даже не меняя дизайна GF114, его тупо умножают в длину и ширину и в Кеплер GK110 они попали как лишние ядра на варп-планировщик (48 штук), рядом с DP блоками, видимо никто не заметил что они лишние. Первое правило Зелёной Жабы - всегда режьте DP, продадите отдельно, за 400 баксов. Второе правило - всегда проектируйте старшие чипы из мидловых, так дешевле. Подумаешь, тыква будет и греется, зато можно экономить на R&D :lol: . И эти два диспетчера инструкций хоть как-то их вытягивали, но не особо, нужно на такт планировщика раздать инструкций на полтора варпа, что практически нереально, если только там не простаивает половина конвейера на всех тредах сразу :D

_________________
По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif


 

Member
Статус: Не в сети
Регистрация: 05.04.2012
Откуда: Брест
Mekanika писал(а):
В буле тоже в 2 раза было ... "и чо?" (с)

И то, что буль до сих пор актуален в отличии от Фенов!


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
GydruS писал(а):
даже отклик UI у программ был медленнее, чем на 8 и старше.


Я бы сказал, что это из-за допила кода винды, а не из-за распределения потоков.


 

Member
Статус: Не в сети
Регистрация: 13.12.2005
Фото: 6
sp0911 писал(а):
Кто-то не читает или не думает?Линукс и т.п. же там живет.

В сетевом и коммуникационном оборудовании? На микротиках что ли? :lol:
Там скорее IOS, JUNOS, Comware и т.п. И ASIC'и там, не x86.
В домашнем и бюджетном сегменте да, роутеры работают на линуксе, но там MIPS/ARM.
Сетевые решения на x86 есть, но, насколько мне известно, это довольно узкая ниша.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
SmaSheR писал(а):
Там скорее IOS, JUNOS, Comware и т.п. И ASIC'и там, не x86.


Ну так этот процессор и не для роутеров.


 

Member
Статус: Не в сети
Регистрация: 14.01.2006
Откуда: Екатеринбург
SmaSheR Ага... только вот как показывает практика использования тех же Т1/Т2 (моя личная практика), проблема x86 не в том, что набор команд x86 и структура не переопределяемая... например, на этом долбаном спарке, время работает куда четче, чем на x86. А наладить приемлемое время используя какой-то высокоуровневый гипервизор, когда и ядро и дхцп и ипсек соски в одной машине просто не возможно :( А на санке, которая нифига не плиска всё работает, как часы. Если АМД чем-то таким вдохновится - они займут нишу, в которой пока никого нет. А если это кому-то надо - они (амд) выиграют.

Ну и по асикам, не надо тоже путать теплое с мягким. Когда говорят Xilinx, обычно думают что там пвм и всё... а то, что там может случиться несколько ppc или arm ядер, как-то остаётся за кадром :)


 

Member
Статус: Не в сети
Регистрация: 04.06.2004
Renegade1979 писал(а):
8 FPU нужно для игорЪ, практически всё отсылаемое на GPU у нас числа в формате FP32

ну-ну, насколько сильно нужно?
взять тот же донедавна однопоточный WoT (которому ничего не мешало юзать весь FPU модуля целиком) - почему же он на бульдозерах так тупил-то? :)

N1ghtwish писал(а):
Они и nehalem не смогли обойти!

в кривых однопоточных портах - да. во сколь-либо параллелящихся целочисленных задачах - на ура натягивали сэндики i5...
prototype7 писал(а):
Ну там и i3 haswell очень хорошо работает,видимо в движке avx2 инструкции

и, видимо, кол-во потоков в движке равно трем, максимум - четырем...

prototype7 писал(а):
то говорит о том что 4 ядер достаточно

для конкретного игрового движка - да.

SmaSheR писал(а):
Сетевые решения на x86 есть, но, насколько мне известно, это довольно узкая ниша.

пффф... даже циски есть на х86 (ASA если не ошибаюсь).


 

Member
Статус: Не в сети
Регистрация: 13.12.2005
Фото: 6
NiTr0 писал(а):
пффф... даже циски есть на х86 (ASA если не ошибаюсь).

И верно, ASA, по крайней мере, последние - на Intel'овских камнях. С ASA я работал только через третьи руки. У Juniper, кстати, тоже есть х86 фаерволл.
Значит в фаерволлах эти камни могут пригодиться. Но откажутся ли вендоры от Интела в пользу АМД? Лоуэнд решения - на атомах, а там где мощность Совы может пригодиться, цена на камень имеет небольшое значение.


 

Member
Статус: Не в сети
Регистрация: 28.03.2016
N1ghtwish писал(а):
Ну циферок в линксе haswell всегда набирал почти в 2 раза больше, а толку, даже AVX1 бесполезен чуть менее, чем полностью. А из-за этой бесполезной лажы, в интел, якобы, меняли сокет с 1156 на 1155.

Не бесполезен он. Что первая, что вторая итерация - архиполезные вещи. беда в другом - ни один сегодняшний компилятор не в состоянии генерировать SIMD-ориентированный код. Т.е. для использования векторных операций их приходится прописывать на низкоуровневых вставках.
Если серьезно взглянуть на эволюцию х86 процессоров, то становится понятно, что "скачки в производительности" сейчас в архитектурном плане возможны только с неудачных решений. Возможно, ещё есть некий потенциал у декодеров. Не планировщиков - там уже большая часть возможного выработана, а именно у декодеров. Но упирается все, как всегда, в возможности преобразования кода. А пока что это никто не решил. И дальнейшее нараживание мускулов - добавление ALU общего(как в Хасвелл) и векторного типа, их преобразования и т.д. многого не дадут. Все банально упирается в код. Который не может загрузить все исполнительные юниты. И HT тут не панацея. А, в основном, костыль (хотя для вэб-серверов и подобных с невысокой нагрузкой на одно ядро это огромный плюс).

daigoro - иди в ближайший курятник и кукарекай там. Там тебя оценят. А тут нужно понимание, которого у тебя даже близко нет.


 

Member
Статус: Не в сети
Регистрация: 14.01.2006
Откуда: Екатеринбург
Nimrael Декодер.... ага, найдите какую-нибудь толковую ветку по влив, там примерно те же блок баги :) и в риск тоже... сначала делали всё чтобы упростить разработку компиляторов и ПО, потом, заоптимизировали получившуюся абстракцию, теперь опять к истокам... с отворотами к плис и пр. Счастья нигде нет, не только на х86

SmaSheR а еще асики не любит EMC... у них именно в стораджной составляющей только хба + цпу. Так что, если в вбрик положить 32 потока и 100W - получится оченно даже ничего :)


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 70 • Страница 3 из 4<  1  2  3  4  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 6


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan