Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
mag_aihttp://www.realworldtech.com/haswell-cpu/4/ тут интересная статья, расписали почему Хасвел теоретически вдвое быстрее Сандика, я даже расчувствовался (хотя ничерта не понял, если честно, кроме добавления способности считать целочисленные штучки в FPU у Хасвела)... а потом вспомнил, что на практике никто там и не увидел разницы в этих самых, игорЪях. Видимо, нужны всяческие целочисленные криптографии и прочие AVX2
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Видимо, нужны всяческие целочисленные криптографии и прочие AVX2
Ну циферок в линксе haswell всегда набирал почти в 2 раза больше, а толку, даже AVX1 бесполезен чуть менее, чем полностью. А из-за этой бесполезной лажы, в интел, якобы, меняли сокет с 1156 на 1155.
_________________ Солдатушки-ребятушки, нашему царю показали фигу. Умрём все до последнего!
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
mag_ai писал(а):
просто реально сложно бить игровой код на 8 потоков (в ядре по 2 алу) и поэтому 4 ядерники с 4 алу выигрывают
впрочем, обычно у нас же дх11, там все остальные потоки, даже если и набивают 8 ядер Вишеры, ждут исполнения основного рендерного потока. Нужно побольше тестов честного дх12, то есть не такого как в Гирзе и Квантум Шлаке, где один рендерный тред, а честного prototype7 шо, опять 2600К усех нагнув? Ну хоть i5 бородатого года обогнали, это уже прогресс, учитывая что игра странным образом идёт лучше на двухмодульнике
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Member
Статус: Не в сети Регистрация: 16.03.2015 Откуда: Ванкувер
Renegade1979
Ну там альфа версия,среди амд странно конечно,но среди интелов реальный расклад хорошо показывает,3970 упал сразу когда новые инструкции работают Причем там все 16 потоков используются
#77#77
_________________ Люблю старые игры,старые машины,старое кино
Member
Статус: Не в сети Регистрация: 23.02.2013 Откуда: г. Орел
Renegade1979 haswell заимел +1 алу на ядро плюсом к этому 128 битные авх расширили до 256 битных плюсом поработали над кешами и прибавим к этому более высокий частотный потенциал = в синтетики вполне может быть. в реальности я даже сейчас не знаю ни одной программы которая юзала авх но не использовала sse (то и то 128 битное в первой версии). загрузить четвертое алу в ядре не так просто поэтому прирост в старых (коими являются игры) приложениях рост будет символический - да стало лучше. вообще х86 топчется на месте уже много лет - и винда этому способствует ведь любое крупное изменение в ахритектуре это вероятней всего утрата совместимости "со старыми программными решениями". так что интел развивается в векторном плане и все...
Renegade1979 я не верю что апи может исправить положение - это абстракция слишком высокого уровня и если движок сам не может параллелить себя то ни одно апи за него это не сделает. массовый сегмент это 2-4 ядра и я вполне понимаю что можно повесить на 4 ядра в игре но я не переставляю что можно повесить на 6-10 ядер так что вероятней всего профита будет меньше чем кажется (игры все же не видеорендеры архиваторы и тд).
_________________ Мертвый киберпанк с улыбкой мутанта... (:
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
mag_ai писал(а):
и я вполне понимаю что можно повесить на 4 ядра в игре но я не переставляю что можно повесить на 6-10 ядер так что вероятней всего профита будет меньше чем кажется (игры все же не видеорендеры архиваторы и тд).
так оно ж очевидно, что дх12 у нас создан ради хвохопе, хотя бы ограничение в 6 ядер для рендерных потоков c этими пресловутыми draw calls, оно возникло не на пустом месте - ящику под игорЪи как раз 6 ядер и выделяют и не больше , и значит в дх12 играх это распараллеливание рендера можно будет встретить, может годом позже. Инструкции AVX и SSE там в яще, как и в Вишерах, уже пользуют, а AVX2 ещё нет. Посему Фенумы уже могут и выкинуть даже из минималок (MGS V до патчей, было дело), а сандики, ежели не сгорят до 2021го, будут как минимум тащить базовый функционал кривых портов, прогресса в игорЪях не будет. Особенно понравился Вулкантуз - ограничение в 16 ядер на потоки рендера, почему 16? потому что у процессоров АМД сроду не было больше 16 ядер, даже в Оптеронах . Владельцы рабстанций на зионах/квадро негодуэ. Впрочем, всё ж лучше, чем ОпенПД в один поток
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Member
Статус: Не в сети Регистрация: 16.03.2015 Откуда: Ванкувер
Ecowar
Ну там и i3 haswell очень хорошо работает,видимо в движке avx2 инструкции А так там выходит i5 haswell=i7 haswell(8 ядерный)что говорит о том что 4 ядер достаточно
_________________ Люблю старые игры,старые машины,старое кино
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
prototype7 писал(а):
Ну там и i3 haswell очень хорошо работает,видимо в движке avx2 инструкции
это всё равно никак не отменяет того факта, что i3 у нас всего с двумя ядрами и соотв. позорная затычка, пусть это для офиса берут. Реализацию гипертрединга придумали ещё IBM, берём второй счётчик инструкций и добавляем туда регистров. Ядро может исполнять второй тред только при условии, что конвейер первого треда простаивает, а он там может быть в 30 стадий и разумеется 10-20% времени простаивает, по теории вероятности даже. Вдобавок тут ничего сверхъестественного, Хуанг давно юзает гипертрединг у себя в варп-планировщиках, с тех пор как мидловым Ферми выдали 2 диспетчера инструкций, вкупе с 24 ядра на планировщик. Лишние 8 ядрей, разумеется в GF100/110 были блоками двойной точности. В итоге даже не меняя дизайна GF114, его тупо умножают в длину и ширину и в Кеплер GK110 они попали как лишние ядра на варп-планировщик (48 штук), рядом с DP блоками, видимо никто не заметил что они лишние. Первое правило Зелёной Жабы - всегда режьте DP, продадите отдельно, за 400 баксов. Второе правило - всегда проектируйте старшие чипы из мидловых, так дешевле. Подумаешь, тыква будет и греется, зато можно экономить на R&D . И эти два диспетчера инструкций хоть как-то их вытягивали, но не особо, нужно на такт планировщика раздать инструкций на полтора варпа, что практически нереально, если только там не простаивает половина конвейера на всех тредах сразу
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Member
Статус: Не в сети Регистрация: 13.12.2005 Фото: 6
sp0911 писал(а):
Кто-то не читает или не думает?Линукс и т.п. же там живет.
В сетевом и коммуникационном оборудовании? На микротиках что ли? Там скорее IOS, JUNOS, Comware и т.п. И ASIC'и там, не x86. В домашнем и бюджетном сегменте да, роутеры работают на линуксе, но там MIPS/ARM. Сетевые решения на x86 есть, но, насколько мне известно, это довольно узкая ниша.
Member
Статус: Не в сети Регистрация: 14.01.2006 Откуда: Екатеринбург
SmaSheR Ага... только вот как показывает практика использования тех же Т1/Т2 (моя личная практика), проблема x86 не в том, что набор команд x86 и структура не переопределяемая... например, на этом долбаном спарке, время работает куда четче, чем на x86. А наладить приемлемое время используя какой-то высокоуровневый гипервизор, когда и ядро и дхцп и ипсек соски в одной машине просто не возможно А на санке, которая нифига не плиска всё работает, как часы. Если АМД чем-то таким вдохновится - они займут нишу, в которой пока никого нет. А если это кому-то надо - они (амд) выиграют.
Ну и по асикам, не надо тоже путать теплое с мягким. Когда говорят Xilinx, обычно думают что там пвм и всё... а то, что там может случиться несколько ppc или arm ядер, как-то остаётся за кадром
8 FPU нужно для игорЪ, практически всё отсылаемое на GPU у нас числа в формате FP32
ну-ну, насколько сильно нужно? взять тот же донедавна однопоточный WoT (которому ничего не мешало юзать весь FPU модуля целиком) - почему же он на бульдозерах так тупил-то?
N1ghtwish писал(а):
Они и nehalem не смогли обойти!
в кривых однопоточных портах - да. во сколь-либо параллелящихся целочисленных задачах - на ура натягивали сэндики i5...
prototype7 писал(а):
Ну там и i3 haswell очень хорошо работает,видимо в движке avx2 инструкции
и, видимо, кол-во потоков в движке равно трем, максимум - четырем...
prototype7 писал(а):
то говорит о том что 4 ядер достаточно
для конкретного игрового движка - да.
SmaSheR писал(а):
Сетевые решения на x86 есть, но, насколько мне известно, это довольно узкая ниша.
пффф... даже циски есть на х86 (ASA если не ошибаюсь).
Member
Статус: Не в сети Регистрация: 13.12.2005 Фото: 6
NiTr0 писал(а):
пффф... даже циски есть на х86 (ASA если не ошибаюсь).
И верно, ASA, по крайней мере, последние - на Intel'овских камнях. С ASA я работал только через третьи руки. У Juniper, кстати, тоже есть х86 фаерволл. Значит в фаерволлах эти камни могут пригодиться. Но откажутся ли вендоры от Интела в пользу АМД? Лоуэнд решения - на атомах, а там где мощность Совы может пригодиться, цена на камень имеет небольшое значение.
Ну циферок в линксе haswell всегда набирал почти в 2 раза больше, а толку, даже AVX1 бесполезен чуть менее, чем полностью. А из-за этой бесполезной лажы, в интел, якобы, меняли сокет с 1156 на 1155.
Не бесполезен он. Что первая, что вторая итерация - архиполезные вещи. беда в другом - ни один сегодняшний компилятор не в состоянии генерировать SIMD-ориентированный код. Т.е. для использования векторных операций их приходится прописывать на низкоуровневых вставках. Если серьезно взглянуть на эволюцию х86 процессоров, то становится понятно, что "скачки в производительности" сейчас в архитектурном плане возможны только с неудачных решений. Возможно, ещё есть некий потенциал у декодеров. Не планировщиков - там уже большая часть возможного выработана, а именно у декодеров. Но упирается все, как всегда, в возможности преобразования кода. А пока что это никто не решил. И дальнейшее нараживание мускулов - добавление ALU общего(как в Хасвелл) и векторного типа, их преобразования и т.д. многого не дадут. Все банально упирается в код. Который не может загрузить все исполнительные юниты. И HT тут не панацея. А, в основном, костыль (хотя для вэб-серверов и подобных с невысокой нагрузкой на одно ядро это огромный плюс).
daigoro - иди в ближайший курятник и кукарекай там. Там тебя оценят. А тут нужно понимание, которого у тебя даже близко нет.
Member
Статус: Не в сети Регистрация: 14.01.2006 Откуда: Екатеринбург
Nimrael Декодер.... ага, найдите какую-нибудь толковую ветку по влив, там примерно те же блок баги и в риск тоже... сначала делали всё чтобы упростить разработку компиляторов и ПО, потом, заоптимизировали получившуюся абстракцию, теперь опять к истокам... с отворотами к плис и пр. Счастья нигде нет, не только на х86
SmaSheR а еще асики не любит EMC... у них именно в стораджной составляющей только хба + цпу. Так что, если в вбрик положить 32 потока и 100W - получится оченно даже ничего
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 6
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения