Member
Статус: Не в сети Регистрация: 19.08.2010 Откуда: Прямо оттуда! Фото: 0
Т.к. в темеWindows 10 обсуждение DirectX 12 является офтопиком, пишем о нём и будущих играх с ним здесь. ******************************************************************************************** О самом DirectX 12 и его "Feature Levels" (какие ВК и какой уровень DirectX 12 поддерживают). Анонсированные игры: "Gears of War: Ultimate Edition (2016)" и "Deus Ex: Mankind Divided". Более полный список: "Список игр с DirectX 12" (немецкий язык, но нужная табличка и так понятна). ************************************************************************************* Одна "Игра в раннем доступе" уже вышла: "Ashes of the Singularity" (Steam). FPS у DirectX 12 примерно в 2 раза выше по сравнению с DirectX 11:
Ashes of the Singularity: DX11 vs DX12 Benchmarks by DigitalFoundry (видео):
Другой тест от GameGPU - в нём прирост всего около 5%. В общем пока всё неясно, и сама игра очень "сырая", её статус на 22.03.2016 - Beta. ************************************************************************* "Правила хорошего тона" (Локальные Правила) этой темы:
ЧИТАЕМ, ПРЕЖДЕ ЧЕМ ПИСАТЬ!:
1) Для начала ознакомиться с Правилами Конференции. 2) Категорически запрещается использовать красный цвет в сообщениях - оставьте его для Модераторов и Куратора! Рекомендуется также не злоупотреблять остальными цветами. 3) Все односложные сообщения (типа: "Аналогично", "+1...", "У меня также") будут стираться без предупреждений. 4) "Шапка" темы будет исправляться как можно быстрее. Куратор всегда в курсе всех изменений. Уважайте и цените труд Куратора - не подгоняйте его! 5) Обсуждение действий Куратора в теме не допускаются! Для этого есть ЛС (Личные сообщения). Прежде, чем написать - советую всё обдумать. "Дыма без огня не бывает!" 6) Предложения и вопросы по "шапке" и FAQ темы принимаются в ЛС (Личные сообщения). В самой теме этого делать не нужно. Спасибо за понимание!
Последний раз редактировалось Alex_Smile 22.03.2016 12:08, всего редактировалось 18 раз(а).
обновление статуса игры "Ashes of the Singularity"
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
ultrafx писал(а):
Парни, а че за АСЕ? Не пойму че-то.
Asynchronous Compute Engine. Если очень и очень грубо - можно представить потоковые процессоры видяхи как исполняющие устройства обычного процессора. Тогда видяха с 8 ACE по сути есть 1 мощное ядро с гипертредингом на 8 потоков.
Member
Статус: Не в сети Регистрация: 26.06.2013 Откуда: Минск Фото: 1
ultrafx писал(а):
То есть ACE - это такой аппаратный Hyper-Threading, который на входе распараллеливает поток на уже обычные шейдерные блоки?
Не совсем . Точнее - весь DirectX от 1 до 11 включительно ,работал только последовательно,т.е выстраивалась очень длинная последовательность коротких команд для обработки , и эта последовательность требовала уйму времени (по компьютерным меркам ) .Вспоминается ситуация с Феномом 2 , тогда разразился скандал, как оказалось - винда в упор не видела блоки SSE у Феномов (которые у них разумеется были ),а запускала вместо этого исполнительный код прямо на главный конвейер , в обход ускорительных блоков ,который естественно обрабатывал всё это в разы медленнее.После этого скандала Интел нехотя выпустила костыльный патч ,который устранял это , но этот патч был реализован именно через DX11 !!!! Т.е опять же длинная череда коротких команд , оптимизированных под архитектуру Интел . Так вот эти блоки АСЕ позволяют выполнять параллельную обработку команд вместо одной длиннющей последовательной - что может значительно ускорить их обработку ( в зависимости от кол-ва блоков, причем каждый блок и ещё может обрабатывать 8 независимых очередей команд ). Ведь DX 11 не допускает одновременный запуск многочисленных задач - только последовательно,т.е называется ждите своей очереди ). Для сравнения - это как если бы вода вытекала из емкости не через одну дырочку .а уже через 8 , т.е ускорение работы должно быть значительным.Но есть один нюанс - программный код для этого должен быть оптимизирован ,т.е распараллелен, поэтому на неоптимизированом коде ускорения не будет ,что мы сейчас и наблюдаем . А вот что там собралась включать Нвидиа посредством драйвера (блоки АСЕ ) в своих видеоадаптерах ,мне совершенно непонятно - нельзя включить то чего нет )). Рекомендую почитать для развития http://www.ixbt.com/cpu/via-nano-cpuid-fake.shtml
То есть ACE - это такой аппаратный Hyper-Threading,
ace - это ядра, a queues - это Hyper-Threading. У амд сейчас 8 aces по 8 queues каждый. У нвидии, эм... две трубы, так скажем, первая - это 1 мощный графический поток, через который всё сейчас идёт, и вторая, 1 поток у которого 32 queus. Вторая труба не активна сейчас. В играх никак не используется. Тесты показывают, что при низкой нагрузки asynchronous computing, нвидия рвёт в клочья всё, включая амд. При большой нагрузке asynchronous computing, амд вырывается вперёд и показывает отличные результаты, а нвидия ну, можно сказать, перестаёт работать Вот тут подробно всё: http://www.extremetech.com/extreme/2135 ... now-so-far
Соответсвенно, у амд сейчас 64 потока (8х8), а у нвидии 32 (32х1, основная труба видимо при этом вообще не используется, иначе было бы 33. 32х1+1, ну не суть важно.)
Вопрос будут ли игры на 64 потока и когда их сделают?
Я вот лично предполагаю, что в индустрии будет стандарт - 8-16 потоков. По аналогии с количеством потоков в процессоре приставки. какая связь с процессором? Никакой, но какая то упорядоченная логика должна же быть? Просто, чем больше потоков в игре тем больше работы над ней, как я понимаю.
_________________ Sitronix - Господин Полковник Sitronix _____________________________ 9800X3D@5.2ГГц фикс, 8.5 часов Prime95 Small FFTs stable, 32Гб + RTX 4090
Мемbеr
Статус: Не в сети Регистрация: 15.12.2006 Откуда: оттуда Фото: 71
Я просто не совсем понимаю, какая взаимосвязь между ACE и обычными шейдерными конвейерами. Выполняют они одинаковые задачи? Ну, допустим, ACE такой крутой и может выполнять 8 операций сразу, 64, ок. Но шейдерных конвейеров тысячи. Тысячи против 64? Я сначала подумал, что ACE просто грамотно распараллеливают задачи по тысячам стандартных шейдерных конвейеров, а теперь не понимаю, если ACE сам выполняет операции, пусть эффективно, но их же всего восемь.
_________________ Я дрочистый изумруд Core i3-12100F // 32GB XPG GAMMIX D20 // RTX 5060 Ti 16GB MSI INSPIRE 2X OC // LG 24GS60F @180Hz G-Sync
Ну вот, это следующий этап маркетинговое впаривания. У нас теперь 10 асе! а теперь 20, а теперь мы сделали 45 и 64гб видеопамяти, а теперь 115 асе по 16 потоков каждый и 128гб видеопамяти эта карта будет рвать всё включая Доом 7 и Масс Эффект 6:Дневники Лиары!
_________________ Sitronix - Господин Полковник Sitronix _____________________________ 9800X3D@5.2ГГц фикс, 8.5 часов Prime95 Small FFTs stable, 32Гб + RTX 4090
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
ultrafx писал(а):
Я сначала подумал, что ACE просто грамотно распараллеливают задачи по тысячам стандартных шейдерных конвейеров
И это было правильно, ACE только распределяют работу, причём только компьют работу. Все графические задачи идут через традиционный планировщик, так же, как и компьют задачи, находящиеся в графической очереди( не являющиеся асинхронными ) Не знаю, откуда люди цифры берут, насколько я знаю, GCN 1.0 - 2 ACE, максимум по одной очереди на каждый GCN 1.1 - 8 ACE, максимум 8 очередей на каждый GCN 1.2 - 4 ACE + 2 HWS NVIDIA pre-Maxwell v.2 1 графическая очередь, либо 32 компьют NVIDIA Maxwell v.2 1 графическая очередь + 31 компьют, либо 32 компьют
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
Dreamlike писал(а):
Это еще что такое?
Я не встречал подробной информации, вроде как они их используют для распределения нагрузки, поступающей из разных приложений 1 HWS может выполнять функционал 2х ACE, так что АМД часто и обозначают на диаграммах 8 ACE для GCN 1.2
Как-то так в хитмане : DX11 Benchmark Results: ---- CPU ---- 5108 frames 44.83fps Average 7.22fps Min 201.06fps Max 22.31ms Average 4.97ms Min 138.41ms Max
DX12 Benchmark Results: ---- CPU ---- 5310 frames 46.58fps Average 8.00fps Min 210.62fps Max 21.47ms Average 4.75ms Min 125.03ms Max ---- GPU ---- 5305 frames 46.64fps Average 3.05fps Min 88.07fps Max 21.44ms Average 11.36ms Min 328.01ms Max
Member
Статус: Не в сети Регистрация: 22.07.2007 Откуда: г.Новокузнецк
ultrafx писал(а):
Я сначала подумал, что ACE просто грамотно распараллеливают задачи по тысячам стандартных шейдерных конвейеров, а теперь не понимаю, если ACE сам выполняет операции, пусть эффективно, но их же всего восемь.
АМД выкладывала летом, как работает эта муть с асинхронными шейдерами. Там вся муть в том, что при однопоточной работе, там все действия выполняются строго последовательно. Ну там закраска сцены, шейдерные расчёты, и многое другое. И если какой-то расчёт выполняется долго, это тормозит всю работу в целом. А с асинхронными, там каждый блок сразу обрабатывает свою задачу, не дожидаясь когда там другой блок сделает свою работу. А потом результаты сразу идут в построение кадра. Хотя они в любом случае не избавляют от самых узких мест. В общем задача этих асинхронных шейдеров распараллеливать работу, загружая все блоки сразу, а не по очереди.
Мемbеr
Статус: Не в сети Регистрация: 15.12.2006 Откуда: оттуда Фото: 71
<TopUpdate> Это все понятно было изначально. Я лишь не мог понять (потому что каждый говорит по-своему), чем именно является ACE - исполнительным конвейером или умным планировщиком. То есть вопрос сам по себе состоял в том, что ACE либо сам эффективно исполняет команды, либо параллельно их распределяет по стандартным шейдерным конвейерам, коих в современных видеокартах тысячи.
А эту картинку уже давным-давно все видели.
#77
_________________ Я дрочистый изумруд Core i3-12100F // 32GB XPG GAMMIX D20 // RTX 5060 Ti 16GB MSI INSPIRE 2X OC // LG 24GS60F @180Hz G-Sync
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 10
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения