Member
Статус: Не в сети Регистрация: 19.08.2010 Откуда: Прямо оттуда! Фото: 0
Т.к. в темеWindows 10 обсуждение DirectX 12 является офтопиком, пишем о нём и будущих играх с ним здесь. ******************************************************************************************** О самом DirectX 12 и его "Feature Levels" (какие ВК и какой уровень DirectX 12 поддерживают). Анонсированные игры: "Gears of War: Ultimate Edition (2016)" и "Deus Ex: Mankind Divided". Более полный список: "Список игр с DirectX 12" (немецкий язык, но нужная табличка и так понятна). ************************************************************************************* Одна "Игра в раннем доступе" уже вышла: "Ashes of the Singularity" (Steam). FPS у DirectX 12 примерно в 2 раза выше по сравнению с DirectX 11:
Ashes of the Singularity: DX11 vs DX12 Benchmarks by DigitalFoundry (видео):
Другой тест от GameGPU - в нём прирост всего около 5%. В общем пока всё неясно, и сама игра очень "сырая", её статус на 22.03.2016 - Beta. ************************************************************************* "Правила хорошего тона" (Локальные Правила) этой темы:
ЧИТАЕМ, ПРЕЖДЕ ЧЕМ ПИСАТЬ!:
1) Для начала ознакомиться с Правилами Конференции. 2) Категорически запрещается использовать красный цвет в сообщениях - оставьте его для Модераторов и Куратора! Рекомендуется также не злоупотреблять остальными цветами. 3) Все односложные сообщения (типа: "Аналогично", "+1...", "У меня также") будут стираться без предупреждений. 4) "Шапка" темы будет исправляться как можно быстрее. Куратор всегда в курсе всех изменений. Уважайте и цените труд Куратора - не подгоняйте его! 5) Обсуждение действий Куратора в теме не допускаются! Для этого есть ЛС (Личные сообщения). Прежде, чем написать - советую всё обдумать. "Дыма без огня не бывает!" 6) Предложения и вопросы по "шапке" и FAQ темы принимаются в ЛС (Личные сообщения). В самой теме этого делать не нужно. Спасибо за понимание!
Последний раз редактировалось Alex_Smile 22.03.2016 12:08, всего редактировалось 18 раз(а).
обновление статуса игры "Ashes of the Singularity"
Advanced guest
Статус: Не в сети Регистрация: 03.12.2004
Ну в CUDA набор чуть поболее, чем в ARB каком-нибудь, особенно начиная с кеплера. Но база типа ADD и MUL никуда не транслируется и на вагон внутренних операций не раскидывается. Сама nvidia кстати, не рекомендует писать программы CUDA на ассемблере, команды там больше для справки (полезно при отладке).
_________________ Unfortunately for you, however, you are maidenless
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
4e_alex писал(а):
Но на деле поддерживают, и никакой трансляции нет. Можешь сходить почитать доки про CUDA, там есть списки инструкций, которые считалки поддерживают напрямую.
А вы сами их сравнивали? В шейдерном ассемблере OGL есть инструкция POW - exponentiate, попробуйти найти её среди нативных инструкций. Я даже время не хочу тратить чтобы сранивать эти наборы инструкций и искать, каких ещё нет
4e_alex писал(а):
Речь шла о векторных ALU
4e_alex писал(а):
до какого-то поколения эти гении и вовсе использовали 5-мерные считалки, хотя в графике 4 канала всегда было, т.е. прямо на уровне архитектуры был заложен 20% недозагруз математики, это не считая потери на 1- и 2-мерных вычислениях
Речь идёт про VLIW
4e_alex писал(а):
Главное получить близкую (даже не идентичную) к нему картинку. Нет никаких спецификаций на модификацию кода драйвером. Если есть, то прошу предоставить ссылку.
Сколько ссылок вы сами предоставили, вы терпение что ли проверяете? Приведите ссылку, подтверждающую ваши слова
Добавлено спустя 3 минуты 58 секунд:
4e_alex писал(а):
Но база типа ADD и MUL никуда не транслируется
Поинт изначально был в том, что шейдерный ассемблер - это IR, который видеокарта не выполняет, драйвер обязан его транслировать в хардвейр-специфик. Это вы сказали что
Advanced guest
Статус: Не в сети Регистрация: 03.12.2004
Industrialice писал(а):
А вы сами их сравнивали? В шейдерном ассемблере OGL есть инструкция POW - exponentiate, попробуйти найти её среди нативных инструкций. Я даже время не хочу тратить чтобы сранивать эти наборы инструкций и искать, каких ещё нет
Сравнивал. Конечно 100% совпадения нет. ALU - примитивное устройство. Учить его делать сложные и редкие функции типа POW себе дороже, неоправданный расход транзисторов. Такое просто разбивается в последовательность более простых инструкций. Можешь назвать это трансляцией, но твой "поинт" был изначально в том, что драйвер вынужден так делать на каждой операции, а это даже близко не так. Нет никакого супер-секретного аппаратного кода, вынуждающего даже простой ADD транслировать в что-то типа this_is_my_super_awesome_hardware_opcode_i_created_just_to_confuse_everyone_nv_maxwell_2_cc_5_1
Industrialice писал(а):
Речь идёт про VLIW
Речь про ALU (aka считалки) и SIMD (5-мерные). Я в курсе, что там когда-то еще и VLIW5 был, который к SIMD вообще никаким боком (может разве что сочетаться, работая на уровне выше него). Про этот бред, требующий нефиговой обработки любого кода напильником в драйвере, можно вообще не вспоминать.
Industrialice писал(а):
Сколько ссылок вы сами предоставили, вы терпение что ли проверяете? Приведите ссылку, подтверждающую ваши слова
Слив засчитан. Не может быть спецификаций на внутреннюю работу драйвера. Может быть только на соответствие выхода ожидаемому результату.
Добавлено спустя 2 минуты 33 секунды:
Industrialice писал(а):
Поинт изначально был в том, что шейдерный ассемблер - это IR, который видеокарта не выполняет, драйвер обязан его транслировать в хардвейр-специфик. Это вы сказали что
Уходя в глубь можно вообще докопаться до того, что 2+2 просто так не сложить, их еще надо как-то доставить, а потом куда-то положить. Да и саму команду надо еще до ALU доставить. Но мы в такие дебри лезть не будем, речь только о работе на уровне считалки в вакууме.
Добавлено спустя 37 минут 27 секунд: Сейчас погуглил по старым архитектурам. У ATI 5-мерный ALU использовался как минимум в серии R5xx (X1xxx), но хотя бы умел считать 2 операции по схеме 4+1 (нужно очень часто из-за альфа-канала). NV к тому времени давно умела делать на одном векторном ALU 2 разные операции по любой схеме разделения компонент.
_________________ Unfortunately for you, however, you are maidenless
а есть приложения, в которых бы была видна разница между 12 и 11 Директом
dolphin emulator, прирост до 30% в зависимости от игры и сцены. Например: https://youtu.be/OE-HA-IZEWU?t=19m48s А если ты про визуальную разницу, то нет.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 32
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения