Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 1757 • Страница 81 из 88<  1 ... 78  79  80  81  82  83  84 ... 88  >
  Версия для печати (полностью) Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 
Прилепленное (важное) сообщение

Member
Статус: Не в сети
Регистрация: 19.08.2010
Откуда: Прямо оттуда!
Фото: 0
Т.к. в теме Windows 10 обсуждение DirectX 12 является офтопиком, пишем о нём и будущих играх с ним здесь.
********************************************************************************************

О самом DirectX 12 и его "Feature Levels" (какие ВК и какой уровень DirectX 12 поддерживают).
Анонсированные игры: "Gears of War: Ultimate Edition (2016)" и "Deus Ex: Mankind Divided".
Более полный список: "Список игр с DirectX 12" (немецкий язык, но нужная табличка и так понятна).

*************************************************************************************
Одна "Игра в раннем доступе" уже вышла: "Ashes of the Singularity" (Steam).
FPS у DirectX 12 примерно в 2 раза выше по сравнению с DirectX 11:
Ashes of the Singularity: DX11 vs DX12 Benchmarks by DigitalFoundry (видео):

Другой тест от GameGPU - в нём прирост всего около 5%.
В общем пока всё неясно, и сама игра очень "сырая", её статус на 22.03.2016 - Beta.
*************************************************************************
"Правила хорошего тона" (Локальные Правила) этой темы:

ЧИТАЕМ, ПРЕЖДЕ ЧЕМ ПИСАТЬ!:
1) Для начала ознакомиться с Правилами Конференции.
2) Категорически запрещается использовать красный цвет в сообщениях - оставьте его для Модераторов и Куратора! Рекомендуется также не злоупотреблять остальными цветами.
3) Все односложные сообщения (типа: "Аналогично", "+1...", "У меня также") будут стираться без предупреждений.
4) "Шапка" темы будет исправляться как можно быстрее. Куратор всегда в курсе всех изменений. Уважайте и цените труд Куратора - не подгоняйте его!
5) Обсуждение действий Куратора в теме не допускаются! Для этого есть ЛС (Личные сообщения). Прежде, чем написать - советую всё обдумать. "Дыма без огня не бывает!"
6) Предложения и вопросы по "шапке" и FAQ темы принимаются в ЛС (Личные сообщения). В самой теме этого делать не нужно.
Спасибо за понимание! :writer:


Последний раз редактировалось Alex_Smile 22.03.2016 12:08, всего редактировалось 18 раз(а).
обновление статуса игры "Ashes of the Singularity"



Партнер
 

Member
Статус: Не в сети
Регистрация: 22.12.2008
Откуда: с марса
knight_asd писал(а):
О, наконец то завезли оптимизацию для нвидиа. Даже с учетом асинк зеленые карты не пасут задни

Так вроде игра Зеленая как Ларка
Да и движок неудобный для АМД карт Unreal Engine 4

_________________
Ryzen 5 5600X/DeepCool Gammaxx L360 V2/ASRock B450 Pro4/Crucial BLS16G4D30AESB -3800 16-19-14-14../ Gigabyte RX 6800 ref/Deepcool DQ550ST 550W


 

Member
Статус: Не в сети
Регистрация: 11.11.2013
zzzzzzz тем не менее радеон тоже очень даже хорошо выглядит, 390-ая обганяет 970-ую, на отмену от тайтлов, где разработка была под эгидой АМД и нвидиа никто вообще не оптимизировал

_________________
Intel Core i5 12400f, Asus PRIME b660m-k d4, DDR4 3200 CL19 16 gb RAM, Аsus DUAL RTX 3060TI, WD BLACK SN770 1TB, Windows 11 HOME


 

Member
Статус: Не в сети
Регистрация: 01.06.2015
Фото: 3
zzzzzzz
zzzzzzz писал(а):
Так вроде игра Зеленая как Ларка

а шильдик есть? или
zzzzzzz писал(а):
движок неудобный для АМД карт

:D?


 

Member
Статус: Не в сети
Регистрация: 12.09.2010
Откуда: Калининград
4e_alex писал(а):
У nvidia на максвелле без асинка карта лучше загружена работой, чем у поляриса с асинком. Простой пример - скорость карт в AoS с учетом их теоретической мощности.

У АМД архитектура SIMD & scalar, у Нвидиа скалярные архитектуры ещё начиная с 8к серии 10 лет назад. Тут уже сколько раз звучали обвинения драйвера и планировщика, игнорируя то, что у АМД и Нвидиа в принципе разный подход. Подход АМД более идеалистичен, он позволяет получить карты с более высокой теоретической производительностью, но требует более бережной оптимизации - со стороны всех, начиная с разработчиков игр


 

Advanced guest
Статус: Не в сети
Регистрация: 03.12.2004
Про идеалистичность - это пустые слова. По-твоему в GF какой-то другой подход? Тот же самый SIMD (вернее, более расширенный вариант - SIMT) на массиве скалярных ALU.
До GCN было иначе, т.к. AMD гораздо позже отказалась от векторных ALU (а до какого-то поколения эти гении и вовсе использовали 5-мерные считалки, хотя в графике 4 канала всегда было, т.е. прямо на уровне архитектуры был заложен 20% недозагруз математики, это не считая потери на 1- и 2-мерных вычислениях).
Оптимизировать код шейдера под свою архитектуру можно на лету в драйвере, что nvidia и делает со времен GF FX. И оптимизировать под скалярники как раз намного проще, чем под векторные ALU, т.к. потери типа "тут нам надо только 2 канала, потому половина мощности просто не используется" отсутствуют как класс.

_________________
I came, I saw, I blew shit up, I came again


 

Member
Статус: Не в сети
Регистрация: 22.12.2008
Откуда: с марса
JohnWhite писал(а):
а шильдик есть? или

http://www.nvidia.ru/graphics-cards/gef ... -4-bundle/

_________________
Ryzen 5 5600X/DeepCool Gammaxx L360 V2/ASRock B450 Pro4/Crucial BLS16G4D30AESB -3800 16-19-14-14../ Gigabyte RX 6800 ref/Deepcool DQ550ST 550W


 

Member
Статус: Не в сети
Регистрация: 01.06.2015
Фото: 3
zzzzzzz в самой игре я имел ввиду, как в мафии и по аналогии.


 

Member
Статус: Не в сети
Регистрация: 12.09.2010
Откуда: Калининград
4e_alex писал(а):
AMD отказалась от векторных ALU

Неправда, читайте доки по GCN
4e_alex писал(а):
а до какого-то поколения эти гении и вовсе использовали 5-мерные считалки, хотя в графике 4 канала всегда было, т.е. прямо на уровне архитектуры был заложен 20% недозагруз математики, это не считая потери на 1- и 2-мерных вычислениях

Я после этой фразы не уверен также, что вы в курсе, что такое VLIW вообще. Эта фраза не имеет никакого смысла в контексте VLIW архитектуры


 

Member
Статус: Не в сети
Регистрация: 31.07.2014
Откуда: Москва, РФ
Фото: 1
Я конечно, все понимаю, но этот ваш DX12 отвратительный в нынешнем его виде. Вот даже в BF1 он хуже работает, чем DX11. А уж Mantle в BF4 вообще разрывает в щепки. :crazy: Вот интересно, как мелкософту удалось переплюнуть себя, что DX12 медленнее не только Mantle, но даже своего же собственного DX11 при этом не имея никаких графических улучшений, ведь он разрабатывался, как раз чисто для повышения производительности. :lol:

_________________
BF3/BF4/BF1/BF5 Black4ser


Последний раз редактировалось Dreamlike 13.10.2016 20:32, всего редактировалось 2 раз(а).

 

Member
Статус: Не в сети
Регистрация: 12.09.2010
Откуда: Калининград
4e_alex писал(а):
Оптимизировать код шейдера под свою архитектуру можно на лету в драйвере, что nvidia и делает со времен GF FX

Это делают все видеокарты со времён появления шейдерной программируемости вообще, сама концепция шейдеров в DirectX это подразумевает

Добавлено спустя 4 минуты 39 секунд:
Dreamlike разработчики сейчас вставляют DX12 как имплементацию для DX11, у кого вообще есть полноценный рендерер, написанный под 12?
Получается что переделывать почти что ничего не нужно, но DX11 вызовы транслируются в DX12. Получается DX11 API -> DX12 API -> driver
Это популярный среди разработчиков метод добавления новых API, он очень мало усилий требует, в сравнении с написанием рендерера под какой-то конкретный API. Не приходится при таком подходе ожидать, что 12 поднимет производительность, хорошо ещё, если не опустит


 

Member
Статус: Не в сети
Регистрация: 31.07.2014
Откуда: Москва, РФ
Фото: 1
Industrialice писал(а):
DX11 вызовы транслируются в DX12. Получается DX11 API -> DX12 API -> driver
Это популярный среди разработчиков метод добавления новых API, он очень мало усилий требует, в сравнении с написанием рендерера под какой-то конкретный API. Не приходится при таком подходе ожидать, что 12 поднимет производительность, хорошо ещё, если не опустит

И зачем такое нужно? Это уже получается увеличивается уровень абстракции вместо того, что уменьшить его. Я не по наслышке знаю, что добавляя еще одну прослойку увеличиваются задержки при обработке кода. :?:

_________________
BF3/BF4/BF1/BF5 Black4ser


 

Member
Статус: Не в сети
Регистрация: 12.09.2010
Откуда: Калининград
Dreamlike писал(а):
И зачем такое нужно?

Чтобы не писать специально рендерер под новый API, если бы его пришлось писать под каждый API - это значит отдельно под PS3, XB360, PS4, ну и, будем считать, что под XB0/Windows PC можно унифицированным обойтись, тогда это ещё 2 - DX11 и DX12, сколько получается? Явно слишком много. Потому приходится делать трансляции, пускай это снижает эффективность
У кого-то есть ещё Android и iOS в поддержке, значит ещё 2 API, Metal и OpenGL ES, принципиально отличных от всех предыдущих
Никто не в восторге от такой ситуации, потому индустрии и нужен качественный кроссплатформенный АПИ, каковым может стать Вулкан


 

Advanced guest
Статус: Не в сети
Регистрация: 03.12.2004
Industrialice писал(а):
Неправда, читайте доки по GCN

Где-то читал, что хоть там и по 4 SIMD векторных ALU, но они могут выполнять разные инструкции параллельно. Если нет, то они еще тупее, чем я считал ранее.
Industrialice писал(а):
Я после этой фразы не уверен также, что вы в курсе, что такое VLIW вообще. Эта фраза не имеет никакого смысла в контексте VLIW архитектуры

А причем здесь VLIW? Это обертка для инструкций по сути. Речь была про реализацию ALU и SIMD в частности.
Industrialice писал(а):
Это делают все видеокарты со времён появления шейдерной программируемости вообще, сама концепция шейдеров в DirectX это подразумевает

Неа. Поначалу ничего не делали. Потом nvidia начала читерить в тестах из-за сложной архитектуры GF FX (которая, по крайней мере в версии NV35, имела теоретическую математическую производительность выше R3xx, но на случайном коде без специальной заточки наоборот проигрывала почти в 2 раза), просто подменяя шейдеры на свои, заранее сделанные под конкретный тест. Их на этом поймали, был большой скандал. Вот тогда то и появился умный анализатор кода шейдеров, который уже не имел базы подменных шейдеров, а прямо на ходу проводил перестановку команд или замену на аналоги.

_________________
I came, I saw, I blew shit up, I came again


 

Member
Статус: Не в сети
Регистрация: 12.09.2010
Откуда: Калининград
4e_alex писал(а):
А причем здесь VLIW? Это обертка для инструкций по сути. Речь была про реализацию ALU и SIMD в частности.

Серьёзно, почитайте про то, что такое VLIW, должны сами понять, насколько бессмысленно то, что вы пишите. Тут даже комментировать нечего конкретно, кроме того, что вы не понимаете концепцию VLIW
4e_alex писал(а):
Поначалу ничего не делали. Потом nvidia начала читерить

Они не могли не делать ничего потому как набор инструкций шейдеров не какой-то храдвейр-специфик, в отличие от х86 или ARM, он предполагает рекомпиляцию под конкретную видеокарту. Другое дело, что это можно делать честно, согласно спекам, оптимизировать этот код при трансляции без изменения его функциональности, или явно нарушить спеки и поменять функционал, что Нвидиа и делала со своими FX


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
4e_alex писал(а):
А причем здесь VLIW? Это обертка по сути. Речь была про реализацию ALU и SIMD в частности.


Там не было недозагруза на уровне архитектуры.
Другое дело, что в играх возможностей драйвера по извлечению ILP не хватало, чтоб загрузить все слоты и в этих задачах ILP < 4.


 

Advanced guest
Статус: Не в сети
Регистрация: 03.12.2004
Industrialice писал(а):
Серьёзно, почитайте про то, что такое VLIW, должны сами понять, насколько бессмысленно то, что вы пишите. Тут даже комментировать нечего конкретно, кроме того, что вы не понимаете концепцию VLIW

Сколько раз повторить надо? Речь вообще не о VLIW (я помню про VLIW5 в первых terascale, и если ты подумал, что я о нем рассказываю, то нет). Меня не волнует, как там инструкции запускались (хотя это еще одна отдельная точка появления недогруза). Речь шла об устройстве ALU.
Industrialice писал(а):
Они не могли не делать ничего потому как набор инструкций шейдеров не какой-то храдвейр-специфик, в отличие от х86 или ARM, он предполагает рекомпиляцию под конкретную видеокарту. Другое дело, что это можно делать честно, согласно спекам, оптимизировать этот код при трансляции без изменения его функциональности, или явно нарушить спеки и поменять функционал, что Нвидиа и делала со своими FX

Не совсем. Спеки API четко диктуют, какие низкоуровневые операции поддерживаются считалками. И их на самом деле не очень много. https://en.wikipedia.org/wiki/ARB_assembly_language#ARB_Assembly_Instructions https://msdn.microsoft.com/en-us/library/windows/desktop/hh447232(v=vs.85).aspx
Можно конечно эти спеки игнорировать и выдумывать свой набор, но не похоже, чтобы так кто-то извращался.
Поначалу многие писали шейдеры прямо на ассемблере, пока их в средней игре не развелось слишком много, а сами они не стали сложнее.

Добавлено спустя 5 минут 5 секунд:
Industrialice писал(а):
Другое дело, что это можно делать честно, согласно спекам

Вот на это как раз нет никаких спецификаций :-)
Каждый делает в меру своей испорченности.

_________________
I came, I saw, I blew shit up, I came again


 

Member
Статус: Не в сети
Регистрация: 12.09.2010
Откуда: Калининград
4e_alex писал(а):
Речь шла об устройстве ALU.

Вы не вели речь про устройство ALU, что вы выше писали сами же, относилось сугубо к VLIW
4e_alex писал(а):
Спеки API четко диктуют, какие низкоуровневые операции поддерживаются считалками. И их на самом деле не очень много.

Видеокарты не исполняют эти инструкции, шейдерный ассемблер - это IR. Видеокарты могут никакие из этих инструкций вообще не поддерживать нативно и всё равно без проблем выполнять этот код после трансляции
4e_alex писал(а):
Вот на это как раз нет никаких спецификаций

Естественно там есть чёткие спецификации. Результат выполнения чётко определён спеками, как он получен - нет


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
4e_alex писал(а):
Можно конечно эти спеки игнорировать и выдумывать свой набор, но не похоже, чтобы так кто-то извращался.


Через интринсики же. И AMD и Nvidia точно извращенцы - у них такое есть.


 

Advanced guest
Статус: Не в сети
Регистрация: 03.12.2004
Industrialice писал(а):
Вы не вели речь про устройство ALU, что вы выше писали сами же, относилось сугубо к VLIW

Нет. Речь шла о векторных ALU. Это ни разу не одно и то же. А еще точнее об MD (multiple data) в SIMD. Только чисто скалярные считалки не имеют никаких ограничений на этот MD. У векторной считалки недостаток данных ведет к недозагрузке. Например, если считать 2 цветовых канала на 4х-мерной считалке, то недозагруз 50%.
VLIW работает еще до SIMD (вспоминаем что означает SI), на уровне раздачи инструкций по считалкам.
Это мы еще не коснулись темы о том, что более простое устройство скалярных ALU позволяет им работать на более высоких частотах.
Industrialice писал(а):
Видеокарты не исполняют эти инструкции, шейдерный ассемблер - это IR. Видеокарты могут никакие из этих инструкций вообще не поддерживать нативно и всё равно без проблем выполнять этот код после трансляции

Могут. Но на деле поддерживают, и никакой трансляции нет. Можешь сходить почитать доки про CUDA, там есть списки инструкций, которые считалки поддерживают напрямую.
Industrialice писал(а):
Естественно там есть чёткие спецификации

Откуда? Единственная похожая точка проверки - референсный софтовый растеризатор в DX SDK. Главное получить близкую (даже не идентичную) к нему картинку. Нет никаких спецификаций на модификацию кода драйвером. Если есть, то прошу предоставить ссылку.

_________________
I came, I saw, I blew shit up, I came again


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
4e_alex писал(а):
списки инструкций, которые считалки поддерживают напрямую.


Потому что в спеках указан необходимый минимум инструкций. А расширять никто не запрещает.


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 1757 • Страница 81 из 88<  1 ... 78  79  80  81  82  83  84 ... 88  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: Reikoraph и гости: 8


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan