Спрошу так, что бы до альтернативно одарённых дошло и не было разночтений - "вертексные, тесселяционные, пиксельные, геометрические шейдеры"(оставим пока вычислительные в стороне) подменяются вендорами в ходе "оптимизаций" или нет? Ну хотя бы АМД энтим занимаетси?
В контексте лучшений 480, вполне вероятна подмена и откровенная халтура по генерированию примитивов геометрическими шейдерами. У нвидии - покажи мне, где конкретно была речь о подмене шейдеров - пиксельных, вершинных, тесселяционных, геометрических? В чем халтурили оба производителя в свое время - в фильтрации текстур, когда применялись частично трилинейная, частично билинейная фильтрации. Но я пока не видел нигде, чтобы подменялись шейдеры.
Member
Статус: Не в сети Регистрация: 02.04.2012 Откуда: Санкт-Петербург Фото: 4
Renegade1979 Кэширование теперь автоматом подразумевает перекомпиляцию, чудеса! Я думал кэширование это просто кэширование. Кэширование шейдеров-то ввели не так давно, пару лет назад, явно не в 2004.
Вижу, тут все специалисты по архитектурам, которые годами работали над дровами нв, хорошо их знают изнутри и могут с уверенностью говорить то да се. Хуангу надо направить сюда своих эйчаров, а то вдруг он кадры ценные потерял. Думает где же они, а вот они, на руоверах сидят, просвещают люд. =)
_________________ Чего недавно прошел: https://www.grouvee.com/user/xid/shelves/67845-recently-finished/
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
xid писал(а):
Кэширование теперь автоматом подразумевает перекомпиляцию, чудеса! Я думал кэширование это просто кэширование.
кеширование можно отключить... а перекомпиляция будет ВСЕГДА. Я в самом начале об этом писал же. Включение кеширования просто разгружает CPU, перекомпиляция требуется всего однажды
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Также это прозрачный намёк на то, что случается, если за Кеплером не бегать с компилятором в зубах - он превращается в ТЫКВУ. 48 ядер на варп видимо не исправить в любом случае, может под Тесла что-то и пытались хз
Эмм... причет тут ядра на варп? Можно подумать, что у АМД каждый CU параллелит задачи на 64 потока, по одному на каждый SP. Кстати, у 480 4-е ACE-а. Максимум 31 вычислительный поток в смешаном режиме. И 36CU. В каждом из которых 16 SIMD-юнитов, по 4 SP в каждом. Но вообще, учитывая, что у кеплера нет миксед режима....
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
Nimrael писал(а):
В контексте лучшений 480, вполне вероятна подмена и откровенная халтура по генерированию примитивов геометрическими шейдерами.
это же и есть оптимизация, до тех пор пока мы не теряем в качестве (а то развелось тут "гениев оптимизации", игры в 1980х800 запускают, чтобы плойко не погорело). Тесселяция по сути тоже подмена данных координат вершин своими на лету, и оно таки лагает. Лучше бы изначально сделали бочки в Лариске не восьмиугольными
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
Nimrael писал(а):
Можно подумать, что у АМД каждый CU параллелит задачи на 64 потока, по одному на каждый SP.
у Нвидии был Giga-Thread Engine, параллелит варпами, в Мохвелле параллелит на уровне потоков, в Поскале GP100 и Паксвеле GP104 на уровне инструкций. У АМД видимо тоже что-то такое есть. Но в CU они исполняют 64потока wave на 16 ядер SIMD и по идее они не считают совместно. Поэтому производительность на ядро причмокивает болллт. В Полюрисе на SIMD добавили кеша или буфера, как там его, может слегка поднимется
xid писал(а):
Откуда драйвер возьмет исходный код шейдера, если он к нему пришел скомпилированным?
у меня даже соснольки нет, и я не программист, лучше пусть этим займутся профессионалы. Я подозреваю, что исходник должен выдать разраб, а перед этим Хуанг заносит чумадан.
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
это же и есть оптимизация, до тех пор пока мы не теряем в качестве (а то развелось тут "гениев оптимизации", игры в 1980х800 запускают, чтобы плойко не погорело). Тесселяция по сути тоже подмена данных координат вершин своими на лету, и оно таки лагает. Лучше бы изначально сделали бочки в Лариске не восьмиугольными
А ты уверен, что НЕ потеряем в качестве? И оно тормозит (лаг вообще-то это задержка отклика от одного устройства к другому) из-за того, что для тесселяции требуется серьезная нагрузка: генерация множества примитивов геометрическими юнитами. И тут встает искушение - можно убрать побольше, мол никто все равно особо не заметит. А можно поменьше - но и производительности будет поменьше. В идеале, конечно, усилить блоки геометрии. Но они ведь тоже требуют и транзисторный бюджет и площадь.
Member
Статус: Не в сети Регистрация: 02.04.2012 Откуда: Санкт-Петербург Фото: 4
Можно привести аналогию. Задача - передвинуть шкаф в комнате. Мы берем, разбиваем шкаф на атомы, достаем "атомный репликатор 9000" и медленно восстанавливаем шкаф в другом углу атом за атомом. Когда можно просто двинуть шкаф.
То же самое и про перекомпиляцию налету...
_________________ Чего недавно прошел: https://www.grouvee.com/user/xid/shelves/67845-recently-finished/
Последний раз редактировалось xid 29.06.2016 16:09, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
Nimrael писал(а):
беда в том, что они не понимают, что речь исключительно о перекомпиляции вычислительных шейдеров. Другие-то перекомпилировать смысла нет.
кстати у нас хороший пример таких шейдеров, волосикс у Лариски, я заранее с перепугу поставил их не на макс (бо я ж Ху...нга знаю) и прошёл с ними в соснольном качестве, вроде смотрелось годно
Nimrael писал(а):
А ты уверен, что НЕ потеряем в качестве?
хммм, хардварно менять 64х64 расчёт на 32х32... можно сделать вид просто, а поменять сам драйвер, чтобы он показывал что там 64х64 на "Настройки по выбору приложения". Будет афера века. Но дождёмся статьи по сабжу, самому любопытно
xid писал(а):
Мы берем, разбиваем шкаф на атомы, достаем "атомный репликатор 9000" и медленно восстанавливаем шкаф в другом углу атом за атомом
тут аналогия достаём ключ от разрабов и выкидываем из шкафа посуду, потом передвигаем. Посуду (индусский фарфор) вернём разрабам. в Fallout 4
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Заблокирован Статус: Не в сети Регистрация: 11.06.2016
xid писал(а):
Задача - передвинуть шкаф в комнате. Мы берем, разбиваем шкаф на атомы, достаем "атомный репликатор 9000" и медленно восстанавливаем шкаф в другом углу атом за атомом. Когда можно просто двинуть шкаф.
Не не так. Вытаскиваем вещи из щкафа, вытаскиваем полки, стенки и т.д. Переносим это всё в угол и собираем. Не ставим задние стенки(задней стенкой будет стена), не ставим полки, просто запихиваем вещи обратно. Передвинуть? А ты представь. что ты - хрупкая девушка-одна дома... Или предлагаешь девушке отдаться кому-нить за передвинуть?
_________________ Those who try to tell UDP jokes are more boring than morning porridge.
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
Darbo писал(а):
Не не так. Вытаскиваем вещи из щкафа, вытаскиваем полки, стенки и т.д.
в Fallout 4 вот все щейьдера лежат в архиве в виде fxp файла, видимо запакованный, но внутри они могут быть банально исходники, чего уж проще, пока драйвер компилирует, влепить свои оптимизированные Недавний Фар Харбор и патч 1.22 менял содержимое архива со щейьдерами и с тех пор у людей жалобы. Даже на плойке. Видимо самое время Хуангу заняться подстановкой своих оптимизированных но Хуанг уже раз заносил чумадан с гамеворхом, уплочено... дальше можно на поддержку игры попросту забить, болллт
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Последний раз редактировалось Renegade1979 29.06.2016 16:18, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 02.04.2012 Откуда: Санкт-Петербург Фото: 4
Darbo Управление предметами в шкафу есть только на атомном уровне. Ты атом, вообщем. Работа по перекомпиляции всегда будет во много раз сложнее исполнения.
Вообщем тут нужны заявления и блоги людей, писавших драйвера нв или амд, а то аналогии можно до ночи приводить.
_________________ Чего недавно прошел: https://www.grouvee.com/user/xid/shelves/67845-recently-finished/
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
xid писал(а):
Работа по перекомпиляции всегда будет во много раз сложнее исполнения.
Хуангу что, перекомпиляцией же занят проц интел, а лаги от неперекомпилированного говнокода на его картах плюс самое главное - после введения кеширования проц можно загрузить один раз и потом иметь профит всё игровое время
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Advanced member
Статус: Не в сети Регистрация: 19.10.2002 Откуда: Tartu, Eestimaa
1060 - половинка от 1080 как-то маловато. Даешь 1070, но со 192 битной памятью в 6 Гб
_________________ Демократия - это ТО, когда ТЫ выбираешь ТОГО, кто будет ТЕБЯ ....... http://ru-ru.facebook.com/people/Dmitri-Spirihhin/100001658062204
Member
Статус: Не в сети Регистрация: 25.01.2004 Откуда: Ростов-на-Дону Фото: 4
xid писал(а):
Работа по перекомпиляции всегда будет во много раз сложнее исполнения.
Там видимо некое подобие JIT в андройде, в андройде же тоже программа не исходник, а скомпилирована в полубинарник. Говнокод пропускается через мясорубку и создается кеш джита с обходом острых углов, который потом подсовывается на лету и работает по оптимизированной схеме. Там процент, сям процент. Смотришь, а конкурент уже и сливаться начал.
_________________ 12400|224XT|MSI PRO B660M-A DDR4|4x8Gb@3466|KFA2 3060-12X|Deepcool PQ650M|Corsair 200R|Win11x64
Сейчас этот форум просматривают: Google [Bot] и гости: 17
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения