Member
Статус: Не в сети Регистрация: 19.08.2010 Откуда: Прямо оттуда! Фото: 0
Т.к. в темеWindows 10 обсуждение DirectX 12 является офтопиком, пишем о нём и будущих играх с ним здесь. ******************************************************************************************** О самом DirectX 12 и его "Feature Levels" (какие ВК и какой уровень DirectX 12 поддерживают). Анонсированные игры: "Gears of War: Ultimate Edition (2016)" и "Deus Ex: Mankind Divided". Более полный список: "Список игр с DirectX 12" (немецкий язык, но нужная табличка и так понятна). ************************************************************************************* Одна "Игра в раннем доступе" уже вышла: "Ashes of the Singularity" (Steam). FPS у DirectX 12 примерно в 2 раза выше по сравнению с DirectX 11:
Ashes of the Singularity: DX11 vs DX12 Benchmarks by DigitalFoundry (видео):
Другой тест от GameGPU - в нём прирост всего около 5%. В общем пока всё неясно, и сама игра очень "сырая", её статус на 22.03.2016 - Beta. ************************************************************************* "Правила хорошего тона" (Локальные Правила) этой темы:
ЧИТАЕМ, ПРЕЖДЕ ЧЕМ ПИСАТЬ!:
1) Для начала ознакомиться с Правилами Конференции. 2) Категорически запрещается использовать красный цвет в сообщениях - оставьте его для Модераторов и Куратора! Рекомендуется также не злоупотреблять остальными цветами. 3) Все односложные сообщения (типа: "Аналогично", "+1...", "У меня также") будут стираться без предупреждений. 4) "Шапка" темы будет исправляться как можно быстрее. Куратор всегда в курсе всех изменений. Уважайте и цените труд Куратора - не подгоняйте его! 5) Обсуждение действий Куратора в теме не допускаются! Для этого есть ЛС (Личные сообщения). Прежде, чем написать - советую всё обдумать. "Дыма без огня не бывает!" 6) Предложения и вопросы по "шапке" и FAQ темы принимаются в ЛС (Личные сообщения). В самой теме этого делать не нужно. Спасибо за понимание!
Последний раз редактировалось Alex_Smile 22.03.2016 12:08, всего редактировалось 18 раз(а).
обновление статуса игры "Ashes of the Singularity"
Member
Статус: Не в сети Регистрация: 01.06.2015 Фото: 3
AndySkywalker а как еще продавать новые карты?! Маркетинг, еще не успел получить свой новый радеон 480, а он уже устарел и слился до 30 фпс Понятно о ком я сказал.
потому что 100 раз уже везде разбиралось, эти виртуальные потоки чушь, разве что если под них специально оптимизировали - то есть небольшой буст. Зато проц ощутимо сильнее греется, но владельцы и7 всегда себя могут порадовать визуализацией дополнительных потоков в вынде Когда начнется бум наращивания ядер у процов (к 2020му), скорее всего откажутся от виртуальных недопотоков.
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
mphuZ писал(а):
низкоуровневый API не для того создавался, чтобы пользоваться недокостылями в виде виртуальных потоков
скорее, если игра какая особенно сильно, более чем на 10%, пользуется SMT, то ей самой нужен костыль - к примеру, у тредов слишком длинные конвейеры инструкций, ожидающие промежуточных результатов, или вообще циклические ссылки, делящие на ноль, как в Деусе (Хуанг в последних дровах писал к ним байпасы, теперь вместо краша там запинка на 500 мс), туда может втиснуться ещё парочка инструкций с соседнего треда и их быстренько посчитает, потом втиснется ещё парочка, а основной тред выполняет циклическое деление на ноль .
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
Возьмите ЦП с 2-мя физическими ядрами, включите HT и будет отличный прирост в этих же играх. Существование HT - следствие использования х86, устаревшего ещё десятки лет назад, несмотря на стероиды в виде новых инструкций. Скорее 3 логических ядра на 1 физическое станет целесообразным, чем отказ от HT вообще
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
devl547 писал(а):
Это следствие роста ядер вширь и отставание оптимизаций кода от железа. Или ты скажешь, что Power и Sparc - x86?
POWER и SPARC - не потребительского класса ЦП( пускай POWER раньше и ставился в маки, давно в прошлом ), к ним другие требования, их скорее с Itanium можно сравнить. Нет толка от роста вширь когда исполнительные блоки не получается загрузить. х86 разработан без всякого рассчёта на параллелизм на уровне инструкций, по современным меркам, этот набор инструкций - сборник просчётов( количество регистров, работа со стэком, разбиение регистров на подрегистры, частичное обновление флагов, инструкции произвольной длины( в диапазоне от 1 до 15 байтов ), префиксы и т.д. ) HT, по факту, многие ресурсы ядра делит пополам между логическими ядрами, ещё за часть ресурсов логические ядра борются между собой - тем не менее, падение скорости можно очень редко наблюдать, зато есть много сценариев, в которых дополнительные логические ядра дают прирост производительности в 1.5 раза и выше Если бы не совместимость, х86 давным-давно был бы на свалке истории, где ему и место
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Industrialice писал(а):
Если бы не совместимость, х86 давным-давно был бы на свалке истории, где ему и место
Предложишь замену? Все остальные не лучше.
Industrialice писал(а):
Нет толка от роста вширь когда исполнительные блоки не получается загрузить
Их получается загрузить. Другое дело, что этим занимается от силы процента 2 программистов, которым критически важно выжать всё, что есть в железе. Остальные фигачат корявый код, который компилятор изо всех сил пытается хоть как-то заоптимизировать. В лучшем случае компилятор, а то там всякие жабопитоны популярны.
Member
Статус: Не в сети Регистрация: 06.10.2009 Откуда: Россия Фото: 4
Цитата:
Предложишь замену? Все остальные не лучше.
Мне лично жаль VLIW. Radeon не дурно поработал над ней в своё время. Пока всё не упёрлось в оптимизированный софт. В целом, если не ошибаюсь у GCN оттуда же корни растут.
Код:
GTX 1080 - 9Тфлопс Fury X - 8.5Тфлопс
А это всё следствие VLIW архитектуры. А тут уже всё упирается в руки программистов и качество компилятора.
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
ZeroCooolX писал(а):
В целом, если не ошибаюсь у GCN оттуда же корни растут.
GCN - это ближе к SIMD.
ZeroCooolX писал(а):
Мне лично жаль VLIW
Садомазо архитектура. По уровню костылей и подпорок оно как процессор общего пользования сильно хуже всех остальных. DSP, числодробильня, какие-нибудь спецзадачи - да. Но не массовый рынок. ЕМНИП, тот же TileGX хоть и VLIW, но у него там ISA в стиле "разобрать TCP-пакет" одной инструкцией.
ZeroCooolX писал(а):
А это всё следствие VLIW архитектуры.
Но GCN не VLIW. Анонсы от самой AMD почитай, почему они VLIW5 сначала закопали, а потом и VLIW4. Честно говоря, даже немного жаль (хочу себе 5870 и 6970 с рук в коллекцию купить), но в реальных задачах КПД этой архитектуры не такой высокий, как на лабораторных микробенчмарках.
Дабы не уходить от темы:
DX12 решительно побоку на то, какие у него внизу ядра. HT-не HT. Всё решают разработчики движков.
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
devl547 писал(а):
Предложишь замену? Все остальные не лучше.
Binary translation( статичный ), сложный в реализации вариант, но в случае, если удастся подстроить экосистему, однозначно лучший вариант. Насколько я знаю, только NVIDIA над ним активно работает с их Project Denver. Есть ещё ARM, ЦП на основе которого развиваются стремительно. На сегодня ЦП вроде Apple A9 по производительности сопоставимы с ноутбучными ЦП Интел, при том потребляют энергии гораздо меньше
devl547 писал(а):
Их получается загрузить. Другое дело, что этим занимается от силы процента 2 программистов, которым критически важно выжать всё, что есть в железе. Остальные фигачат корявый код, который компилятор изо всех сил пытается хоть как-то заоптимизировать. В лучшем случае компилятор, а то там всякие жабопитоны популярны.
Нет не получается, разве что в частных случаях - вроде конвертации аудио/видео, процессинг изображений. Что-то вроде игрового движка по сути невозможно эффективно оптимизировать не полагаясь на компилятор И да, даже в конвертации аудио/видео, включение HT обычно даёт огромный буст - что явно говорит о том, что без него загрузить блоки не получается
devl547 писал(а):
GCN - это ближе к SIMD
GCN содержит как блоки по работе с SIMD, так и со скалярными операндами. Но да, это уже совсем не VLIW, это RISC. VLIW почти что нигде не работает - красиво на бумаге, но не работает на практике
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Industrialice писал(а):
На сегодня ЦП вроде Apple A9 по производительности сопоставимы с ноутбучными ЦП Интел, при том потребляют энергии гораздо меньше
Вот только в тестах всё наоборот. А вся маложручесть за счёт набортных DSP. И отсутствие драйверов. И полнейшее огораживание всего. Я давно фанатствую на тему ARM-одноплатников и ТВ-боксов. Но в итоге оказывается, что банальный Z3735F по всем параметрам выходит лучше.
Industrialice писал(а):
Binary translation, сложный в реализации вариант, но в случае, если удастся подстроить экосистему, однозначно лучший вариант.
Denver ничем не отличается от той же древней Transmeta - JIT-прослойка поверх нативной архитектуры. В теории оно может взлететь, но нужна конкретная LTS поддержка и в идеале открытие исходников кодоморфинга. Иначе получишь ситацию, когда у тебя интересная железка, которая в теории может больше, будет по сути залочена старой версией софта.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения