Member
Статус: Не в сети Регистрация: 19.08.2010 Откуда: Прямо оттуда! Фото: 0
Т.к. в темеWindows 10 обсуждение DirectX 12 является офтопиком, пишем о нём и будущих играх с ним здесь. ******************************************************************************************** О самом DirectX 12 и его "Feature Levels" (какие ВК и какой уровень DirectX 12 поддерживают). Анонсированные игры: "Gears of War: Ultimate Edition (2016)" и "Deus Ex: Mankind Divided". Более полный список: "Список игр с DirectX 12" (немецкий язык, но нужная табличка и так понятна). ************************************************************************************* Одна "Игра в раннем доступе" уже вышла: "Ashes of the Singularity" (Steam). FPS у DirectX 12 примерно в 2 раза выше по сравнению с DirectX 11:
Ashes of the Singularity: DX11 vs DX12 Benchmarks by DigitalFoundry (видео):
Другой тест от GameGPU - в нём прирост всего около 5%. В общем пока всё неясно, и сама игра очень "сырая", её статус на 22.03.2016 - Beta. ************************************************************************* "Правила хорошего тона" (Локальные Правила) этой темы:
ЧИТАЕМ, ПРЕЖДЕ ЧЕМ ПИСАТЬ!:
1) Для начала ознакомиться с Правилами Конференции. 2) Категорически запрещается использовать красный цвет в сообщениях - оставьте его для Модераторов и Куратора! Рекомендуется также не злоупотреблять остальными цветами. 3) Все односложные сообщения (типа: "Аналогично", "+1...", "У меня также") будут стираться без предупреждений. 4) "Шапка" темы будет исправляться как можно быстрее. Куратор всегда в курсе всех изменений. Уважайте и цените труд Куратора - не подгоняйте его! 5) Обсуждение действий Куратора в теме не допускаются! Для этого есть ЛС (Личные сообщения). Прежде, чем написать - советую всё обдумать. "Дыма без огня не бывает!" 6) Предложения и вопросы по "шапке" и FAQ темы принимаются в ЛС (Личные сообщения). В самой теме этого делать не нужно. Спасибо за понимание!
Последний раз редактировалось Alex_Smile 22.03.2016 12:08, всего редактировалось 18 раз(а).
обновление статуса игры "Ashes of the Singularity"
Member
Статус: Не в сети Регистрация: 01.06.2015 Фото: 3
AndySkywalker а как еще продавать новые карты?! Маркетинг, еще не успел получить свой новый радеон 480, а он уже устарел и слился до 30 фпс Понятно о ком я сказал.
потому что 100 раз уже везде разбиралось, эти виртуальные потоки чушь, разве что если под них специально оптимизировали - то есть небольшой буст. Зато проц ощутимо сильнее греется, но владельцы и7 всегда себя могут порадовать визуализацией дополнительных потоков в вынде Когда начнется бум наращивания ядер у процов (к 2020му), скорее всего откажутся от виртуальных недопотоков.
Member
Статус: Не в сети Регистрация: 01.06.2011 Откуда: Кривий Рiг UA Фото: 1
mphuZ писал(а):
низкоуровневый API не для того создавался, чтобы пользоваться недокостылями в виде виртуальных потоков
скорее, если игра какая особенно сильно, более чем на 10%, пользуется SMT, то ей самой нужен костыль - к примеру, у тредов слишком длинные конвейеры инструкций, ожидающие промежуточных результатов, или вообще циклические ссылки, делящие на ноль, как в Деусе (Хуанг в последних дровах писал к ним байпасы, теперь вместо краша там запинка на 500 мс), туда может втиснуться ещё парочка инструкций с соседнего треда и их быстренько посчитает, потом втиснется ещё парочка, а основной тред выполняет циклическое деление на ноль .
_________________ По поводу АМД можно сказать, что... http://images.vfl.ru/ii/1466552059/06f0b3de/13108371.gif
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
Возьмите ЦП с 2-мя физическими ядрами, включите HT и будет отличный прирост в этих же играх. Существование HT - следствие использования х86, устаревшего ещё десятки лет назад, несмотря на стероиды в виде новых инструкций. Скорее 3 логических ядра на 1 физическое станет целесообразным, чем отказ от HT вообще
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
devl547 писал(а):
Это следствие роста ядер вширь и отставание оптимизаций кода от железа. Или ты скажешь, что Power и Sparc - x86?
POWER и SPARC - не потребительского класса ЦП( пускай POWER раньше и ставился в маки, давно в прошлом ), к ним другие требования, их скорее с Itanium можно сравнить. Нет толка от роста вширь когда исполнительные блоки не получается загрузить. х86 разработан без всякого рассчёта на параллелизм на уровне инструкций, по современным меркам, этот набор инструкций - сборник просчётов( количество регистров, работа со стэком, разбиение регистров на подрегистры, частичное обновление флагов, инструкции произвольной длины( в диапазоне от 1 до 15 байтов ), префиксы и т.д. ) HT, по факту, многие ресурсы ядра делит пополам между логическими ядрами, ещё за часть ресурсов логические ядра борются между собой - тем не менее, падение скорости можно очень редко наблюдать, зато есть много сценариев, в которых дополнительные логические ядра дают прирост производительности в 1.5 раза и выше Если бы не совместимость, х86 давным-давно был бы на свалке истории, где ему и место
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Industrialice писал(а):
Если бы не совместимость, х86 давным-давно был бы на свалке истории, где ему и место
Предложишь замену? Все остальные не лучше.
Industrialice писал(а):
Нет толка от роста вширь когда исполнительные блоки не получается загрузить
Их получается загрузить. Другое дело, что этим занимается от силы процента 2 программистов, которым критически важно выжать всё, что есть в железе. Остальные фигачат корявый код, который компилятор изо всех сил пытается хоть как-то заоптимизировать. В лучшем случае компилятор, а то там всякие жабопитоны популярны.
Member
Статус: Не в сети Регистрация: 06.10.2009 Откуда: Россия Фото: 4
Цитата:
Предложишь замену? Все остальные не лучше.
Мне лично жаль VLIW. Radeon не дурно поработал над ней в своё время. Пока всё не упёрлось в оптимизированный софт. В целом, если не ошибаюсь у GCN оттуда же корни растут.
Код:
GTX 1080 - 9Тфлопс Fury X - 8.5Тфлопс
А это всё следствие VLIW архитектуры. А тут уже всё упирается в руки программистов и качество компилятора.
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
ZeroCooolX писал(а):
В целом, если не ошибаюсь у GCN оттуда же корни растут.
GCN - это ближе к SIMD.
ZeroCooolX писал(а):
Мне лично жаль VLIW
Садомазо архитектура. По уровню костылей и подпорок оно как процессор общего пользования сильно хуже всех остальных. DSP, числодробильня, какие-нибудь спецзадачи - да. Но не массовый рынок. ЕМНИП, тот же TileGX хоть и VLIW, но у него там ISA в стиле "разобрать TCP-пакет" одной инструкцией.
ZeroCooolX писал(а):
А это всё следствие VLIW архитектуры.
Но GCN не VLIW. Анонсы от самой AMD почитай, почему они VLIW5 сначала закопали, а потом и VLIW4. Честно говоря, даже немного жаль (хочу себе 5870 и 6970 с рук в коллекцию купить), но в реальных задачах КПД этой архитектуры не такой высокий, как на лабораторных микробенчмарках.
Дабы не уходить от темы:
DX12 решительно побоку на то, какие у него внизу ядра. HT-не HT. Всё решают разработчики движков.
Member
Статус: Не в сети Регистрация: 12.09.2010 Откуда: Калининград
devl547 писал(а):
Предложишь замену? Все остальные не лучше.
Binary translation( статичный ), сложный в реализации вариант, но в случае, если удастся подстроить экосистему, однозначно лучший вариант. Насколько я знаю, только NVIDIA над ним активно работает с их Project Denver. Есть ещё ARM, ЦП на основе которого развиваются стремительно. На сегодня ЦП вроде Apple A9 по производительности сопоставимы с ноутбучными ЦП Интел, при том потребляют энергии гораздо меньше
devl547 писал(а):
Их получается загрузить. Другое дело, что этим занимается от силы процента 2 программистов, которым критически важно выжать всё, что есть в железе. Остальные фигачат корявый код, который компилятор изо всех сил пытается хоть как-то заоптимизировать. В лучшем случае компилятор, а то там всякие жабопитоны популярны.
Нет не получается, разве что в частных случаях - вроде конвертации аудио/видео, процессинг изображений. Что-то вроде игрового движка по сути невозможно эффективно оптимизировать не полагаясь на компилятор И да, даже в конвертации аудио/видео, включение HT обычно даёт огромный буст - что явно говорит о том, что без него загрузить блоки не получается
devl547 писал(а):
GCN - это ближе к SIMD
GCN содержит как блоки по работе с SIMD, так и со скалярными операндами. Но да, это уже совсем не VLIW, это RISC. VLIW почти что нигде не работает - красиво на бумаге, но не работает на практике
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Industrialice писал(а):
На сегодня ЦП вроде Apple A9 по производительности сопоставимы с ноутбучными ЦП Интел, при том потребляют энергии гораздо меньше
Вот только в тестах всё наоборот. А вся маложручесть за счёт набортных DSP. И отсутствие драйверов. И полнейшее огораживание всего. Я давно фанатствую на тему ARM-одноплатников и ТВ-боксов. Но в итоге оказывается, что банальный Z3735F по всем параметрам выходит лучше.
Industrialice писал(а):
Binary translation, сложный в реализации вариант, но в случае, если удастся подстроить экосистему, однозначно лучший вариант.
Denver ничем не отличается от той же древней Transmeta - JIT-прослойка поверх нативной архитектуры. В теории оно может взлететь, но нужна конкретная LTS поддержка и в идеале открытие исходников кодоморфинга. Иначе получишь ситацию, когда у тебя интересная железка, которая в теории может больше, будет по сути залочена старой версией софта.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 21
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения