В сливе фуры виновата не память а скорее всего чип и алгоритмы которые в основном рассчитаны на узкую шину.
А фура слилась? Гм... вот ведь странно, в среднем по тестам она тянет вполне на уровне 980Ti, хоть и имеет на два гига меньше памяти, но зеленые эксперты свято верят что фура слилась... фантастика да и только. А, я понял, это все потому что разогнанная 980Ti уходит в бешеный отрыв на на 20 процентов в 4К - аш на 3 fps, 18 против 15. Или потому что в full hd она выдает аш 100 против 80-ти и пофиг что жк монитор больше 60 не умеет. В тестах цыфирька больше? Больше, фура слилась Это как владельцы плойки, которые носятся со своей "супермощной" приставкой, как дурни с писаной торбой, хотя эти пресловутые 50 процентов дополнительной мощности GPU в подавляющем большинстве игр никак не превращаются в визуально заметную разницу в картинке. Зато можно дрочить на Digital Foundry, которая исправно потчует клиентов замерами разрешения и fps:)
уже нужны мощьные карты для 4к. а их нет, даже дорогие фигню показывают.. а нужны мидлы для 4к . мониторов и тв 4к навалом, но я не беру из-за неподходящего железа
Тем самым для вычисления одного элемента произведения матриц нужно выполнить 2*N арифметических операций и 2*N чтений из глобальной памяти. Понятно, что в данном случае основным лимитирующим фактором является скорость доступа к глобальной памяти, которая весьма низка. Каким образом отдельные нити группируются в блоки не важно и не оказывает значительного влияния на быстродействие, которое в данном случае оказывается весьма невысоким.
Основной минус технологии — нужна большая пропускная способность памяти. Мы стараемся максимально упаковать параметры поверхности, необходимые для освещения. В результате мы пришли к формату, который укладывается в 128 бит на пиксель — 96, если не учитывать информацию о глубине.
Что в простейшем случае что в продвинутой модели BRDF - везде говорят о минусе алгоритма как слишком требовательном к ПСП. Какой из этого можно сделать вывод? Если бы не ограничения ПСП, возможно, мы бы могли увидели гораздо реальнее картинки в реальном времени чем сегодня. Но никто в здравом уме не будет делать алгоритмы адекватно работающие только на Фуре Х.
Tovbot писал(а):
А фура слилась?
Просто если хомяки не видят профита сегодня от HBM, то для них значит слила. И с ними сложно поспорить, потому что сегодняшние игры из кожи вон лезут чтобы не нагружать ПСП
Увлекаюсь программированием графики/шейдеров/расчётами не видеокарте. Зайдите например на http://steps3d.narod.ru/tutorials/cuda-tutorial.html в простейший примере CUDA вычисление перемножение матриц(N*N): Тем самым для вычисления одного элемента произведения матриц нужно выполнить 2*N арифметических операций и 2*N чтений из глобальной памяти. Понятно, что в данном случае основным лимитирующим фактором является скорость доступа к глобальной памяти, которая весьма низка. Каким образом отдельные нити группируются в блоки не важно и не оказывает значительного влияния на быстродействие, которое в данном случае оказывается весьма невысоким.
Ничего, что вычислительный и графический (или микс-режим) по разному работают с памятью? В первом случае память работает как единый массив, во втором - как фактически кэш-память связанная с ROP-ами/L2 кэшем. Улавливаете разницу? В тех случаях, когда мы говорим о "сливе фуры" задействован отнюдь не режим расчетов. И фактически понятие "глобальная видеопамять" хоть и присутствует номинально, но, по факту, в основном используется память в режиме кэша, четко поделенная на сегменты.
Блок-схемка 970-ки
#77
snake32 писал(а):
Пример с habr о современной модели освещения BDRF https://habrahabr.ru/company/mailru/blog/248873/ Основной минус технологии — нужна большая пропускная способность памяти. Мы стараемся максимально упаковать параметры поверхности, необходимые для освещения. В результате мы пришли к формату, который укладывается в 128 бит на пиксель — 96, если не учитывать информацию о глубине. Что в простейшем случае что в продвинутой модели BRDF - везде говорят о минусе алгоритма как слишком требовательном к ПСП. Какой из этого можно сделать вывод? Если бы не ограничения ПСП, возможно, мы бы могли увидели гораздо реальнее картинки в реальном времени чем сегодня. Но никто в здравом уме не будет делать алгоритмы адекватно работающие только на Фуре Х.
Там скорее неправильное использование терминов. Важна не суммарная псп, а быстрота общения буфер <-> ГПУ. Сам же буффер занимает АЖ 128бит (16байт) помноженное на к-во пикселей. При UHD (3840x2160) это 8.294.400 пикселей, которые займут АЖ 126МБ. При 2ГБ видеопамяти и 8-ми микросхемах, емкость каждой GDDR5 микросхемы 256МБ. Т.е., скорее всего, даже в идеальном варианте, задействованы будут примерно 4 микросхемы из 8-ми под этот буфер. Что касается HBM1, там ещё веселее: каждая микросхема (1гбайт) состоит из 8-ми 128-битных каналов, каждый емкостью, соответственно, ~125МБайт. Вероятность того, что контроллер памяти заполнит этим буфером ВСЕ 8 каналов в чипех 4 чипа = 32 канала памяти ничтожно мала. Т.е. по сути, ролять будет не столько суммарная ПСП, сколько скорость каналов. А теперь к цифрам: скорость одной микросхемы GDDR5 при 8ГГЦ в пиковом режиме 32ГБ/с (8гигабит на 1 пин помноженные на 32 пина GDDR5)/ Скорость 1-го канала HBM1 при 1.25ГГц = 16байт (128 бит) ширины канала * 1.25ГГц (поскольку при 1 ГГц скорость на пин 1ГБит/с)=20ГБайт/с. Т.е. чем меньше микросхем/каналов будет занято буфером, тем больше будет проигрыщш HBM1. И vice versa. Это что касается достаточно объемного буфера. А когда речь начинает идти о более мелких файлах?
snake32 писал(а):
Просто если хомяки не видят профита сегодня от HBM, то для них значит слила. И с ними сложно поспорить, потому что сегодняшние игры из кожи вон лезут чтобы не нагружать ПСП
Хомяки, вроде вас, просто не понимают сути. HBM1 МОЖЕТ быть конкурентной в расчетах, но не очень хорошо подходит в игровом применении. Вот HBM2, где выборка в два раза больше, да ещё и есть псевдоканалы, что позволяет обращаться к двум банкам сразу (в новом режиме или просто удвоенная выборка в legacy-режиме) - это да. Она полностью бьет GDDR5 и иногда может уступать GDDR5X в некоторых сценариях.
HBM1 МОЖЕТ быть конкурентной в расчетах, но не очень хорошо подходит в игровом применении.
HBM1 прекрасно выполнила возложенные на нее задачи: обкатка технологии и снижение TDP карты. Все, большего на данном этапе от HBM1 не требовалось. Фурия получилась отличным конкурентоспособным продуктом.
HBM1 прекрасно выполнила возложенные на нее задачи: обкатка технологии и снижение TDP карты. Все, большего на данном этапе от HBM1 не требовалось. Фурия получилась отличным конкурентоспособным продуктом.
В мечтах, разве что. Намного выше тепловыделение, выше себестоимость (естественно, что это важно не для конечного покупателя), выше транзисторный бюджет, ниже возможности разгона, одинаковая с конкурентом цена, сложнее размещение в корпусе (выносной радиатор).
Member
Статус: Не в сети Регистрация: 03.06.2015 Откуда: Мос-ка с гиляки Фото: 1
Nimrael писал(а):
Ничего, что вычислительный и графический (или микс-режим) по разному работают с памятью?
Откуда инфа? Сами выдумали? Дайте ссыль. Научитесь хоть как-то подкреплять свои выводы. Кстати, на вашей же картинке нельзя обратиться к памяти минуя кэш. Так что там со вторым режимом работы памяти?
Добавлено спустя 29 минут 49 секунд: И ещё. Вершинный, геометрический и два тесселяционных шейдера не работают с ROP'ами. И даже фрагментный(пиксельный) тоже. Растеризация(использование ROP) происходит перед фрагментным. Посмотрите на конвейер OpenGL, например. https://www.opengl.org/wiki/Rendering_Pipeline_Overview
В мечтах, разве что. Намного выше тепловыделение, выше себестоимость (естественно, что это важно не для конечного покупателя), выше транзисторный бюджет, ниже возможности разгона, одинаковая с конкурентом цена, сложнее размещение в корпусе (выносной радиатор).
Мы имеем факт - карта продается за те же деньги что и конкурентная и обеспечивает сопоставимый уровень производительности. По тепловыделению там разница некритична. Разгон нынешних топам не дает нихрена - в FHD они зачастую и так тянут 60 fps, а в 4К не вытягивают даже в разгоне, он им добавляет считанные единицы fps. Поэтому разгон там исключительно для любителей дрочить на цыферки. Поэтому если разогнать зеленый туман из глаз, то даже такой фанат невидии как вы увидит что с точки зрения обычного пользователя фурия ничуть не хуже 980Ti по совокупности характеристик. Что до себестоимости и транзисторного бюджета (заумь то какая) - опять вы лезете во внутреннюю кухню разработчиков и учите их жизни. Достаточно, один раз облажались уже с суперумным планировщиком в невидиевских картах:))
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 14
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения