Прошлогодний прототип NVIDIA Pascal оснащался памятью типа HBM1

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 30.06.2026 3:22

Сообщения без ответов | Активные темы

Список форумов » Сайт и конференция » Материалы сайта » Обсуждение новостей

Часовой пояс: UTC + 3 часа

Модератор: Sonic-Chainik

Новая тема /

Закрыто

Сообщений: 50 • Страница 3 из 3 • < 1 2 3

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

keks007

Добавлено: 04.04.2016 8:02

[профиль]

Member
Статус: Не в сети
Регистрация: 18.10.2007

Nimrael писал(а):

Расскажи мне, о юный аналитеГ

Nimrael писал(а):

Регистрация: 28.03.2016

Реклама
Партнер

Tovbot

Добавлено: 04.04.2016 8:58

[профиль]

Member
Статус: Не в сети
Регистрация: 01.02.2015

snake32 писал(а):

В сливе фуры виновата не память а скорее всего чип и алгоритмы которые в основном рассчитаны на узкую шину.

А фура слилась? Гм... вот ведь странно, в среднем по тестам она тянет вполне на уровне 980Ti, хоть и имеет на два гига меньше памяти, но зеленые эксперты свято верят что фура слилась... фантастика да и только. А, я понял, это все потому что разогнанная 980Ti уходит в бешеный отрыв на на 20 процентов в 4К - аш на 3 fps, 18 против 15. Или потому что в full hd она выдает аш 100 против 80-ти и пофиг что жк монитор больше 60 не умеет. В тестах цыфирька больше? Больше, фура слилась

Это как владельцы плойки, которые носятся со своей "супермощной" приставкой, как дурни с писаной торбой, хотя эти пресловутые 50 процентов дополнительной мощности GPU в подавляющем большинстве игр никак не превращаются в визуально заметную разницу в картинке. Зато можно дрочить на Digital Foundry, которая исправно потчует клиентов замерами разрешения и fps:)

diman5566

Добавлено: 04.04.2016 9:32

[профиль]

Member
Статус: Не в сети
Регистрация: 18.04.2012

уже нужны мощьные карты для 4к. а их нет, даже дорогие фигню показывают..
а нужны мидлы для 4к . мониторов и тв 4к навалом, но я не беру из-за неподходящего железа

_________________
intel i7 6850k + asus rog strix x99 + Corsair Vengeance LPX 16GB DDR4 K2 3200MHz C16 +asus strix gtx1070 8gb

snake32

Добавлено: 04.04.2016 14:24

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 03.06.2015
Откуда: Мос-ка с гиляки
Фото: 1

Nimrael писал(а):

какие такие есть алгоритмы "рассчитанные на узкую шину"?

Цитата:

Тем самым для вычисления одного элемента произведения матриц нужно выполнить 2*N арифметических операций и 2*N чтений из глобальной памяти. Понятно, что в данном случае основным лимитирующим фактором является скорость доступа к глобальной памяти, которая весьма низка. Каким образом отдельные нити группируются в блоки не важно и не оказывает значительного влияния на быстродействие, которое в данном случае оказывается весьма невысоким.

Пример с habr о современной модели освещения BDRF https://habrahabr.ru/company/mailru/blog/248873/

Цитата:

Основной минус технологии — нужна большая пропускная способность памяти. Мы стараемся максимально упаковать параметры поверхности, необходимые для освещения. В результате мы пришли к формату, который укладывается в 128 бит на пиксель — 96, если не учитывать информацию о глубине.

Что в простейшем случае что в продвинутой модели BRDF - везде говорят о минусе алгоритма как слишком требовательном к ПСП. Какой из этого можно сделать вывод? Если бы не ограничения ПСП, возможно, мы бы могли увидели гораздо реальнее картинки в реальном времени чем сегодня. Но никто в здравом уме не будет делать алгоритмы адекватно работающие только на Фуре Х.

Tovbot писал(а):

А фура слилась?

Просто если хомяки не видят профита сегодня от HBM, то для них значит слила. И с ними сложно поспорить, потому что сегодняшние игры из кожи вон лезут чтобы не нагружать ПСП

Nimrael

Добавлено: 04.04.2016 19:40

[профиль]

Member
Статус: Не в сети
Регистрация: 28.03.2016

snake32 писал(а):

Увлекаюсь программированием графики/шейдеров/расчётами не видеокарте.
Зайдите например на http://steps3d.narod.ru/tutorials/cuda-tutorial.html в простейший примере CUDA вычисление перемножение матриц(N*N):
Тем самым для вычисления одного элемента произведения матриц нужно выполнить 2*N арифметических операций и 2*N чтений из глобальной памяти. Понятно, что в данном случае основным лимитирующим фактором является скорость доступа к глобальной памяти, которая весьма низка. Каким образом отдельные нити группируются в блоки не важно и не оказывает значительного влияния на быстродействие, которое в данном случае оказывается весьма невысоким.

Ничего, что вычислительный и графический (или микс-режим) по разному работают с памятью? В первом случае память работает как единый массив, во втором - как фактически кэш-память связанная с ROP-ами/L2 кэшем. Улавливаете разницу? В тех случаях, когда мы говорим о "сливе фуры" задействован отнюдь не режим расчетов. И фактически понятие "глобальная видеопамять" хоть и присутствует номинально, но, по факту, в основном используется память в режиме кэша, четко поделенная на сегменты.

Блок-схемка 970-ки

#77

snake32 писал(а):

Пример с habr о современной модели освещения BDRF https://habrahabr.ru/company/mailru/blog/248873/
Основной минус технологии — нужна большая пропускная способность памяти. Мы стараемся максимально упаковать параметры поверхности, необходимые для освещения. В результате мы пришли к формату, который укладывается в 128 бит на пиксель — 96, если не учитывать информацию о глубине.
Что в простейшем случае что в продвинутой модели BRDF - везде говорят о минусе алгоритма как слишком требовательном к ПСП. Какой из этого можно сделать вывод? Если бы не ограничения ПСП, возможно, мы бы могли увидели гораздо реальнее картинки в реальном времени чем сегодня. Но никто в здравом уме не будет делать алгоритмы адекватно работающие только на Фуре Х.

Там скорее неправильное использование терминов. Важна не суммарная псп, а быстрота общения буфер <-> ГПУ. Сам же буффер занимает АЖ 128бит (16байт) помноженное на к-во пикселей. При UHD (3840x2160) это 8.294.400 пикселей, которые займут АЖ 126МБ. При 2ГБ видеопамяти и 8-ми микросхемах, емкость каждой GDDR5 микросхемы 256МБ. Т.е., скорее всего, даже в идеальном варианте, задействованы будут примерно 4 микросхемы из 8-ми под этот буфер. Что касается HBM1, там ещё веселее: каждая микросхема (1гбайт) состоит из 8-ми 128-битных каналов, каждый емкостью, соответственно, ~125МБайт. Вероятность того, что контроллер памяти заполнит этим буфером ВСЕ 8 каналов в чипех 4 чипа = 32 канала памяти ничтожно мала. Т.е. по сути, ролять будет не столько суммарная ПСП, сколько скорость каналов. А теперь к цифрам: скорость одной микросхемы GDDR5 при 8ГГЦ в пиковом режиме 32ГБ/с (8гигабит на 1 пин помноженные на 32 пина GDDR5)/ Скорость 1-го канала HBM1 при 1.25ГГц = 16байт (128 бит) ширины канала * 1.25ГГц (поскольку при 1 ГГц скорость на пин 1ГБит/с)=20ГБайт/с. Т.е. чем меньше микросхем/каналов будет занято буфером, тем больше будет проигрыщш HBM1. И vice versa.
Это что касается достаточно объемного буфера. А когда речь начинает идти о более мелких файлах?

snake32 писал(а):

Хомяки, вроде вас, просто не понимают сути. HBM1 МОЖЕТ быть конкурентной в расчетах, но не очень хорошо подходит в игровом применении. Вот HBM2, где выборка в два раза больше, да ещё и есть псевдоканалы, что позволяет обращаться к двум банкам сразу (в новом режиме или просто удвоенная выборка в legacy-режиме) - это да. Она полностью бьет GDDR5 и иногда может уступать GDDR5X в некоторых сценариях.

Tovbot

Добавлено: 05.04.2016 7:52

[профиль]

Member
Статус: Не в сети
Регистрация: 01.02.2015

Nimrael писал(а):

HBM1 МОЖЕТ быть конкурентной в расчетах, но не очень хорошо подходит в игровом применении.

HBM1 прекрасно выполнила возложенные на нее задачи: обкатка технологии и снижение TDP карты. Все, большего на данном этапе от HBM1 не требовалось. Фурия получилась отличным конкурентоспособным продуктом.

Nimrael

Добавлено: 05.04.2016 12:19

[профиль]

Member
Статус: Не в сети
Регистрация: 28.03.2016

Tovbot писал(а):

В мечтах, разве что. Намного выше тепловыделение, выше себестоимость (естественно, что это важно не для конечного покупателя), выше транзисторный бюджет, ниже возможности разгона, одинаковая с конкурентом цена, сложнее размещение в корпусе (выносной радиатор).

snake32

Добавлено: 05.04.2016 12:35

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 03.06.2015
Откуда: Мос-ка с гиляки
Фото: 1

Nimrael писал(а):

Ничего, что вычислительный и графический (или микс-режим) по разному работают с памятью?

Откуда инфа? Сами выдумали? Дайте ссыль. Научитесь хоть как-то подкреплять свои выводы.
Кстати, на вашей же картинке нельзя обратиться к памяти минуя кэш. Так что там со вторым режимом работы памяти?

Добавлено спустя 29 минут 49 секунд:
И ещё. Вершинный, геометрический и два тесселяционных шейдера не работают с ROP'ами.
И даже фрагментный(пиксельный) тоже. Растеризация(использование ROP) происходит перед фрагментным.
Посмотрите на конвейер OpenGL, например.
https://www.opengl.org/wiki/Rendering_Pipeline_Overview

Tovbot

Добавлено: 05.04.2016 13:22

[профиль]

Member
Статус: Не в сети
Регистрация: 01.02.2015

Nimrael писал(а):

Мы имеем факт - карта продается за те же деньги что и конкурентная и обеспечивает сопоставимый уровень производительности. По тепловыделению там разница некритична. Разгон нынешних топам не дает нихрена - в FHD они зачастую и так тянут 60 fps, а в 4К не вытягивают даже в разгоне, он им добавляет считанные единицы fps. Поэтому разгон там исключительно для любителей дрочить на цыферки. Поэтому если разогнать зеленый туман из глаз, то даже такой фанат невидии как вы увидит что с точки зрения обычного пользователя фурия ничуть не хуже 980Ti по совокупности характеристик.
Что до себестоимости и транзисторного бюджета (заумь то какая) - опять вы лезете во внутреннюю кухню разработчиков и учите их жизни. Достаточно, один раз облажались уже с суперумным планировщиком в невидиевских картах:))

iG0Lka

Добавлено: 05.04.2016 13:45

[профиль] [Фотоальбом]

Advanced member
Статус: Не в сети
Регистрация: 05.01.2006
Откуда: мск
Фото: 5

Заканчивайте фанатскую войну Nvidia vs AMD
тема о Паскале.

_________________
✅ РЕМОНТ мышек! ✅ смотрите на овито объявление с красным крестом ✅

Новая тема /

Закрыто

Сообщений: 50 • Страница 3 из 3 • < 1 2 3

Список форумов » Сайт и конференция » Материалы сайта » Обсуждение новостей

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 14

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти: