В связи с этим вопросы: 1. Почему не грузит до гигабайта? 2. Скорость падает потому, что тестит занятую область?
1. Потому что и OpenCL и CUDA не могут заставить ГПУ использовать память так, как им хочется. в связи с чем идет оффлоад в системную память, что отлично видно по времени. 2. Сложно сказать, на самом деле. И то ли контроллер VRAM получив задание на запись кусков в VRAM начинает выкидывать первые полученные куски, то ли идет сразу ОЗУ-видеокарта-ОЗУ. Детально можно было бы понять, просматривая дампы памяти на участках кэша ГПУ в системной памяти.
Member
Статус: Не в сети Регистрация: 17.02.2006 Откуда: Москва, Ясенево
Страннно, что никто из партнёров не спешит защитить честное имя Хуанга. Могли бы хоть сказать - число ROP для GTX-970 - 64 или всё-таки 56 ? *для этого-то бенчмарки не нужны
Я думаю, всем фанатам Nvidia сейчас надо скрестить пальцы и надеяться, чтобы 100% выяснилось, что GTX 970, таки, является 208 битным обрезком с неработающей частью памяти. В противном случае, получится, 970 не сильно отстает от 980 и, Nvidia, имеет право потребовать и потребует, от всех покупателей 970GTX, дополнительной доплаты за свой продукт. Придется доплачивать, как-то находить деньги, может перезанимать... Но давайте не думать о плохом, все говорит о том, что 970 все-таки 208-бит огрызок, вряд-ли придется доплачивать.
В статье написано, что скорость доступа к 0.5 гб памяти ниже плинтуса.
Потому что они дебилы, которые замеряли все говнобенчем. Для того, чтобы реально проверить все куски памяти, нужно сделать миниядро, которое НЕ ПОЗВОЛИТ ГПУ выгружать данные в кэш в системной памяти. Или нужно детально разбираться с тем, как именно работает контроллер VRAM, и когда он что и куда выгружает. Факт в том, что при около-100% заполнении VRAM реальными приложениями, фризов и серьезных просадок не возникает. Что недвусмысленно говорит о том, что затыков в обмене информации между двумя массивами нет. Я не знаю, чем ещё мерять можно.
Цитата:
Это значит, что если игра или иное приложение загрузит все 4 гигабайта данными, требующими высокой пропускной способности памяти, то 970ая тут же просядет со всеми вытекающими последствиями в виде фризов, лагов и прочих радостей. Пока, судя по всему, игры кое-как в 3.5 гига помещаются, но это вовсе не значит, что тому же Ведьмаку 3.5 гигов хватит.
Нет. Это значит, что если ОС вдруг вхреначит ОДНОМОМЕНТНО более 3.5ГБ данных в память видеокарты, да ещё и крупными кусками, то у карты возникнут проблемы. Но поскольку текстуры 128МБ практически не бывают (если что, это 5мегапикселей - я таких текстур кроме профессиоанльных видеокарт не встречал, и то там это огромная редкость), да и необходимости сразу взять и впендюрить 3.5ГБ, которые нужно вот просто взять и впихнуть и использовать сразу массивом в более 3.5ГБ - в реальности ничего страшного не будет, контроллер VRAM легко и непринужденно будет тасовать данные между массивами, теряя 1-2% производительности карты. А если, как придурок Nai, впендюривать такие куски данных в таком объеме - то неудивительно, что карте поплохеет. Человек тоже может выпить несколько литров жидкости. Но постепенно. А если попробовать их залить все и сразу - получатся проблемы. Просто не нужно заниматься глупостями, которые никому нафиг нигде не нужны.
Member
Статус: Не в сети Регистрация: 01.05.2011 Откуда: Санкт-Петербург Фото: 9
K@mcA писал(а):
Я думаю, всем фанатам Nvidia сейчас надо скрестить пальцы и надеяться, чтобы 100% выяснилось, что GTX 970, таки, является 208 битным обрезком с неработающей частью памяти. В противном случае, получится, 970 не сильно отстает от 980 и, Nvidia, имеет право потребовать и потребует, от всех покупателей 970GTX, дополнительной доплаты за свой продукт. Придется доплачивать, как-то находить деньги, может перезанимать... Но давайте не думать о плохом, все говорит о том, что 970 все-таки 208-бит огрызок, вряд-ли придется доплачивать.
Member
Статус: Не в сети Регистрация: 19.12.2013 Фото: 8
Усем Прювет!!! Моё мнение: всё это бред, и 3.5 и 500, и 208 шина, всё. Можно попробовать проверить, но нужна помощь, т.к. у меня невозможно это сделать. Кто готов?
Я думаю, всем фанатам Nvidia сейчас надо скрестить пальцы и надеяться, чтобы 100% выяснилось, что GTX 970, таки, является 208 битным обрезком с неработающей частью памяти. В противном случае, получится, 970 не сильно отстает от 980 и, Nvidia, имеет право потребовать и потребует, от всех покупателей 970GTX, дополнительной доплаты за свой продукт. Придется доплачивать, как-то находить деньги, может перезанимать... Но давайте не думать о плохом, все говорит о том, что 970 все-таки 208-бит огрызок, вряд-ли придется доплачивать.
Казалось бы, о чем выше писали. У профессиональных фанатов АМД мозг совсем атрофировался?
_________________ СМЕРШ - СМЕРть Школоте.
Последний раз редактировалось Sonic-Chainik 27.01.2015 14:27, всего редактировалось 1 раз.
В 970й не 64 ROP'а, а 56. Не 2048 КБ Кэша второго уровня, а 1792 Кб
Ответ Nvidia
NVIDIA says this was an error in the reviewer’s guide and a misunderstanding between the engineering team and the technical PR team on how the architecture itself functioned. That means the GTX 970 has 56 ROPs and 1792 KB of L2 cache compared to 64 ROPs and 2048 KB of L2 cache for the GTX 980.
Оказывается, это глупые маркетологи все напутали. Видимо, это маркетологи научились прошивать биос так, что GPU-Z видит 64 ROP. И еще, там не 208 бит, а 224 (7 чипов памяти по 32 бита).
#77
_________________ читыри едра восимь гига и иргавая видиокарта восимь гига
Member
Статус: Не в сети Регистрация: 17.02.2006 Откуда: Москва, Ясенево
Vitaly писал(а):
Видимо, это маркетологи научились прошивать биос так, что GPU-Z видит 64 ROP.
GPU-Z "видит" то, что ей скажет биос. Это в лучшем случае.. а может взять и из собственной таблички. Думаю, и биос можно прошить так, что GPU-Z "увидит" и 1000 ROP.
Оказывается, это глупые маркетологи все напутали. Видимо, это маркетологи научились прошивать биос так, что GPU-Z видит 64 ROP. И еще, там не 208 бит, а 224 (7 чипов памяти по 32 бита).
Потому что они дебилы, которые замеряли все говнобенчем
Спросил у них в комментариях, откуда они взяли цифру в 1/7 скорости доступа. Как я понял, они просто спросили у нвидиевского инженера, и он им выдал эту цифру, основываясь на ТТХ архитектуры.
aasheron писал(а):
Нет. Это значит, что если ОС вдруг вхреначит ОДНОМОМЕНТНО более 3.5ГБ данных в память видеокарты, да ещё и крупными кусками, то у карты возникнут проблемы. Но поскольку текстуры 128МБ практически не бывают (если что, это 5мегапикселей - я таких текстур кроме профессиоанльных видеокарт не встречал, и то там это огромная редкость), да и необходимости сразу взять и впендюрить 3.5ГБ, которые нужно вот просто взять и впихнуть и использовать сразу массивом в более 3.5ГБ - в реальности ничего страшного не будет, контроллер VRAM легко и непринужденно будет тасовать данные между массивами, теряя 1-2% производительности карты. А если, как придурок Nai, впендюривать такие куски данных в таком объеме - то неудивительно, что карте поплохеет. Человек тоже может выпить несколько литров жидкости. Но постепенно. А если попробовать их залить все и сразу - получатся проблемы. Просто не нужно заниматься глупостями, которые никому нафиг нигде не нужны.
Мысль понятна, спасибо. К сожалению, я не инженер и не программист, поэтому привести каких-то аргументов против я не могу. Для себя в статье я самую важную информацию почерпнул: скорость доступа к 0.5 гб памяти ("on its own and in a vacuum", как сказано в статье) действительно ниже, чем к 3.5 гб. Вне зависимости от того, окажется ли это критично в приложениях или играх, лично я такую видеокарту никогда не куплю.
Member
Статус: Не в сети Регистрация: 19.12.2013 Фото: 8
Я вижу всем по барабану. Ну слушайте дальше сказки про розовых слоников... А по сути... кто-нибудь может объяснить, как 64 битный контролер может различать 2 чипа памяти и определять какая из них быстрая а какая медленная? Выше привидена схема под спойлером, но не указаны контроллеры, а их там 4 штуки. Короче бред
This in turn is why the 224GB/sec memory bandwidth number for the GTX 970 is technically correct and yet still not entirely useful as we move past the memory controllers, as it is not possible to actually get that much bandwidth at once on the read side. GTX 970 can read the 3.5GB segment at 196GB/sec (7GHz * 7 ports * 32-bits), or it can read the 512MB segment at 28GB/sec, but not both at once; it is a true XOR situation. Furthermore because the 512MB segment cannot be read at the same time as the 3.5GB segment, reading this segment blocks accessing the 3.5GB segment for that cycle, further reducing the effective memory bandwidth of the card. The larger the percentage of the time the crossbar is reading the 512MB segment, the lower the effective memory bandwidth from the 3.5GB segment.
На следующей странице:
Цитата:
The complex part of this process occurs once both memory segments are in use, at which point NVIDIA’s heuristics come into play to try to best determine which resources to allocate to which segments. How NVIDIA does this is very much a “secret sauce” scenario for the company, but from a high level identifying the type of resource and when it was last used are good ways to figure out where to send a resource. Frame buffers, render targets, UAVs, and other intermediate buffers for example are the last thing you want to send to the slow segment; meanwhile textures, resources not in active use (e.g. cached), and resources belonging to inactive applications would be great candidates to send off to the slower segment. The way NVIDIA describes the process we suspect there are even per-application optimizations in use, though NVIDIA can clearly handle generic cases as well.
Видеокарта жонглирует данными как может, пытаясь определить, в какую память какие данные лучше засунуть.
Цитата:
But perhaps the most frustrating scenario isn’t having more than 3.5GB of necessary resources, but having more than 3.5GB of unnecessary resources due to caching by the application. One VRAM utilization strategy for games is to allocate as much VRAM as they can get their hands on and then hold onto it for internal resource caching, increased view distances, or other less immediate needs. The Frostbite engine behind the Battlefield series (and an increasing number of other EA games) is one such example, as it will opportunistically allocate additional VRAM for the purpose of increasing draw distances. For something like a game this actually makes a lot of sense at the application level – games are generally monolithic applications that are the sole program being interacted with at the time – but it makes VRAM allocation tracking all the trickier as it obfuscates what a game truly needs versus what it merely wants to hold onto for itself. In this case tracking resources by usage is still one option, though like the overall theme of real world performance implications, it’s going to be strongly dependent on the individual application.
А вот тут пишут, что с Фростбайтом 970й будет тяжелее работать, т.к. он кучу ресурсов кэширует. В общем, ну ее нафиг, на рынке куча видеокарт с полноценными 4 гигами есть.
Member
Статус: Не в сети Регистрация: 12.03.2003 Откуда: Калининград
ЧОрд. Почему же я не расстроен и у меня "кривая" 970 работает так же быстро и качественно, как "прямая" 780Ти и "прямейшая" 290Х ?
Добавлено спустя 48 секунд:
Gatto62 писал(а):
Самоокозление "детектед". . Так допиши уж полностью - зачем метать бисер перед свиньями? Они же этого всё равно не смогут оценить
Еще один не смог
_________________ Lorichic писал(а):Память покупается на весь срок жизни. АМ4 - Сокет свободных людей (с)XRR 14600kf\Zotac 5070ti Solid Core OC\2x16Gb DDR4-3200@4000CL16
Member
Статус: Не в сети Регистрация: 23.08.2009 Откуда: Италия Фото: 58
cypher1999 писал(а):
Еще один не смог
Не могу оценить ваше чувство юмора Это Ви про сьебя? Я же "оценил" поделки Хьюанга ещё лет 7 назад и стараюсь не наступать на одни и те же грабли и по сей день. Но если Вам ЭТО нравится - пользуйтесь и верьте, ведь вера - это главное.
Member
Статус: Не в сети Регистрация: 12.03.2003 Откуда: Калининград
Gatto62 писал(а):
Не могу оценить ваше чувство юмора
Для вас это простительно
Gatto62 писал(а):
Я же "оценил" поделки Хьюанга ещё лет 7 назад
Детские обиды, понимаю, понимаю !
Gatto62 писал(а):
и стараюсь не наступать на одни и те же грабли
Надеюсь, вам это когда-нибудь удастся в полной мере !
Gatto62 писал(а):
Но если Вам ЭТО нравится - пользуйтесь и верьте, ведь вера - это главное
Верят во что-то Я же говорю о том, что вижу. В веру ударяются обычно безнадежно больные.... А вижу я то, что моя 970 работает отлично и тест, сделанный кривыми руками индусских программеров работать отлично моей карте никак не мешает Еще я вижу, что и на амд и на других картах ситуация в данном тесте абсолютно схожая, т.е. скорость падает на последних мегабайтах Еще я всегда поражался людям, которые столь сильно переживают за потраченные мною деньги, что готовы из-за этого исходить на понос и доказывать, какой я дурак Вообще, имхо, на АМД сидят те, кому на НВ денег не хватило
_________________ Lorichic писал(а):Память покупается на весь срок жизни. АМ4 - Сокет свободных людей (с)XRR 14600kf\Zotac 5070ti Solid Core OC\2x16Gb DDR4-3200@4000CL16
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 16
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения