Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 124
philz2 писал(а):
не правильная у тебя 6800, смотри мой результат выше, должно быть больше 7000 порок.
А мозгами немножко поработать? В 6800 отключены "лишние" по отношению к 5900 исполнительные блоки и выровнены частоты.
A-Lexus206 писал(а):
matocob А че на скрине fx4000?
Это Quadro FX 4000, то же самое что и 6800, в обеих видеокартах используется чип nv40
Visionaire писал(а):
У квадры только один квад оставил включенным?
Правильно. И 3 вершинника, как у 5900. А ещё частоты выровнял. И получил почти такой же результат. На скрине хорошо видно, что nVidia провела работу над ошибками над блоками исполнения пиксельных шейдеров - скорость исполнения выросла с 27,7 до 51,9 fps. Все остальное у 6800 осталось то же самое, что и у 5900, nVidia просто тупо нарастила число исполнительных блоков, когда техпроцесс 0,13 мкм был отлажен. А теперь, внимание, вопрос: является ли провалом конкуренция чипа с 4-мя конвейерами (FX5800/5900/5950) c чипом, у которого 8 конвейеров (Radeon 9700/9800)?
Member
Статус: Не в сети Регистрация: 22.11.2007 Откуда: dp.ua Фото: 0
Нашел мне продавец 4 планки KVR800X16-16/512 (non-ECC). Уже получил. Планки внешне идентичные по маркировке, но одна из них оказалась по SPD Toshiba. Но вроде все работает в куче. С радиатором облом вышел, не оказалось в наличии. Пока просто тот кулер приложил сверху, который к плате шел. Плата запустилась, только пришлось дохлую батарейку заменить. Карту пока поставил комплектную 9200LE Плата оказалась от ящика IBM, лого появляется при старте. Внешне биос вроде как интеловский от D850GB, название платы пишет. Как на ней шипят дроссели, это ппц. Никогда такого не встречал. Память греется, но не так, чтобы ужас-ужас. У меня была обычная Corsair DDR400 в серебристых радиаторах, она калилась примерно также. Биос урезанный, как на интеле обычно, с флешки грузиться умеет, Live XP грузилась долго-долго, ибо USB старой версии. Но вроде работает.
Member
Статус: Не в сети Регистрация: 12.05.2006 Фото: 44
Вот только сравнение не честно, потому что у 5900 каждый конвейер двухпоточный, а у 6800 каждый конвейер один поток. Следовательно 5900 обрабатывает в 2 раза больше шейдеров за такт. Чтоб уровнять их у 6800 нужно было оставить 8 блоков, а не 4, так как второй поток к каждому конвееру 6800 подругому не добавишь
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 124
TheRock666 писал(а):
Вот только сравнение не честно, потому что у 5900 каждый конвейер двухпоточный, а у 6800 каждый конвейер один поток.
На одном конвейере присутствуют либо 2 TMU (5900), либо 1 (6800), что никаких преимуществ 5900 не даёт TMU, для справки, занимается закраской полигонов после того как были проведены операции с вершинами и источниками освещения. Смысл делать 2-канальный пиксельный участок, если перед ним идёт "бутылочное горлышко" из 3 вершинных процессоров на 4 конвейера? https://docs.microsoft.com/ru-ru/window ... s-pipeline
TheRock666 писал(а):
Следовательно 5900 обрабатывает в 2 раза больше шейдеров за такт.
По факту, работает только один. Из-за непоняток в архитектуре 5800/5900 писали разные формулы: 8х1, 4х2 К тому же, на конвейере присутствовали не два пиксельных шейдера, как вы тут доказываете, а два текстурника, что погоды в исполнении шейдеров не делает. У 5900 великолепная скорость закраски, но преобразования текстур, за что отвечают шейдерные блоки, он выполняет весьма медленно. Однако, практика показывает, что какой бы ни была организация конвейера, эффективно он не работал, что и демонстрирует 3DMark. Причины - NV30 перерабатывали на ходу из-за проблем перехода на техпроцесс 0,13 мкм. Как только выход годных увеличился, nVidia выпустила карты на NV40, вернувшем изначальный баланс в архитектуру. И эта архитектура пережила ещё одну реинкарнацию - на ядре G70/G71 (7800/7900)
Последний раз редактировалось matocob 22.03.2020 19:24, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 02.04.2006 Откуда: Moscow
Попробовал вкорячить Квадру 1400 (6800GT) в свой комп(см.подпись), нашел самый последний драйвер для win 7 x64, но что то пошло не так, в общем на win 10 этот драйвер работает крайне медленно, ладно буду тестировать на системе с Атлон2 215.
Добавлено спустя 2 минуты 40 секунд: matocob Я не понимаю смысл чего то там отключать у 6800, надо тестировать в одинаковых условиях и тогда шансов у 5900 не будет никаких, потому что это крайне не удачная линейка у nvidia и они это сами в итоге признали, вот 6800 уже вышла более удачная, хотя она и сливала X800.
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 124
philz2 , это одна и та же микроархитектура GPU, пережившая 3 реинкарнации - 5900/6800/7900 О производительности 5900, 6800 и 7900 всем давно известно, тем не менее, в мозги всем впечатали, что серия 5900 неудачная А 6800 и 7900 - подъём с колен. Ну-ну
Member
Статус: Не в сети Регистрация: 02.04.2006 Откуда: Moscow
matocob писал(а):
это одна и та же микроархитектура GPU, пережившая 3 реинкарнации - 5900/6800/7900 О производительности 5900, 6800 и 7900 всем давно известно, тем не менее, в мозги всем впечатали, что серия 5900 неудачная
это не важно, главное что 6800 быстрее, чем любая 5-я серия, не говоря уже про 7900, сейчас вообще приросты в новых GPU крайне низкие, давно уже нету революционных идей в этом направлений, после 8800gtx считай их и не было больше, тупо просто больше блоков ставят и все, а уж бредовые лучи это вообще зашквар полнейший, чтобы хомячков доить.
Advanced member
Статус: Не в сети Регистрация: 30.04.2013 Откуда: Москва Фото: 0
philz2 писал(а):
это не важно, главное что 6800 быстрее, чем любая 5-я серия, не говоря уже про 7900, сейчас вообще приросты в новых GPU крайне низкие, давно уже нету революционных идей в этом направлений, после 8800gtx считай их и не было больше, тупо просто больше блоков ставят и все, а уж бредовые лучи это вообще зашквар полнейший, чтобы хомячков доить.
это не так,сравни производительность 580 780ti 980ti 1080ti 2080ti каждая следующая быстрее предыдущей и прилично
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 124
philz2 писал(а):
главное что 6800 быстрее, чем любая 5-я серия
За счёт 3- или 4-кратного увеличения числа конвейеров. Сам конвейер при этом не стал быстрее. Если бы у nVidia была возможность впихнуть в 5900 хотя бы 8 конвейеров, или она честно опубликовала данные по архитектуре, то не было бы такого разочарования И всякие "эксперты" не утверждали бы о провале, потому что было бы очевидно, что некорректно сравнивать 4-конвейерную карту с 8-конвейерной.
Member
Статус: Не в сети Регистрация: 02.04.2006 Откуда: Moscow
Remarc писал(а):
это не так,сравни производительность 580 780ti 980ti 1080ti 2080ti каждая следующая быстрее предыдущей и прилично
я начинаю думать о замене карты, когда есть хотя бы 150% прибавка, вот сейчас у меня 1070, значит следующая карта которая меня устроит будет 2080, а вот тупо менять через поколение это бред, так обычно хомячков и доят.
Добавлено спустя 2 минуты 13 секунд:
matocob писал(а):
потому что было бы очевидно, что некорректно сравнивать 4-конвейерную карту с 8-конвейерной.
ну знаешь сравнивают же 10-ю серию с 20-й, а там тоже тупо просто блоков добавили, по сути архитектура такая же.
Member
Статус: Не в сети Регистрация: 12.05.2006 Фото: 44
matocob писал(а):
И всякие "эксперты" не утверждали бы о провале, потому что было бы очевидно, что некорректно сравнивать 4-конвейерную карту с 8-конвейерной.
Корректно, потому что у 5900 каждый конвейер двухпоточный, и TMU тут непречем, там именно двухпоточная обработка пиксельных шейдеров на каждый конвейер, что не отменяет того что и TMU может быть с подобной организацией. Я привел вам пруфы, там все видно. В 6800 серии изменили конвеер кардинально, сделав его однопоточным, но увеличив количество блоков.
Добавлено спустя 1 минуту 1 секунду: Что 8 конвееров выполняют 8 шейдеров у 6800, что 4 двухпоточных теже 8 шейдеров.
Добавлено спустя 2 минуты 3 секунды:
matocob писал(а):
Смысл делать 2-канальный пиксельный участок, если перед ним идёт "бутылочное горлышко" из 3 вершинных процессоров на 4 конвейера?
Да потому что инженеры Нвидиа тупанули и сделали убогое говно, вот и весь смысл. Они сами это потом признали и провели работу над ошибками.
Добавлено спустя 2 минуты 33 секунды:
matocob писал(а):
И всякие "эксперты" не утверждали бы о провале, потому что было бы очевидно, что некорректно сравнивать 4-конвейерную карту с 8-конвейерной.
Это не имеет значения. Даже еслиб она имела 4 конвеера с 1 потоком, то там больше чем в 9800xt количество транзисторов, сама карта греется так что пришлось вешать турбину и при этом на более тонком техпроцессе чем Радеон. Так или иначе это был ужасный провал.
Добавлено спустя 2 минуты 54 секунды:
philz2 писал(а):
ну знаешь сравнивают же 10-ю серию с 20-й, а там тоже тупо просто блоков добавили, по сути архитектура такая же.
Скорее у 10 и 9 серии одна архитектура, это подтверждает равные результаты на равных частотах. Там просто частоты наростили и все. А 2080 все-таки архитектурно отличается. Но если говорит о совсем новом то Нвидия до сих пор доит архитектуру Fermi, внося небольшие изменения и наращивая частоты. По факту даже 2080 это эволюция Fermi.
_________________ [quote="Prof"]как отдать 700Вт, если ты взял 500? легко за счёт вольтажа[/quote]
Последний раз редактировалось TheRock666 22.03.2020 20:35, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 124
TheRock666 писал(а):
Корректно, потому что у 5900 каждый конвейер двухпоточный, и TMU тут непречем, там именно двухпоточная обработка пиксельных шейдеров на каждый конвейер, что не отменяет того что и TMU может быть с подобной организацией. Я привел вам пруфы, там все видно. В 6800 серии изменили конвеер кардинально, сделав его однопоточным, но увеличив количество блоков.
Добавлено спустя 1 минуту 1 секунду: Что 8 конвееров выполняют 8 шейдеров у 6800, что 4 двухпоточных теже 8 шейдеров.
Специально для слабовидящих
FX5900 PixelShaders
Вложение:
fx5900 (1).png [ 27.3 КБ | Просмотров: 165 ]
А теперь поясните, откуда у вас информация про 2 блока PixelShaders на конвейер?
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 124
TheRock666 , вопрос был - ОТКУДА? Вот спецификация TechPowerUP https://www.techpowerup.com/gpu-specs/g ... x-5900.c77 То что в чипе 8 TMU не делает его ни 8-конвейерным, ни 4-конвейерным с 2-канальной организацией. На карте 4 блока пиксельных шейдеров и 3 - вершинных.
Member
Статус: Не в сети Регистрация: 31.07.2006 Откуда: Академгородок П Фото: 124
Visionaire , всё это хорошо, только практикой не подтверждается. Наличие 8 пиксельных процессоров никак не даёт о себе знать, потому что в современной 3D-графике не используются целочисленные вычисления. А искусственно придуманная формула 4х2 выливается в простой одного из пиксельных блоков https://www.ixbt.com/video2/gffx-ref.shtml
Цитата:
NVIDIA пришлось ограничится 4 пиксельными процессорами
Дополнение: после выхода нашего материала в Сети стали раздаваться слухи о том, что архитектура конвейеров рендеринга вовсе не 8x1, а 4х2, поэтому мы провели еще одно исследование:
Как вы можно видеть на диаграмме зависимости скорости заполнения от количества текстур и других бенчмарках, GeForce FX ведет себя очень похоже на GPU, со схемой пиксельных конвейеров 4x2, то есть 4 пиксельных конвейера с 2 TMU на каждом. Однако как мы уже отмечали, при операциях с буфером глубины и буфером шаблона (depth & stencil) NV30 обрабатывает 8 пикселов за такт (при условии, что параллельно не ведутся какие либо операции с цветом). В остальных случаях обрабатываются 4 пикселя. Но, каждый из четырех пиксельных процессоров содержит два целочисленных ALU (две стадии) соединенных последовательно (так же как в NV25, видимо текстурные блоки и целочисленные стадии были разработаны с оглядкой на предыдущее поколение). Таким образом можно говорить о том, что за один такт выполняется сразу две команды шейдера, если его версия не превышает 1.3 или сразу две операции комбинационных стадий для старых, нешейдерных приложений (DX7). Причем, т.к. эти операции выполняются фактически над разными пикселами, они всегда могут происходить параллельно и таким образом целочисленная производительность NV30 при равной тактовой частоте эквивалентна 8 конвейерному чипу, но с одним ALU на каждом конвейере. Однако это касается только конфигураций стадий и шейдеров длинной как минимум две операции.
Таким образом, одновременно могут выполняться до 8 выборок текстур И 8 целочисленных математических операций за такт. Я умышленно выделил "И", показывая, что данные операции выполняются одновременно.
В случае шейдеров 1.4 и тем более 2.0, выполняющихся на NV30 с плавающей точкой, каждый пиксельный конвейер может выполнить лишь одну операцию за такт — таким образом всего чип выполняет по одной комманде для 4 пикселов за такт, что вдвое ниже производительности с целочисленными шейдерами. Но это еще не все — плавающие комманды не могут выполнятся одновременно с выборкой текстур! Т.е. за один такт мы можем либо выбрать 8 значений текстур, либо выполнить 4 плавающих операции шейдеров. Таким образом, NV30 вдвое (и даже более, если учесть выборку текстур) производительнее в не использующих плавающую арифметику применениях.
Итак, за один такт:
8 выборок текстур и 8 целочисленных операций над 4 пикселами. или 4 плавающих операции над 4 пикселами. или вычисление и запись 8 значений глубины и буфера шаблонов. Мы благодарим Джона Спитцера (John Spitzer), специалиста компании NVIDIA, который объяснил нам данную особенность архитектуры NV30 на конференции "DAWN to DUSK" в Москве. Почему была выбрана такая схема? Специалисты NVIDIA подчеркивают, что GeForce FX имеет архитектуру, оптимизированную под современные игры и сбалансированную с ПСП ее шины памяти. Многие современные игры уже сейчас используют stencil буфер для визуализации теней, и количество таких игр будет расти, достаточно вспомнить грядущий Doom III. GeForce FX прекрасно оптимизирован для данной технологии. Мультитекстурирование также уже стало стандартным для большинства современных игр, и "быстрые" TMU GeForce FX обеспечат высокую производительность в данных играх. Для 128 битной шины подобное чило конвейеров и подобный подход выглядят вполне логичными — наличие 8 конвейеров и возможности записать 8 значений цвета за такт не было бы полностью реализовано из за ограниченной ПСП но при этом добавило бы изрядную часть транзистров. Не лучше ли пустить их на более реентабельные применения, такие как кеширование или ускоренные операции с буфером шаблонов? Видимо, инженеры NVIDIA так и рассудили.
Ну а для разработчиков GeForce FX предоставляет огромные возможности, поддерживая шейдеры, намного превосходящие стандартные для DX9 ( версия 2.0) хотя и медленее чем старые 1.1…1.3 версии. Когда игры, интенсивно использующие подобные шейдеры и плавающие вычисления появятся в магазинах, там же будут находиться продукты компании NVIDIA следующего поколения, более агрессивно оптимизированные под плавающие операции…
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения