Заблокирован Статус: Не в сети Регистрация: 02.12.2003 Откуда: Moscow, Russia
GReY Я о другом: память обрезали ещё сильнее, чем если бы просто была 128-битная шина.
Зачем это сделали - скорее всего, из-за того, чтобы не создавать конкуренции остальным картам линейки.
Посмотри:
GeForce 6600 GT имеет примерно такой же пиксельный и вершинный филлрейт, как и GeForce 6800.
Представим, что у GeForce 6600 GT была бы нормальная 128-битная память, значит, разница по ПСП была бы на 40% в пользу 6800 (+проценты за более низкую латентность), что, в свою очередь, означало бы, что 6800 в самом худшем случае для 6600GT будет впереди на 40%(высокие разрешения с АА).
А теперь смотрим на MSRP:
6600GT - 199$
6800 - 299$
Т.е. цена 6800 на 50 процентов больше, а производительность только в некоторых режимах больше на 40 процентов.
Естественно, что при таком соотношении цен и производительности GeForce 6800 автоматически переходит в категорию трупов(вопрос об AGP vs PCX вынесём за скобки ).
Поэтому-то NV и обрезала работу с памятью у NV43 по самое "не хочу", гораздо сильнее, чем это может показаться на первый взгляд.
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
Mikhail_P Не думаю. Для записи всех восьми значений цвета уже понадобится пропускная способность 1000 МГц памяти, а что останется вертексным юнитам? Поэтому запись в память "проредили".
Искусственное ограничение, судя по всему, коснулось компрессии цвета. Потому что антиалиастнг бьёт по результатам горазда сильнее, чем ожидается. Вспоминая, как на GeForce 4 NV отключали сжатие Z, сегодня вполне допускаю этот вариант.
Member
Статус: Не в сети Регистрация: 20.06.2003 Откуда: Ижевск
GReY
Цитата:
GeForce 4 NV отключали сжатие Z
Отключали HSR..
А вообще по теме, 3DMark начиная с 2003 это не тест производительности видеокарты,
а тест скорости шейдеров. Удивительно бы было, если бы на него влияла частота памяти
или не влияло отключение конвейеров вертексных шейдеров.. Он упирается именно в
скорость вычислений вертекс/пиксель шейдеров, и будет в них упираться в ближайших
поколениях видеокарт... в отличие от того-же Doom3, который несмотря на очень спорную
по качеству графику, гораздо лучше сбалансирован для нынешних видеокарт.
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
awl Не согласен. DooM 3 имеет очень сильный перекос в сторону текстурной нагрузки. Если отключить сжатие текстур, ни одна сегодняшняя конфигурация его нормально не потянет. Однако же и в нём зависимость от частоты памяти ничтожна.
А 3DMark05 далеко не только в скорость шейдеров упирается.
У GeForce 6600GT два пиксельных и три вертексных юнита, частоты 500/1000 МГц, но память имеет 128-битный интерфейс, поэтому расчетную цифру необходимо удвоить. После несложных расчетов получается, что для этого графического акселератора необходима память с эффективной частотой не менее 1333 МГц, то есть производительность этого варианта GeForce 6 всё же «упирается» в скорость памяти. Как видите, расчеты очень неплохо кореллируют со значениями, выбранными производителем, а все варианты GeForce 6800 отлично сбалансированы по частотам памяти и ядра, чего не скажешь о GeForce 6600GT
Не стоит сразу применять ращётную методику от 6800 для 6600, нужно провести такоеже тестирование для 6600 ,а потом уже выщитывать оптимальную частоту памяти.
Member
Статус: Не в сети Регистрация: 15.06.2003 Откуда: Москва
Цитата:
Далее - прирост мизерный и составляет в случае 2.8 -> 3.6 аж 2.5%.
Mikhail_P Как раз на это своим "сюда", я ихотел обратить внимание Ыч
_________________ Сегодня, я вижу, особенно грустен твой взгляд И руки особенно тонки, колени обняв. Послушай: далёко, далёко, на озере Чад Изысканный бродит жираф...
Заблокирован Статус: Не в сети Регистрация: 02.12.2003 Откуда: Moscow, Russia
GReY Из обзора на iXBT:
Цитата:
Но факт остается фактом. Совершенно идентичный по полосе пропускания памяти и числу конвейеров 6800 GT (350/250) на основе NV40 выступает в случае маленького числа текстур (а, следовательно, и максимальной нагрузки на запись буфера кадров) гораздо эффективнее 6600 GT (350/500) на основе NV43, то есть 6600 считает 8 пикселей за такт, но записывает в буфер кадра только 4(!) за такт, а пока идет обсчет пиксельным шейдером следующих значений, то записываются оставшиеся 4 пикселя. Это может ввести некоторых в заблуждение, что у NV43 4 конвейера, но 8 текстурников, но это не так. В принципе, можно эту меру оправданной, т.к. шейдеры работают как минимум с двумя командами.
Хотя я так прикинул - памяти на 1000 SDR-MHz 6600GT вроде должно хватить.
awl "Не только" не означает "совсем не из-за".
OFFensiv Чисто флудерский пост.
Добавлено спустя 1 минуту, 42 секунды: tropikante Если я вас неправильно понял, то сорри.
Юрий "Хоть горшком назови - только в печь не ставь." (c) Народное
Member
Статус: Не в сети Регистрация: 31.01.2004 Откуда: Das Deutsche...
GReY За статью спасибо. А вот практическая ценность (для большинства) будет незначительной. Да, ПСП хватает, но при разгоне об этом никто не задумается: 800МГц "круче", чем 700МГц и все тут! А вывод "чем больше юнитов, тем лучше" знают все, и никого не интересует насколько. Хотя мне статья понравилась, полезно для "понимания зависимостей".
_________________ И прежде чем взошла заря,
Рабы зарезали царя... (Г. Гейне, Валтасар)
Заблокирован Статус: Не в сети Регистрация: 02.12.2003 Откуда: Moscow, Russia
GReY Последний момент:
Хотя на сегодняшний день для архитектуры GeForce 6 минимально-достаточным является количество вертексных юнитов на один больше, чем пиксельных, в перспективе геометрическая производительность может стать слабым местом GeForce 6600 в сравнении с конкурирующими продуктами.
Для наиболее "тяжелых" игр в перспективе будет все больше и больше характерен упор в производительность пиксельных шейдеров, чем в геометрию, IMO.
По твоим же тестам видно, что в 3DMrak05 при теоретическом пиксельном филлрейте в 3900 с вершинная производительность наиболее заметно растёт в случае 3x325->4x325 VU; рост 5x325->6x325 минимален. У Х700 при теоретической пиксельной производительности 3800 вершинная будет 6х475 - тут вообще можно экстраполяцию сделать, что прирост производительности от шести вершинных блоков будет мизерный.
Вот в программах трёхмерного моделирование - да, повышенная вершинная производительность будет очень кстати.
Добавлено спустя 5 минут, 37 секунд: [Дополнение]
Даже в Unreal2, которая очень любит "тупую" геометрию (разница между 6800 и 6800LE даже при анизо 16х несильно выражена), преимущество Х700 минимально, и то далеко не везде...
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
awl
Цитата:
Почему тогда в нём на всех GF FX такой дичайший слив? У них ведь больше нет слабых мест, кроме как в пиксель-шейдерах.
Просто у FX такая низкая производительность PS2.0, что она становится бутылочным горлышком.
OFFensiv
Цитата:
Не стоит сразу применять ращётную методику от 6800 для 6600, нужно провести такоеже тестирование для 6600 ,а потом уже выщитывать оптимальную частоту памяти.
Архитектура у них идентичная, поэтому методику можно распространять. А вот провести тесты действительно было бы интересно. Очень надеюсь, что кто-нибудь подхватит эстафету.
Юрий
Цитата:
Уж сколько раз твердили миру - вершинные блоки... Нет блин, "вертексные юниты".
Что есть вершинный блок? Vertex unit - говорящее за себя определение, в отличие от.
Mikhail_P
Цитата:
Хотя я так прикинул - памяти на 1000 SDR-MHz 6600GT вроде должно хватить
Чем 1000 SDR отличается от 1000 DDR? Пропускная способность та же
Цитата:
Для наиболее "тяжелых" игр в перспективе будет все больше и больше характерен упор в производительность пиксельных шейдеров, чем в геометрию, IMO
Позволю себе не согласиться, это плоскопараллельные вещи. По сути, пиксельные шейдеры выполняют роль текстур, т.е. их результат нужно накладывать на полигоны. Количество полигонов ограничивается только мощностью видеокарт, на которые рассчитывалась игрушка.
Цитата:
По твоим же тестам видно, что в 3DMrak05 при теоретическом пиксельном филлрейте в 3900 с вершинная производительность наиболее заметно растёт в случае 3x325->4x325 VU; рост 5x325->6x325 минимален.
Она только в simple vertex мало растёт, в остальных практически линейная зависимость.
Заблокирован Статус: Не в сети Регистрация: 02.12.2003 Откуда: Moscow, Russia
GReY
Цитата:
Чем 1000 SDR отличается от 1000 DDR? Пропускная способность та же
Это - да, но многие любят указывать только удвоенную частоту для DDR и может возникнуть путаница.
Цитата:
По сути, пиксельные шейдеры выполняют роль текстур, т.е. их результат нужно накладывать на полигоны.
Текстура - это текстура, а шейдер - это шейдер. Не случайно же два разных термина ввели.
Насчёт плоскопараллельности - сейчас агрессивно внедряются именно шейдеры, и, соответственно, чипы под них: во времена R3x0 имело место соотношение 2 вершинника на квад, а сейчас уже 3 вершинника на 2 квада. Далее - см. ниже.
Цитата:
Она только в simple vertex мало растёт, в остальных практически линейная зависимость.
Kij - отношение увеличения шейдерной производительности с i-того кол-ва вершинников до j-того к приросту производительности.
Например, К34 для общего счёта в 3DMark равен (4/3)/(3091/2771)
Линейность всё же сомнительная. И это - для самого зависимого от геометрии игрового теста.
Я не случайно привёл дааные и по Unreal2, чтобы показать, насколько акутально преимущество Х700 по геометрии относительно 6600. И если будет идти плоскопараллельное развитие, или близкое к нему(тут уже вопрос плоскости как что называть ), то соотношение, продемонстрированное в играх сегодняшних и 3DMark05 распространится и на то, что будет в играх будущих, т.е. 6 вершинников для Х700 будут скорее избыточными, чем реально востребованной для игр фичей.
Member
Статус: Не в сети Регистрация: 20.06.2003 Откуда: Ижевск
GReY
Цитата:
Просто у FX такая низкая производительность PS2.0, что она становится бутылочным горлышком.
Заметь, по тестам производительности PS2 он сливает R9800 более чем вдвое. И по попугаям получается аналогичная разница.. Более того, такая большая разница между R9800 и FX5900 до сих пор была только в TR:AOD, заточками под который NV просто не заморачивались, как я понимаю..
Добавлено спустя 3 минуты, 46 секунд: Mikhail_P
Цитата:
По сути, пиксельные шейдеры выполняют роль текстур, т.е. их результат нужно накладывать на полигоны. Текстура - это текстура, а шейдер - это шейдер. Не случайно же два разных термина ввели
Текстуры бывают полностью сгенерированными при помощи шейдеров Кроме того, в самом деле, они как бы заменяют текстуры.
ID текстуры передаётся в шейдер, и он сам её уже накладывает.
Сам шейдер накладывается вместо текстуры.
Заблокирован Статус: Не в сети Регистрация: 02.12.2003 Откуда: Moscow, Russia
awl
Цитата:
Более того, такая большая разница между R9800 и FX5900 до сих пор была только в TR:AOD, заточками под который NV просто не заморачивались, как я понимаю..
NV не оптимизировала под TRAoD по 2ум причинам: 1) это непопулярная игра, которая провалась по продажам; 2) расформировалась команда разработчиков движка TR.
Кстати, 3DMark05 действительно показал, насколько состоятельно преимущество R3x0 над NV3x: первый одерживает убедительную победу при абсолютно неиграбельных скоростях.
Цитата:
Текстуры бывают сгенерированными при помощи шейдеров
Я понимаю, что они могут взаимодействовать, но утверждение а-ля "шейдер есть текстура" всё же грубовато звучит.
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
Цитата:
Совершенно идентичный по полосе пропускания памяти и числу конвейеров 6800 GT (350/250) на основе NV40 выступает в случае маленького числа текстур (а, следовательно, и максимальной нагрузки на запись буфера кадров) гораздо эффективнее 6600 GT (350/500)
Под маленьким числом текстур Воробьёв имел ввиду малое число одновременно накладываемых текстур. Он вообще в последнее время начал очень нездорывые формулировки выдавать... Интересно, а как ему удалочь снизить частоту памяти с 1000 до 500? Неужто GDDR3 имеет настолько больший диапазон рабочих частот, чем простая DDR?
Так об этом я и говорил - одиночное текстурирование ужасно нагружает память, именно чтобы создать небольшие прогалы в непрерывном потоке записи цвета и была введена отложенная запись результа для третьего и четвёртого пиксельного конвейера в юните. Однако почему так сильно бьёт по результатам мультисэмплинг мне не понятно - IMHO наоборот должно быть. Возможно, в GF6600 порезали и объёмы кэшей.
Сомневающимся Специально для Вас провёл дополнительные тесты. Ядро разогнано до 400 МГц, включено 6 вертексных и 3 пиксельных юнита. Изменялась частота процессора, а затем памяти.
Разгоном ядра я усугубил требования к частоте памяти. По выведенной в статье методике необходимая для данной конфигурации частота составляет 933 МГц, т.е. и штатные 800 это заведомо мало. Однако снижение частоты на 12% привело к снижению попугаев лишь на 3%. Уже больше, чем при стандартной конфигурации, но всё ещё слишком мало
Добавлено спустя 12 минут, 3 секунды: Mikhail_P
Цитата:
Это - да, но многие любят указывать только удвоенную частоту для DDR и может возникнуть путаница.
Наоборот, путаница может возникнуть, если _не указать_ DDR.
Цитата:
Линейность всё же сомнительная.
На график посмотри
Цитата:
утверждение а-ля "шейдер есть текстура" всё же грубовато звучит
Заблокирован Статус: Не в сети Регистрация: 02.12.2003 Откуда: Moscow, Russia
Enot Заходите почаще.
Отвечу на то, что по существу, а не являет собой мелкую придирку.
1. [не по существу, но очень хочется ответить]
Не надо впадать в русофильский маразм: 3D графика была заложена не в России, а в те странах, где доминирующий язык - английский. Термины эти ввели изначально на английском, поэтому использование производных от английских терминов не является неправомочным в данной ситуации. Претензия не по существу.
3. Как вы изволите определять степень значительности?
5. Статья посвещена исследования вершинной производительности. Поэтому "главный вывод" по удивительнейшему стечению обстоятельств к ней и относится.
6. А существенное отставание серии FX в современных играх именно из-за пиксельных шейдеров? А c каких это пор результаты в Tomb Raider: Angel of Darkness отождествляются с тестами остальных современных игр?
По-моему сейчас тенденция идёт на пиксельные шейдеры. И DOOM3 подтверждение этому. Во-первых, применение термина "шейдер" по отношению к OpenGL - это, хммм, очень своеобразно.
Во-вторых, в DOOM3 вроде ещё тени есть, динамические, да и бамп-мэппинга чуток.
9. Докажите, что это неправда. Касательно исследуемого GeForce 6800.
10. Изучайте предысторию вопроса. Первую статью и обсуждение к ней вы, по всей видимости, не прочитали.
11. А вам не кажется, что под "параметрами" в данном случае следует понимать производительность пиксельных шейдеров, текстурирования, геометрии в _комплексе_, а не в виде отдельных узлов, как памяти, вертексным юнитам и т.п. ? Тогда это всего лишь неточная формулировка, а вы уже "ошибками" кидаетесь.
Чего-то другого в статье, я так понимаю, вы не увидели? Очень жаль.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 28
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения