GeForce 6 и 3DMark05: какой прок от вертексных юнитов?

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 06.05.2026 11:44

Сообщения без ответов | Активные темы

Список форумов » Сайт и конференция » Материалы сайта

Часовой пояс: UTC + 3 часа

Модераторы: Sonic-Chainik, donnerjack

Новая тема /

Закрыто

Сообщений: 129 • Страница 5 из 7 • < 1 2 3 4 5 6 7 >

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

daemonas

Добавлено: 02.11.2004 18:10

[профиль]

Member
Статус: Не в сети
Регистрация: 17.03.2004

GReY
см. уточнение

Добавлено спустя 2 минуты, 25 секунд:
и дело тут вовсе не в количестве чтений и записей, т.к. эти процессы выполняются на порядок быстрей, чем выполнение программ ядром.

Реклама
Партнер

Mikhail_P

Добавлено: 02.11.2004 18:22

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 02.12.2003
Откуда: Moscow, Russia

GReY
Небольшое уточнение.

Цитата:

Объясняю:
включение сглаживание увеличивает ктличество записей в память во столько раз, какая выбрана степень сглаживания.

Для суперсэмплинга. Для мультисэмплинга тоже явно увеличивается, но не так сильно.

http://www.fcenter.ru/online.shtml?arti ... eos/2503#3

GReY

Добавлено: 02.11.2004 18:32

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават

Mikhail_P

Цитата:

Для суперсэмплинга. Для мультисэмплинга тоже явно увеличивается, но не так сильно

Мультисэмплинг лишь лучше кэшируется. Кроме того, 6х и 8х это суперсэмплинг в определённой мере.

daemonas

Цитата:

т.к. эти процессы выполняются на порядок быстрей, чем выполнение программ ядром

Каких программ, простите? Не показывайте свою неграмотность, засмеют же.

Bones

Добавлено: 03.11.2004 8:36

[профиль]

Member
Статус: Не в сети
Регистрация: 05.11.2003
Откуда: Новосибирск

Mikhail_P

Цитата:

Мне очень нравится такая позиция: "я ничего не могу обосновать, но я - за них".

Высылай мне карту, и я обосную. Адрес кидать?

_________________
аналоговый сигнал всегда лучше цифрового, ибо он непрерывный, а цифровой - дискретный

Mikhail_P

Добавлено: 03.11.2004 11:12

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 02.12.2003
Откуда: Moscow, Russia

daemonas
А подумать?

Подсказка #1: частота памяти выросла на 24.3 процента, производительность - на 10.
Подсказка #2: что означают буковки G и T в названии карточки, и чем они отличают её от карточки без этих буковок в названии.

Bones

Добавлено: 03.11.2004 11:13

[профиль]

Member
Статус: Не в сети
Регистрация: 05.11.2003
Откуда: Новосибирск

GReY В статье прирост частоты памяти на 25% дал прирост в 10% по скорости. Не сказал бы, что это мало.

_________________
аналоговый сигнал всегда лучше цифрового, ибо он непрерывный, а цифровой - дискретный

daemonas

Добавлено: 03.11.2004 11:16

[профиль]

Member
Статус: Не в сети
Регистрация: 17.03.2004

Mikhail_P
а подумать?

подсказка №1: кто-то говорил о прямопропорциональной зависимости с коэффициентом линейности равным 1?
подсказка №2: NV40 он и в африке NV40.

К сожалению, Enot был прав: "Элементарно. Он не признает."

Mikhail_P

Добавлено: 03.11.2004 11:19

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 02.12.2003
Откуда: Moscow, Russia

daemonas

Цитата:

NV40 он и в африке NV40.

Изучайте матчасть и читайте статью ещё раз - здесь я уже ничем помочь не могу.

GReY

Добавлено: 03.11.2004 11:50

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават

Bones

Цитата:

В статье прирост частоты памяти на 25% дал прирост в 10% по скорости. Не сказал бы, что это мало.

В обзоре Doors4ever? Ну так на той карточке заведомый дефицит ПСП. Вот когда будут разгонять 1000 DDR, тогда такого прироста не будет и в помине.

Ты совсем не читаешь предыдущие ответы или решил тоже измором брать?

Mikhail_P

Добавлено: 03.11.2004 12:15

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 02.12.2003
Откуда: Moscow, Russia

Enot

Цитата:

Не согласны с фактами?

Я не согласен с их подачей.

Вы, видимо, забыли упомянуть, что:

а)"(3DMark05 noFSAA) При увеличнии частоты памяти на 14,3% производительность выросла на 4,8%."
это действительно только для одного игрового теста при увеличенной почти на четверть частоте ядра, т.е. случай мало того, что частный, так ещё и сугубо искусственный.

б) "(Doom3 FSAA) прирост частоты памяти на 24% дал прирост в 10% по скорости"
это действительно при увеличении пиксельной производительности на 44%.

в) в своём материале автор расписал для какой пиксельной производительности, какая нужна ПСП, следовательно, ваше представление фактов откровенно ЛОЖНОЕ - вы просто перевираете факты.

Вы, простите, всех тут дурачками изволите считать?

GReY

Добавлено: 03.11.2004 17:15

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават

daemonas
Не буду давать ссылки и повторю всё заново, может так лучше дойдёт.

Архитектура GeForce 6 это модульная структура, имеющая один универсальный контроллер памяти (архитектура которого в данном случае не интересна), несколько геометрических блоков и несколько блоков растеризации. Сколько - зависит от конкретной модели. Каждый блок имеет свой кэш (и даже несколько - L0, L1 и так далее), но память у них общая. Поэтому чем больше юнитов обращаются к памяти одновременно, тем больше нужна пропускная способность памяти, чтобы удовлетворить их запросы предельно быстро - недостаток ПСП вызывает простой юнитов в ожидании данных. Суммарная потребность юнитов в данных очень велика, однако развитое кэширование и другие хитрости, вроде сжатия цвета при мультисэмплинге, существенно снижают требования к памяти.

Отключая часть вертексных и пиксельных юнитов, я экспериментально нашёл те их количества, при которых влияние скорости памяти СВОДИТСЯ К НУЛЮ. Выделяю заглавными потому, что это принципиальный момент, из которого строятся дальнейшие выводы. На основании этих данных можно подсчитать ПРЕДЕЛЬНУЮ ПРОПУСКНУЮ СПОСОБНОСТЬ ПАМЯТИ для конкретного количества юнитов, т.е. тот объём данных в секунду, который данная модель видеокарты способна в принципе переварить в наихудшем случае, когда все блоки одновременно обращаются к памяти.

В реальности такой режим работы ускорителя никогда не случается, почему - написано в статье. С учётом эмпирического коэффициента 0.34 мы получаем в точности те скорости памяти, которые выбрала NVidia для всех трёх разновидностей NV40.

Bones

Добавлено: 03.11.2004 17:20

[профиль]

Member
Статус: Не в сети
Регистрация: 05.11.2003
Откуда: Новосибирск

GReY

Цитата:

Каждый блок имеет свой кэш (и даже несколько - L0, L1 и так далее)

Цитата:

однако развитое кэширование и другие хитрости, вроде сжатия цвета при мультисэмплинге, существенно снижают требования к памяти

Вот с этого места подробнее. Желательно не своими эмпирическими умозаключениями, а ссылками на документацию от производителя.

_________________
аналоговый сигнал всегда лучше цифрового, ибо он непрерывный, а цифровой - дискретный

GReY

Добавлено: 03.11.2004 17:43

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават

daemonas
Теперь об уникальности ситуации. Здесь я попрошу немного содействия, думаю вы не откажетесь, если действительно хотите понять, а не пофлеймить.

Берём предыдущую архитектуру NVidia - NV35, благо её представитель стоит у вас в компе и (я не перестаю на это надеяться) вы проведёте аналогичные моим тесты, чтобы можно было обсудить конкретные цифры.

Так вот, сколько у NV35 пиксельных конвейеров и сколько вершинных? Можно посмотреть и с другой стороны: какова мощность NV35 в мегатекселах в секунду, в миллионах треугольников - как вам удобнее. И какая для него необходима ПСП. Теперь возьмите аналогичные показатели NV40 - эта архитектура обладает в разы большей графической мощностью, удовлетворяясь той же пропускной способностью памяти. Это я назвал беспрецендентной независимостью от памяти.

Я ответил на все вопросы или есть ещё?

Добавлено спустя 10 минут, 15 секунд:
Bones

Цитата:

ссылками на документацию от производителя

Хм, у меня таких документов нет, могу лишь попросить у Tim-а. Ты сомневаешься, что в акселераторах есть кэш? А разрекламированную фичу ATI Rage128 не помнишь? Называлась Triple-cache architecture.

Касательно GeForce 6 могу привести слайд. Если этого недостаточно, то уточни, чего ты хочешь услышать.

Последний раз редактировалось GReY 03.11.2004 17:57, всего редактировалось 1 раз.

daemonas

Добавлено: 03.11.2004 17:56

[профиль]

Member
Статус: Не в сети
Регистрация: 17.03.2004

GReY

Цитата:

Берём предыдущую архитектуру NVidia - NV35, благо её представитель стоит у вас в компе и (я не перестаю на это надеяться) вы проведёте аналогичные моим тесты, чтобы можно было обсудить конкретные цифры.

аналогичные не смогу, т.к. там ничего не отключается

Цитата:

Можно посмотреть и с другой стороны: какова мощность NV35 в мегатекселах в секунду, в миллионах треугольников - как вам удобнее. И какая для него необходима ПСП. Теперь возьмите аналогичные показатели NV40 - эта архитектура обладает в разы большей графической мощностью, удовлетворяясь той же пропускной способностью памяти. Это я назвал беспрецендентной независимостью от памяти.

я НЕ ЗНАЮ какая необходима ПСП. У меня нет таких глубинных знаний в архитектуре NV35 и NV40. И еще интересный момент, когда на хоботе проводят тесты своим райтмарком и делают какие-то выводы, то эти выводы как правило не утвердительны, на подобие "судя по результатам, можно предположить что архитектура ядра такая-то поэтому мы и наблюдаем такую картину". Так эти предположения делаются по простейшим тестам, а вы делаете окончательные выводы по очень сложным тестам. Я этого не понимаю. Еще важная деталь - неправильно говорить "какая ПСП необходима для ядра", правильно говорить "какая ПСП необходима для ядра в данном приложении" - это понятно?

Цитата:

Я ответил на все вопросы или есть ещё?

Вопросы как у Bones - откуда дровишки?

GReY

Добавлено: 03.11.2004 18:03

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 13.04.2003
Откуда: Салават

daemonas

Цитата:

аналогичные не смогу, т.к. там ничего не отключается

Я знаю. Но у XT должен быть неплохой разгон.

Цитата:

я НЕ ЗНАЮ какая необходима ПСП. У меня нет таких глубинных знаний в архитектуре NV35 и NV40

Если увеличение ПСП не приводит к увеличению результата теста, значит этой ПСП достаточно. Тесты FillRate и Vertex shaders позволили определить необходимую ПСП.

Цитата:

неправильно говорить "какая ПСП необходима для ядра", правильно говорить "какая ПСП необходима для ядра в данном приложении" - это понятно?

В общем случае - да. Однако синтетические тесты отдельных блоков в 3DMark05 позволяют определить абсолютную потребность. Она получается очень большой.

Добавлено спустя 43 минуты, 47 секунд:
daemonas

Цитата:

И еще интересный момент, когда на хоботе проводят тесты своим райтмарком и делают какие-то выводы, то эти выводы как правило не утвердительны

Тут вспоминается небезынтересная ситуация, возникшая после появления NV30. NVidia заявила для этого чипа 8 пиксельных конвейеров с одним текстурным модулем, по тестам же получалось 4х2. Когда я спросил, почему iXBT не верbт в 4х2, то полным составом графического отдела (Воробьёв, Медведев) был высмеян и послан образовываться. iXBT предпочли не верить глазам своим. Спустя неделю на Inquirer появился скандальный материал об отсутствии в NV30 заявленных восьми конвейеров, после чего в следующем же материале iXBT сделали вид, будто они всегда об этом подозревали. В той ветке, где было обсуждение архитектуры NV30, меня задним числом обвинили в том, что я, якобы, прочитал статью на Inquirer и пришёл к ним продемонстрировать, какой я умный.

Мораль: верь своему разуму и не сотвори себе кумира.

Tommy

Добавлено: 03.11.2004 21:08

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 11.08.2003
Откуда: UA, Kharkiv

Enot
GReY
Утомили вы уже, господа, своей грызней

. Закрою пока топик до чистки...

Ругань и оскорбления удалил (может не все

) Топик открываю для дальнейшего обсуждения.

Предупреждаю всех, за оффтоп и малейшие наезды буду выдавать ЖК на большой срок!

_________________
Кривыми должны быть извилины...

Enot

Добавлено: 04.11.2004 16:16

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 26.10.2003

Аааа, вот оно. Любителям ФАКТОВ, АРГУМЕНТОВ, ЦИФР и ГРАФИКОВ.

Цитата из статьи:

Цитата:

У GeForce 6600GT два пиксельных и три вертексных юнита, частоты 500/1000 МГц, но память имеет 128-битный интерфейс, поэтому расчетную цифру необходимо удвоить. После несложных расчетов получается, что для этого графического акселератора необходима память с эффективной частотой не менее 1333 МГц, то есть производительность этого варианта GeForce 6 всё же «упирается» в скорость памяти. Как видите, расчеты очень неплохо кореллируют со значениями, выбранными производителем, а все варианты GeForce 6800 отлично сбалансированы по частотам памяти и ядра, чего не скажешь о GeForce 6600GT.

Вот в этом авторитетном источнике http://www.hardware.fr/art/imprimer/514/ утверждается обратное с ФАКТАМИ, АРГУМЕНТАМИ, ЦИФРАМИ:

Цитата:

(Перевод PromptXP)
Просто, что 6600GT очень хорошо уравновешен уровень память(список), в то время как 6800 и главным образом 6800GT располагают памятью под измеренной. Вследствие памяти, наш 6800GT не встречается на самом деле больше с 16 поточными обработками информации но 12, и 6800 с 10.
(перевод babelfish)
What does that mean? Quite simply that the 6600GT is very well balanced level report, whereas the 6800 and especially the 6800GT have a memory under dimensioned. Because of the memory, our 6800GT is not found in practice more with 16 pipelines but 12, and the 6800 with 10.

Добавлено спустя 2 минуты, 5 секунд:
Tommy

Цитата:

Предупреждаю всех, за оффтоп и малейшие наезды буду выдавать ЖК на большой срок!

Классно чистим!
Я Мат удален [Tommy], ПОЧЕМУ МЕНЯ ДО СИХ ПОР НЕ БАНУЛИ НАВСЕГДА! Что за половинчатые решения?

Anvin

Добавлено: 04.11.2004 16:28

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 14.11.2003

Enot Профилактический бан на неделю

_________________
Хочешь быстро получить ответ? - пользуйся поиском.

Mikhail_P

Добавлено: 04.11.2004 17:49

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 02.12.2003
Откуда: Moscow, Russia

Enot
Ответьте, когда сможете:
http://www.ixbt.com/video2/nv43.shtml
http://www.ixbt.com/video2/rv410.shtml

Да, я согласен, что в режиме raw-performance всё обычно обстоит так, как написано в материале hardware.fr , но, как только усиливается нагрузка на память, то 6600GT относительно 6800, имеющего схожую производительность ядра(без учёта памяти) пролетает как фанера над Парижем (какой удачный каламбур получился!:D). Это, прежде всего режимы:

а) чистого сингл-текстурирования, иногда - при использовании двух текстур(где конкретно - см. синтетику по ссылкам);
б) с АА.

GeForce 6800 series прекрасно работает и в этих случаях: про то, как слабо изменяется производительность при увеличении частоты памяти с АА, была написано в пред. материале GReY.

daemonas

Добавлено: 04.11.2004 18:18

[профиль]

Member
Статус: Не в сети
Регистрация: 17.03.2004

Mikhail_P

Enot писал(а):

Because of the memory, our 6800GT is not found in practice more with 16 pipelines but 12, and the 6800 with 10

Цитата:

Да, я согласен, что в режиме raw-performance всё обычно обстоит так, как написано в материале hardware.fr

на этом можно ставить точку в споре, осталось только согласиться автору.

Добавлено спустя 2 минуты, 29 секунд:
ЗЫ: и не надо разводить оффтоп по поводу 6600 и Х700

Новая тема /

Закрыто

Сообщений: 129 • Страница 5 из 7 • < 1 2 3 4 5 6 7 >

Список форумов » Сайт и конференция » Материалы сайта

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 31

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти: