Добавлено спустя 2 минуты, 25 секунд: и дело тут вовсе не в количестве чтений и записей, т.к. эти процессы выполняются на порядок быстрей, чем выполнение программ ядром.
Заблокирован Статус: Не в сети Регистрация: 02.12.2003 Откуда: Moscow, Russia
daemonas А подумать?
Подсказка #1: частота памяти выросла на 24.3 процента, производительность - на 10.
Подсказка #2: что означают буковки G и T в названии карточки, и чем они отличают её от карточки без этих буковок в названии.
Заблокирован Статус: Не в сети Регистрация: 02.12.2003 Откуда: Moscow, Russia
Enot
Цитата:
Не согласны с фактами?
Я не согласен с их подачей.
Вы, видимо, забыли упомянуть, что:
а)"(3DMark05 noFSAA) При увеличнии частоты памяти на 14,3% производительность выросла на 4,8%."
это действительно только для одного игрового теста при увеличенной почти на четверть частоте ядра, т.е. случай мало того, что частный, так ещё и сугубо искусственный.
б) "(Doom3 FSAA) прирост частоты памяти на 24% дал прирост в 10% по скорости"
это действительно при увеличении пиксельной производительности на 44%.
в) в своём материале автор расписал для какой пиксельной производительности, какая нужна ПСП, следовательно, ваше представление фактов откровенно ЛОЖНОЕ - вы просто перевираете факты.
Вы, простите, всех тут дурачками изволите считать?
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
daemonas Не буду давать ссылки и повторю всё заново, может так лучше дойдёт.
Архитектура GeForce 6 это модульная структура, имеющая один универсальный контроллер памяти (архитектура которого в данном случае не интересна), несколько геометрических блоков и несколько блоков растеризации. Сколько - зависит от конкретной модели. Каждый блок имеет свой кэш (и даже несколько - L0, L1 и так далее), но память у них общая. Поэтому чем больше юнитов обращаются к памяти одновременно, тем больше нужна пропускная способность памяти, чтобы удовлетворить их запросы предельно быстро - недостаток ПСП вызывает простой юнитов в ожидании данных. Суммарная потребность юнитов в данных очень велика, однако развитое кэширование и другие хитрости, вроде сжатия цвета при мультисэмплинге, существенно снижают требования к памяти.
Отключая часть вертексных и пиксельных юнитов, я экспериментально нашёл те их количества, при которых влияние скорости памяти СВОДИТСЯ К НУЛЮ. Выделяю заглавными потому, что это принципиальный момент, из которого строятся дальнейшие выводы. На основании этих данных можно подсчитать ПРЕДЕЛЬНУЮ ПРОПУСКНУЮ СПОСОБНОСТЬ ПАМЯТИ для конкретного количества юнитов, т.е. тот объём данных в секунду, который данная модель видеокарты способна в принципе переварить в наихудшем случае, когда все блоки одновременно обращаются к памяти.
В реальности такой режим работы ускорителя никогда не случается, почему - написано в статье. С учётом эмпирического коэффициента 0.34 мы получаем в точности те скорости памяти, которые выбрала NVidia для всех трёх разновидностей NV40.
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
daemonas Теперь об уникальности ситуации. Здесь я попрошу немного содействия, думаю вы не откажетесь, если действительно хотите понять, а не пофлеймить.
Берём предыдущую архитектуру NVidia - NV35, благо её представитель стоит у вас в компе и (я не перестаю на это надеяться) вы проведёте аналогичные моим тесты, чтобы можно было обсудить конкретные цифры.
Так вот, сколько у NV35 пиксельных конвейеров и сколько вершинных? Можно посмотреть и с другой стороны: какова мощность NV35 в мегатекселах в секунду, в миллионах треугольников - как вам удобнее. И какая для него необходима ПСП. Теперь возьмите аналогичные показатели NV40 - эта архитектура обладает в разы большей графической мощностью, удовлетворяясь той же пропускной способностью памяти. Это я назвал беспрецендентной независимостью от памяти.
Я ответил на все вопросы или есть ещё?
Добавлено спустя 10 минут, 15 секунд: Bones
Цитата:
ссылками на документацию от производителя
Хм, у меня таких документов нет, могу лишь попросить у Tim-а. Ты сомневаешься, что в акселераторах есть кэш? А разрекламированную фичу ATI Rage128 не помнишь? Называлась Triple-cache architecture.
Касательно GeForce 6 могу привести слайд. Если этого недостаточно, то уточни, чего ты хочешь услышать.
Последний раз редактировалось GReY 03.11.2004 17:57, всего редактировалось 1 раз.
Берём предыдущую архитектуру NVidia - NV35, благо её представитель стоит у вас в компе и (я не перестаю на это надеяться) вы проведёте аналогичные моим тесты, чтобы можно было обсудить конкретные цифры.
аналогичные не смогу, т.к. там ничего не отключается
Цитата:
Можно посмотреть и с другой стороны: какова мощность NV35 в мегатекселах в секунду, в миллионах треугольников - как вам удобнее. И какая для него необходима ПСП. Теперь возьмите аналогичные показатели NV40 - эта архитектура обладает в разы большей графической мощностью, удовлетворяясь той же пропускной способностью памяти. Это я назвал беспрецендентной независимостью от памяти.
я НЕ ЗНАЮ какая необходима ПСП. У меня нет таких глубинных знаний в архитектуре NV35 и NV40. И еще интересный момент, когда на хоботе проводят тесты своим райтмарком и делают какие-то выводы, то эти выводы как правило не утвердительны, на подобие "судя по результатам, можно предположить что архитектура ядра такая-то поэтому мы и наблюдаем такую картину". Так эти предположения делаются по простейшим тестам, а вы делаете окончательные выводы по очень сложным тестам. Я этого не понимаю. Еще важная деталь - неправильно говорить "какая ПСП необходима для ядра", правильно говорить "какая ПСП необходима для ядра в данном приложении" - это понятно?
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
daemonas
Цитата:
аналогичные не смогу, т.к. там ничего не отключается
Я знаю. Но у XT должен быть неплохой разгон.
Цитата:
я НЕ ЗНАЮ какая необходима ПСП. У меня нет таких глубинных знаний в архитектуре NV35 и NV40
Если увеличение ПСП не приводит к увеличению результата теста, значит этой ПСП достаточно. Тесты FillRate и Vertex shaders позволили определить необходимую ПСП.
Цитата:
неправильно говорить "какая ПСП необходима для ядра", правильно говорить "какая ПСП необходима для ядра в данном приложении" - это понятно?
В общем случае - да. Однако синтетические тесты отдельных блоков в 3DMark05 позволяют определить абсолютную потребность. Она получается очень большой.
Добавлено спустя 43 минуты, 47 секунд: daemonas
Цитата:
И еще интересный момент, когда на хоботе проводят тесты своим райтмарком и делают какие-то выводы, то эти выводы как правило не утвердительны
Тут вспоминается небезынтересная ситуация, возникшая после появления NV30. NVidia заявила для этого чипа 8 пиксельных конвейеров с одним текстурным модулем, по тестам же получалось 4х2. Когда я спросил, почему iXBT не верbт в 4х2, то полным составом графического отдела (Воробьёв, Медведев) был высмеян и послан образовываться. iXBT предпочли не верить глазам своим. Спустя неделю на Inquirer появился скандальный материал об отсутствии в NV30 заявленных восьми конвейеров, после чего в следующем же материале iXBT сделали вид, будто они всегда об этом подозревали. В той ветке, где было обсуждение архитектуры NV30, меня задним числом обвинили в том, что я, якобы, прочитал статью на Inquirer и пришёл к ним продемонстрировать, какой я умный.
Мораль: верь своему разуму и не сотвори себе кумира.
Заблокирован Статус: Не в сети Регистрация: 26.10.2003
Аааа, вот оно. Любителям ФАКТОВ, АРГУМЕНТОВ, ЦИФР и ГРАФИКОВ.
Цитата из статьи:
Цитата:
У GeForce 6600GT два пиксельных и три вертексных юнита, частоты 500/1000 МГц, но память имеет 128-битный интерфейс, поэтому расчетную цифру необходимо удвоить. После несложных расчетов получается, что для этого графического акселератора необходима память с эффективной частотой не менее 1333 МГц, то есть производительность этого варианта GeForce 6 всё же «упирается» в скорость памяти. Как видите, расчеты очень неплохо кореллируют со значениями, выбранными производителем, а все варианты GeForce 6800 отлично сбалансированы по частотам памяти и ядра, чего не скажешь о GeForce 6600GT.
(Перевод PromptXP)
Просто, что 6600GT очень хорошо уравновешен уровень память(список), в то время как 6800 и главным образом 6800GT располагают памятью под измеренной. Вследствие памяти, наш 6800GT не встречается на самом деле больше с 16 поточными обработками информации но 12, и 6800 с 10.
(перевод babelfish)
What does that mean? Quite simply that the 6600GT is very well balanced level report, whereas the 6800 and especially the 6800GT have a memory under dimensioned. Because of the memory, our 6800GT is not found in practice more with 16 pipelines but 12, and the 6800 with 10.
Добавлено спустя 2 минуты, 5 секунд: Tommy
Цитата:
Предупреждаю всех, за оффтоп и малейшие наезды буду выдавать ЖК на большой срок!
Классно чистим!
Я Мат удален [Tommy], ПОЧЕМУ МЕНЯ ДО СИХ ПОР НЕ БАНУЛИ НАВСЕГДА! Что за половинчатые решения?
Да, я согласен, что в режиме raw-performance всё обычно обстоит так, как написано в материале hardware.fr , но, как только усиливается нагрузка на память, то 6600GT относительно 6800, имеющего схожую производительность ядра(без учёта памяти) пролетает как фанера над Парижем (какой удачный каламбур получился!:D). Это, прежде всего режимы:
а) чистого сингл-текстурирования, иногда - при использовании двух текстур(где конкретно - см. синтетику по ссылкам);
б) с АА.
GeForce 6800 series прекрасно работает и в этих случаях: про то, как слабо изменяется производительность при увеличении частоты памяти с АА, была написано в пред. материале GReY.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 29
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения