Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 17 
  Версия для печати (полностью) Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 17.03.2008
Откуда: РФ
Фото: 9
Насколько мы знаем, последний инструмент это Apex PhysX. Его мы видели в Batman AA и Metro 2033 и Mafia 2.
Раньше не стояло вопроса что быстрее будет CPU или GPU, конечно говорили все GPU ведь там столько процессоров.
Не так давно вышел казус с Mafia 2, apex одежда работает только на CPU, либо на выделенном гпу. В чем причина? Так как я не верю в заговоры решил разобраться что к чему. Было у меня много разных догадок, количество частиц слишком большое, может распараллелить вчисления именно под одежду не смогли.
Оказалось всё довольно таки просто, что если apex cloth требует двойную точность вычислений ? Возможно это и явилось причиной, не на чем делать вычисления кроме CPU?
Прикол в том, что добавляя адаптер к GTX460 уровня и архитетуры GT220 или 240 получали лишь небольщую прибавку производительности.
Все оказалось просто GT220 брала на себя часть PhysX библитек которая работала на одинатрной точности и освбождала рендеринг для GTX460 но одежда все равно была на проце...
Оказывается добалять надо 2-ой картой карту Fermi (любую) или GTX 260 и выше

Двойная точность в гигфлопсах:
GTS240 - нет
GTS250 - нет
GTS 420 - 11.2 Гфлопс
GTS 430 - 22.1 Гфлопс
GTS 440 - 28.1 Гфлопс
GTS 450 - 50.1 Гфлопс
GTX260 - 59.5 Гфлопс
GTX 460 - 75.6 Гфлопс
GTX 465 -106.9 Гфлопс
GTX 480 - 168.1 Гфлопс
Intel Core i7-975 XE 3,33 ГГц (2009) — 53.28 Гфлопс

Вот так вот, оказывает APEX PhysX не всегда на GPU.
Если есть возможность сравните GTX460+ GT440 и GTX 460+ GTX260 и GTX460 +GTS 240

_________________
13600k/MSI z690 tomahawk/ 2x16GB DDR5 5600 CL36/4070



Партнер
 

Advanced member
Статус: Не в сети
Регистрация: 14.11.2003
MEX-74 не сходится теория и практика, посмотрите в тесты по мафии2 в последней статье по PhysX.


 

Member
Статус: Не в сети
Регистрация: 17.03.2008
Откуда: РФ
Фото: 9
Anvin писал(а):
MEX-74 не сходится теория и практика, посмотрите в тесты по мафии2 в последней статье по PhysX.

Ну тогда еще вариант - видяхам тупо не хватает кеша поэтому нвидия и сбрасывает нагрузку.

_________________
13600k/MSI z690 tomahawk/ 2x16GB DDR5 5600 CL36/4070


 

Member
Статус: Не в сети
Регистрация: 03.03.2006
Откуда: Москва
MEX-74 писал(а):
Оказалось всё довольно таки просто, что если apex cloth требует двойную точность вычислений ?

Это ж надо было умудриться объединить в одном предложении оборот Оказалось \ Что если :lol: Тыб сходил на свежий воздух чтоль , проветрил свой аппаратный тесселятор :weep:
MEX-74 писал(а):
Все оказалось просто GT220 брала на себя часть PhysX библитек которая работала на одинатрной точности и освбождала рендеринг для GTX460 но одежда все равно была на проце...

fail №2 , на gt220 одежда ... Причём эта одежда реализована через апекс сдк , как раз для обсчёта на cpu , и просчитываестя на gpu крайне не эффективно . В этом и кроется причина почему на одной карте шло порой быстрее чем с выделенной под физикс а не в том что ты себе нафантазировал .

_________________
Программист - качок


 

Member
Статус: Не в сети
Регистрация: 17.07.2006
MEX-74
Цитата:
Оказалось всё довольно таки просто, что если apex cloth требует двойную точность вычислений ?

PhysX SDK, на котором и сидит APEX, не поддерживает двойную точность. Вообще.

Была у меня возможность протестировать APEX Clothing не в составе Мафии 2 - все там прекрасно на одном GPU работает.
Более того, и одежда на CPU в Мафии далеко не все возможности апекса использует, в плане производительности.

Цитата:
Все оказалось просто GT220 брала на себя часть PhysX библитек которая работала на одинатрной точности и освбождала рендеринг для GTX460 но одежда все равно была на проце

При добавлении выделенной карты одежда считается именно на GPU.
Не читали что-ли ? Третий раздел (Part III), скрин с AgPerfMon

----------
Цитата:
и Metro 2033

Да, кстати.. в Метро 2033 апекс не используется. В Dark Void, в Darkest of Days, но не в Метро.

_________________
PhysXInfo.com Team


Последний раз редактировалось Zogrim 02.11.2010 14:36, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 17.03.2008
Откуда: РФ
Фото: 9
Sicvestoratium
А теперь вопрос: почему на CPU эффективнее чем на GPU? Закон Мура не действует?

Добавлено спустя 23 минуты 32 секунды:
Zogrim
Цитата:
Была у меня возможность протестировать APEX Clothing не в составе Мафии 2

Видимо не достаточно близко к мафии 2 сделали, проще, или еще чего.

Цитата:
[PhysX SDK, на котором и сидит APEX, не поддерживает двойную точность. Вообще.

А откуда мнение что она напрямую от этого зависит?

_________________
13600k/MSI z690 tomahawk/ 2x16GB DDR5 5600 CL36/4070


 

Member
Статус: Не в сети
Регистрация: 03.03.2006
Откуда: Москва
Ответ на твой вопрос уже был дан , симуляция одежды оптимизирована для работы на цпу , что как раз этот апекс и позволяет сделать .

А вообще мафия два с физиксом облажалась очень сильно , бери для примера игры где он работает нормально а не через хитро закрученную з***цу .

Добавлено спустя 1 минуту 23 секунды:
MEX-74 писал(а):
А откуда мнение что она напрямую от этого зависит?

А от чего ему быть зависимым если это надстройка :D

_________________
Программист - качок


 

Member
Статус: Не в сети
Регистрация: 17.03.2008
Откуда: РФ
Фото: 9
Sicvestoratium писал(а):
Ответ на твой вопрос уже был дан , симуляция одежды оптимизирована для работы на цпу , что как раз этот апекс и позволяет сделать .

А вообще мафия два с физиксом облажалась очень сильно , бери для примера игры где он работает нормально а не через хитро закрученную з***цу .

Добавлено спустя 1 минуту 23 секунды:
MEX-74 писал(а):
А откуда мнение что она напрямую от этого зависит?

А от чего ему быть зависимым если это надстройка :D

Я не видел игр с такой симуляцией одежды, только Alan wake на боксе. Если оптимизирован на CPU то какого фига не использовано SSE, может VMX надо (выйдет сэнди бридж посмотрим).
Может не мафия с физиксом облажалась а нвидиа что то не предусмотрела.
Я понял что APEX это надстройка, но конечный то результат - расчеты поведения ткани в симуляции ткани разве не завсисит от гигафлопсов?

_________________
13600k/MSI z690 tomahawk/ 2x16GB DDR5 5600 CL36/4070


 

Member
Статус: Не в сети
Регистрация: 17.07.2006
MEX-74
Цитата:
А откуда мнение что она напрямую от этого зависит?

Довелось получить некоторое представляние о том, как работает APEX. Вся симуляция, за редким исключение вроде RRB или APEX Turbulence висит на функционале PhysX SDK.

Ответьте мне на простой вопрос - если симуляция ткани в Мафии 2 изначально рассчитанна исключительно под CPU, почему же она не использует многоядерность, к примеру ? (ибо то что есть - тормозит)
Почему работает на старом PhysX SDK 2.8.3, хотя в SDK 2.8.4, вышедшем в том же месяце, именно CPU ткань сильно оптимизированна (прирост в 2-3 раза) ?

_________________
PhysXInfo.com Team


 

Member
Статус: Не в сети
Регистрация: 03.03.2006
Откуда: Москва
Zogrim писал(а):
Ответьте мне на простой вопрос - если симуляция ткани в Мафии 2 изначально рассчитанна исключительно под CPU, почему же она не использует многоядерность, к примеру ? (ибо то что есть - тормозит)

Как раз наоборот использует и не тормозит , 4х ядерный процессор прекрасно справляется без всяких твиков
MEX-74 писал(а):
Может не мафия с физиксом облажалась а нвидиа что то не предусмотрела.

Угу , забыл послать экспертов по контролю за качеством .

_________________
Программист - качок


 

Member
Статус: Не в сети
Регистрация: 06.05.2009
Откуда: Украина, Донецк
Sicvestoratium писал(а):
Как раз наоборот использует и не тормозит , 4х ядерный процессор прекрасно справляется без всяких твиков

Ни хрена он не справляется, загрузите 10 главу, так где в новом доме просыпаешься, и выйдите на улицу, фпс будет проседать до 20 и ниже кадров, если в системе ток 1 карта и не сделан твик. Проверено на Phenom II x4 955 3.7 + gtx460 1gb


 

Member
Статус: Не в сети
Регистрация: 03.03.2006
Откуда: Москва
sprata писал(а):
Ни хрена он не справляется, загрузите 10 главу, так где в новом доме просыпаешься, и выйдите на улицу, фпс будет проседать, если в системе ток 1 карта и не сделан твик.

И в этом виновата симуляция одежды на цпу а не очередной косяк разработчиков ?

В уличной толпе нет критических просадок при том что там этой самой одежды намного больше чем в упомянутой сцене ... Делайте выводы ...

_________________
Программист - качок


 

Member
Статус: Не в сети
Регистрация: 17.07.2006
Sicvestoratium
Цитата:
и не тормозит , 4х ядерный процессор прекрасно справляется без всяких твиков

Не знаю, не знаю.. мой C2Q 9400 как раз-таки до 20-ти проседает. Начало 9-й главы очень показательно - тормоза уже прямо в квартире Вито начинаются.
А ткань с пешеходов убираешь - и сразу 50-60 фпс.

Цитата:
И в этом виновата симуляция одежды на цпу а не очередной косяк разработчиков ?

Косячная симуляция одежды на цпу, скажем так.

Я же не просто так тут распинаюсь, а в свое время достаточно много времени на эту тему потратил, и получилось - кто виноват и что делать

_________________
PhysXInfo.com Team


 

Junior
Статус: Не в сети
Регистрация: 09.03.2009
А вот интересный скрин:
#77


 

Member
Статус: Не в сети
Регистрация: 17.03.2008
Откуда: РФ
Фото: 9
Кароче чепуха какая-то, это учитывая что Mafia 2 не использует и половины возможностей APEX.
Тут 2 выхода:
1. Что-то нвидиа сделать с планировщиком заданий в видяхе или вообще пересмотреть всю архитектуру.
2. Или использовать CPU ускоряя физику используя SSЕ или AVX.

_________________
13600k/MSI z690 tomahawk/ 2x16GB DDR5 5600 CL36/4070


Последний раз редактировалось MEX-74 03.11.2010 6:42, всего редактировалось 3 раз(а).

 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 30.10.2007
Откуда: Одесса
MEX-74 писал(а):
1. Что-то нвидиа сделать с планировщиком заданий в видяхе или вообще пересмотреть всю архитектуру.

когда маркетинг идёт впереди всего и вся, приходится страдать инженерам :tooth:
MEX-74 писал(а):
2. Или использовать CPU ускоряя физику используя SSЕ или VMX.

Нвидия не выпускает процессоры. Зачем ей это надо????? :?: Скорей ей выгодно чтобы на процессорах всё тормозило. :-P
Может AVX?

_________________
Если Бог за нас, кто против нас?(с) Библия
В случае масштабных военных действий, эвакуация населения не только не производится, но и не планируется.


 

Member
Статус: Не в сети
Регистрация: 17.03.2008
Откуда: РФ
Фото: 9
Everlast82
Цитата:
Может AVX?

Поправил

_________________
13600k/MSI z690 tomahawk/ 2x16GB DDR5 5600 CL36/4070


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 17 
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и гости: 23


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan