Member
Статус: Не в сети Регистрация: 02.02.2007 Откуда: Казахстан
Цитата:
Вот тут я не понимаю почему они так настойчиво это делают. Похожим вопросом я задавался, когда Интел переходила на НетБарст. Но сейчас Интел говорит о слиянии серверной, мобильной и настольной архитектур, это может значить смену философии вообще (не только в плане контроллера, но и каких-то фишек Итаниума, например)
Мне тоже кажется иногда, что шина - это слабое место не сколько сейчас, сколько в будущем, ведь кол-во ядер увеличивается, спасает щас размеры кэшей и предвыборка, видно идут эволюционныйм путем:немножко там, немного сдесь и все, потом склеим эти две части - вуаля - готов двуядерник, потом вуаля - 4-ядерник...16-ядерник, а шина все таже.
я имел в виду чип G80 структу которого превёл 2мя постами ранее
http://www.overclockers.ru/lab/23890.shtml: Потоковые процессоры сгруппированы по 16 штук в 8 блоков, каждый из которых оснащён четырьмя текстурными модулями и общим L1 кешем. Каждый блок представляет собой два шейдерных процессора (состоящего из 8 потоковых процессоров каждый), при этом все 8 блоков имеют доступ к любому из шести L2 кешей и к любому из шести массивов регистров общего назначения. Таким образом, обработанные одним шейдерным процессором данные могут быть использованы другим шейдерным процессором. То есть данными обмениваются между собой не потоковые процессоры, а вычислительные блоки. Получается, что только когда все потоковые процессоры в блоке выполнят инструкцию, только тогда результат вычислений будет доступен другим блокам. Следовательно, эффективно синхронизировать данные между потоками не выйдет. Я так это понимаю. Что вообще такое райтрейсинг?
_________________ Цель спора есть изменение природы истины.
я имел в виду чип G80 структу которого превёл 2мя постами ранее
Разницы большой нет. Структурно, все GPU более-менее похожи. Для того, чтобы ray tracing мог буть использован для игр, необходимо трассировать в реальном времени на порядок (точенее в 20 раз) больше лучей чем может Х1900ХТХ. Вот некоторые выдержки из поста одного из исследователей в проекте райтрайсинг на ГПУ: The short answer is that GPUs are faster than a single CPU, but they aren't great at raytracing because of divergence in execution between rays. As the execution traces diverge in the acceleration structures, you end up with a lot of SIMD execution stalls. GPUs also have to currently to a bunch of extra work because there isn't an effective way to do a stack, so it has to be emulated or worked around via algorithm modifications. Sadly, the G80's 16KB of global memory between the threads isn't very helpful as it's too small to really do a stack for the number of parallel execution contexts to run efficiently, however, there might be fruit here. We currently are talking ~19Mray/s on an X1900XTX (Conference room, shadow rays), and about the same on a G80 with DirectX and the current state of the drivers and shader compilers... Cell is actually a raytracing monster, compared to other non-custom architectures, in certain situations. The Saarland folks (and others including Stanford) have Cell raytracers >60Mrays/s for primary rays. Multi-core CPUs are also showing great promise as people are showing >5Mrays/s per processor for comparable designs (i.e. no tricks that only really work for primary rays), and there is impressive work from Intel on really optimizing the heck out of raytracing on CPUs... http://www.beyond3d.com/forum/showthread.php?t=36792
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 27
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения