Member
Статус: Не в сети Регистрация: 05.11.2003 Откуда: Новосибирск
Ptirodaktill Что значит "идея в корне неверна"? А какая идея в корне верна? Все относительно, блин. Гы, а GPU анизотропку как считает, по твоему? Все в какой-то мере программная эмуляция. Как я уже сказал - различия в системах команд и архитектуре. Поэтому то, что GPU сделает за 1 такт, к примеру, на П4 потребует 4 тактов. И чего в этом такого? А если сделать SSE4, состоящую специально из всяких веселых операция, связанных с обработкой текстур?
Суть не в этом. Это не умаляет и не преувеличивает достоинств и недостатков самой идеи Просто сейчас пути развития процов и видеокарт разошлись
_________________ аналоговый сигнал всегда лучше цифрового, ибо он непрерывный, а цифровой - дискретный
Member
Статус: Не в сети Регистрация: 02.03.2003 Откуда: Мск
Bones то , что гф 4 делает за 4 такта тот же П4 сделает за 146, а то и больше. Разница ОГРОМНА, и потребуется кардинально переработать всю архитектуру роцессора, чтобы добиться нормальной скорости.
Достоинств у этой идеи нет.
_________________ "На хк играют трусы, те кто боятся умирать" (с)
Member
Статус: Не в сети Регистрация: 29.10.2003 Откуда: Москва
Цитата:
А теперь представьте, что в ту же видяху вы можете поставить по своему выбору GPU, память. От любого производителя. Это же конкуренция! Никаких больше липовых "приторможенных" моделей! Никаких узких мест! Прибыли производителей сойдут на минимум. Поэтому ОНИ этого НЕ ХОТЯТ.
Только ЭТО я и хотел сказать. Нашёлся, слава богу, Hil , который меня понял.
Всё! Тема уже пошла о соединении двух компов, щас о кластерах заговорят... Пора бы её закрыть?
Member
Статус: Не в сети Регистрация: 12.03.2003 Откуда: Израиль
Bones
Цитата:
Ну так что? Цифирки с потолка взял? Тогда не надо понты метать....
Угу! Ясен пень, что П4 делал бы все эти операции быстрее, у него же мегагерцев на порядок больше!
А выпуск видюх - сговор производителей софта и железа, чтобы побольше денег с нас стрясти!
А на самом деле для компа с современным процессором вполне достаточно S3 Virge!
Причем заметь, что производители железа сумели запугать даже линуксоидов!
Потому что иначе не объяснишь тот факт, что под Линухом такого еще нет!
_________________ Более мощный компьютер глючит быстрее и точнее.
Member
Статус: Не в сети Регистрация: 12.03.2003 Откуда: Израиль
Bones Прикалываюсь. Естественно.
Ладно, поехали по теории...
Дана задача: отобразить текстурированный треугольник.
Даны: текстура, цвет каждой из вершин, координаты каждой из вершин на экране, координаты каждой из вершин в текстуре.
Типовое решение для софта:
Для каждой точки:
1. Рассчитать ее место на экране
2. Сделать выборку цвета точки из текстуры. Если мы хотели мультитекстурирование, то повторяем для каждой налагаемой текстуры.
3. Рассчитать цвет точки исходя из заданных цветов вершин
4. Перемножить результаты из (2) и (3)
5. Изобразить точку
6. Пойти заниматься следующей точкой
Ну и сколько тактов займет подобное действо?
Типовое решение для хардвера:
Усилиями электронщиков, создавших специализированное решение, изображаем точку за 1 такт на каждом из конвееров.
Усложняющая хренотень вроде T&L, шейдеров и задержек видеопамяти опущена для упрощения картины...
_________________ Более мощный компьютер глючит быстрее и точнее.
Усложняющая хренотень вроде T&L, шейдеров и задержек видеопамяти опущена для упрощения картины...
Воопще-то T&L был придуман для того, чтобы как раз снять самые ресурсоемкие расчеты, по расченту трансформации&освещения, с процессора! Так как раньше, T&L не было, видеокарта сильно зависела от скорости процессора!!
Member
Статус: Не в сети Регистрация: 12.03.2003 Откуда: Израиль
Bones
Цитата:
ПРИНЦИПИАЛЬНО отличаться от того, что делает проц
Тем, что единственное, что умеет GPU - это плеваться закрашенными треугольниками на экран.
И разрабатывают их именно так, чтобы делать это максимально быстро.
У проца круг задач несколько шире... Ему, в отличие от ГПУ, нужна универсальность.
А разработчики, не зная какую именно задачу будет выполнять проц, не могут настолько круто заточить его под какую-либо специфическую задачу, т.к. это пойдет в ущерб остальным возможным применениям.
Добавлено спустя 2 минуты, 52 секунды: **S** Поправлюсь: усложняюшая объяснение.
Естественно правильно то, что ты говоришь, но если бы я еще и вписал туда T&L пришлось бы набирать гораздо больше текста. Тем более, что он только усугубляет ту картину, которую я обрисовал.
_________________ Более мощный компьютер глючит быстрее и точнее.
Member
Статус: Не в сети Регистрация: 05.11.2003 Откуда: Новосибирск
WhPh НУ допустим те операции, которые ты привел можно поставить на конвейер, и тогда (к примеру), если одна операция отрисовки треугольника займет 50 тактов, то 10 таких операция - 60 тактов. Ты это не учел. Понятно, что ГПУ заточен под свои собственные задачи. Вопрос в том, нельзя ли пусть и не так эффективно, но все равно заточить под них и проц? ИМХО, можно. Вот вокруг этого и спор
_________________ аналоговый сигнал всегда лучше цифрового, ибо он непрерывный, а цифровой - дискретный
Member
Статус: Не в сети Регистрация: 12.03.2003 Откуда: Израиль
Bones Заточить проц можно, тут и SSE всякие разные туда смотрят.
Только дело в том, что если злобно оптимизировать проц, то в какой-то момент он начнет злобно отставать во всех остальных задачах (техпроцесс, батенька, больше какого-то колва транзисторов туда не засунешь, или придется понижать частоту), а потом и вообще получит гордое правно именоваться ГПУ.
Цитата:
можно поставить на конвейер, и тогда (к примеру), если одна операция отрисовки треугольника займет 50 тактов, то 10 таких операция - 60 тактов
Это уже будет специализированный конвейер, т.к. ему придется хранить кучу различных временных значений.
ГПУ явно примерно так и поступают, но толкать это в проц? См. начало моего поста...
_________________ Более мощный компьютер глючит быстрее и точнее.
Member
Статус: Не в сети Регистрация: 05.11.2003 Откуда: Новосибирск
WhPh Ну вот про всякие ССЕ я и говорил. Злобно оптимизировать проц на железном уровне не сотит, задача не в этом. А вот сообразить набор ССЕ4, которые будет красить треугольник на экране быстро и эффективно вполне можно А насчет временных значений - у тебя зачем кэш? В ГПУ вроде бы и кэша-то нет (или есть?), но справляется как-то. Я думаю, это не проблема.
_________________ аналоговый сигнал всегда лучше цифрового, ибо он непрерывный, а цифровой - дискретный
Ptirodaktill Все относительно, блин. Гы, а GPU анизотропку как считает, по твоему?
Интересно, как?
Цитата:
Все в какой-то мере программная эмуляция.
Т.е. есть программа записанная в ОЗУ или ПЗУ выполняемая GPU? Кроме шейдеров.
Цитата:
Как я уже сказал - различия в системах команд и архитектуре. Поэтому то, что GPU сделает за 1 такт, к примеру, на П4 потребует 4 тактов.
Для П4 тактов будет гораздо больше. А, если учесть, что ti4200 выполняет 1.03 трлн. операций в секунду, как написано на сайте нвидии, а П4 даже если будет выполнять по 4 комманды за такт, то при частоте 4ГГц за секунду будет выполнять 16 млрд. операций.
Цитата:
И чего в этом такого? А если сделать SSE4, состоящую специально из всяких веселых операция, связанных с обработкой текстур?
Ну, если сделать наложение текстур одной командой, то что нибудь получится.
Добавлено спустя 22 минуты, 56 секунд:
WhPh писал(а):
Bones Даны: текстура, цвет каждой из вершин, координаты каждой из вершин на экране, координаты каждой из вершин в текстуре.
Зачем цвет каждой вершины, если есть текстура?
Цитата:
Типовое решение для софта: Для каждой точки: 1. Рассчитать ее место на экране 2. Сделать выборку цвета точки из текстуры. Если мы хотели мультитекстурирование, то повторяем для каждой налагаемой текстуры. 3. Рассчитать цвет точки исходя из заданных цветов вершин 4. Перемножить результаты из (2) и (3) 5. Изобразить точку 6. Пойти заниматься следующей точкой Ну и сколько тактов займет подобное действо?
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 21
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения