*Cofradia Intel*
Статус: Не в сети Регистрация: 25.05.2004 Откуда: Саров
Andreika
Алгоритмы надо предлагать не клоунам с IDF а программерам
Кстати про матрицы. Есть такой пакетик (не помню как правильно пишется, врде - lynk sys)
Ну так вот, смысл в том ,что идёт жестокое перемножение матриц различной размерности и типа. В итоге, машины на оптеронах показывют скорость около 90-95% от максимальной теоретической (Flops), А Зеоны около 60-70
Это так, к слову.
Теперь про инструкции. Чем хороша 3DNow в математике ? Если не ошибаюсь, они позволяют выполнять несколько действий с регистрами одновременно. Т.е. не просто складывать содержимое двух регистров ,но и одновременно эти значения перемножать.
В этом их сила. Слабось - малая распространённость оптимизированного под это софта.
Резюмирую. NetBurst - убогая архитектура. К8 смотрится намного лучше практически со всех сторон
Member
Статус: Не в сети Регистрация: 06.09.2005 Откуда: Москва
Andreika, зачем 2х2, для чего? Единственное применение, которое приходит в голову, это графика. Но зачем процу давать графику? Так что твой пример бессмыслен.
2All: Извиняюсь за высказанное, но меня такие товарищи просто добивают своей недалёкостью. Зачем выпендриваться знанием математики, если не знаешь, каков уровень в ней у собеседников?
Advanced member
Статус: Не в сети Регистрация: 30.08.2003 Откуда: Санкт-Петербург
Andreika причем тут конфиг в профиле? мне его просто банально лень обновить а как насчет торобредовских и бартоновских либ?
Никто их не скачивал и не тестил? А вот фиг - там в ридми бенчи написаны.
Цитата:
Thunderbird 1.62Ghz @ 154fsb - (my normal running overclocked speed) With DLL's = 248.5 fps Without DLL's = 221.7 fps
ну, и где обещанные разы? Пожалуйста - реальное приложение. А не какая-нибудь специализированная задача (вроде посчитать миллион оптизированных косинусов - только смысл?). TheJudge
Цитата:
Чем хороша 3DNow в математике ? Если не ошибаюсь, они позволяют выполнять несколько действий с регистрами одновременно.
Если быть точным, то, наверное, не множество операций с регистрами, а одну операцию над большим кол-вом регистров.
Вообще-то MMX, SSE и SSE2 с SSE3 позволяют делать те же самые действия. Другое дело, что MMX - целочисленный набор, а вот 3DNow! - уже для арифметики с плавающей точкой. Добавлено спустя 8 минут, 56 секунд TheJudge а пакет, наверное - Linpack.
_________________ {:€ дед в законе :-) нородный окодемег почетный пользователь OpenSuSE 11.3 Ремонт и модернизация ноутбуков IBM (Lenovo) ThinkPad
Member
Статус: Не в сети Регистрация: 01.07.2005 Откуда: москва
Блин организуйте чтоли ветку про программирование и беседуйте там до посинения а то нахватались и здесь это всё вываливают в надежде кого нить поразить. Я тоже могу много чего сюда вывалить программирование у нас тоже будь здоров и Кнута мы тоже почитываем (Щас вот как раз пишу QR разложение для трёхдиаг. матрицы методом вращений ). Andreika Организуй ветку по афуфенным алгоритмам и иди туда.
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
Bozz Bishop писал(а):
Andreika, не вы****айся, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.
Давай посмотрим как твоя прога будет в 13 раз быстрее матрицы 2*2 перемножать.... А про мой уровень ламерства я бы не рассуждал.... Добавлено спустя 3 минуты, 35 секунд amdfan ТУТ КТО-ТО называл меня ламером при упоминании 3д НАУ???? Добавлено спустя 14 минут, 51 секунду Тут получается та же х***я как и в http://forums.overclockers.ru/viewtopic ... &start=100
Только там ещё смешнее..... Нули в программухе спорят про различия в PS2.0b & PS3.0 Добавлено спустя 12 минут, 21 секунду
TheJudge писал(а):
Алгоритмы надо предлагать не клоунам с IDF а программерам
На самом деле программеры юзать его не смогут.... Там очень сложный алгоритм, кот. должен быть реализован в железе для начала.....
Последний раз редактировалось Andreika 18.01.2006 16:28, всего редактировалось 2 раз(а).
Member
Статус: Не в сети Регистрация: 17.11.2003 Откуда: Екатеринбург
Andreika Почему ты решил что 3днау рулит не подецки?? В перемножении матриц 2x2 3днау (все-таки 2 флоата за раз) может и рулит перед SSE (а тут 4 флоата за раз). Но я не могу придумать где такую хрень (перемножение матриц 2x2) надо применять..
Я тебе приведу пример из жизни: умножение массива векторов (Nx4) на матрицу (4x4) - это используется например в скелетной анимации (надеюсь не надо объяснять что это такое?). Здесь предпочтительнее использовать SSE, т.к. он работает с 4-ками флоатов, а 3днау только с 2-ками и использовав 3днау придется выполнять в 2 раза больше инструкций. И SSE в этом случае однозначно будет быстрее чем 3днау, главное не забывать что данные для SSE должны быть выровнены по 16-байт границе (т.е. и матрицы и массив вершин).
И кстати никакого увеличения производительности в разы использование SSE и 3DNow не дает, макс. - раза в 1,5. У меня получалось что использование SSE давало лишь 1% прирост по сравнению с обычным FP кодом, а 3DNow вообще ничего не дал..
_________________ |АМД процы не так уж и плохи|
|Но все-таки Интел лучше|
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
BloodyWerewolf Сейчас разговор не про это....
Меня обозвали ламом, пустобрёхом и сказали что я вы****юсь... Пусть теперь докажет товарисчь Bozz Bishop СВОИ слова по поводу
Bozz Bishop писал(а):
Andreika, не вы****айся, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.
На примере 2*2 матриц. Хоть на 3д нау хоть на ССЕ. Мне все равно. Был бы резалт.
Member
Статус: Не в сети Регистрация: 24.11.2005 Откуда: мир
А я никакой ни крутой программер, но синус в ряд разложу - не... делать.
Есть еще такая фенька - ускорение сходимости рядов. Там на порядки ускоряют. А ряды - так они везде.
Меня вот 3Dmax волнует - так там SSE дает 15% прироста на торике, а 3днав где? (хотя я за)
А детерминант от матриц Лапласовыми трансформациями делается - но это же приблизительно. А так там точно если, то сложность n*n!, т.е. матрицу 20*20 до второго пришествия на суперкомпьютере считать будешь - 1543 лет выполняя 1млрд операций в секунду, например. Вот и думай, что проще, хард крутой склепать, или софт нормально делать.
Andreika писал(а):
Только там ещё смешнее..... Нули в программухе спорят про различия в PS2.0b & PS3.0
Спортивный, интерес. Да и в игры печь мы мостаки.
Приятно осознавать что ряды учил не один я, но ты почаще смотрясь в зеркало говори себе:
"я не бог, я не бог" - а то уж очень круто себя ставишь. Без обид.
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
Nimnul писал(а):
Спортивный, интерес. Да и в игры печь мы мостаки. Приятно осознавать что ряды учил не один я, но ты почаще смотрясь в зеркало говори себе: "я не бог, я не бог" - а то уж очень круто себя ставишь. Без обид.
Ладна народ... Просто я хочу сказать одно:
При желании всё можно оптимизировать. И сатвить себя круто тоже не хочу...
Я просто не понимаю одного:
Почему народ дико верит в производительность цацок и попугаи???
И у П4 и у АМД есть свои преимущества и недостатки,
и их создатели не зря едят свой хлеб.....
Несомненно АМД с К7 и К8 очень неплохо поднялась и задает темп.
И у каждой заточки будь то 3дНАУ или ССЕ есть тоже свои области применения...
ИМХО почему не используется 3дНАУ:
С появлением ССЕ у АМД отпала необходимость писать два разных кода - пишут под ССЕ.
И даже опытный программер не будет переписывать код под 3ДНАУ потому что - ВЛОМ.
Как известно программеры очень ленивый народец...
Про ПС2.0 и ПС3.0 поясню свою точку зрения:
Изначально для обратной совместимости пишется ПС2.0 код,
который потом портируется в ПС3.0.
Сама ПС3.0 ничего революционного не принесла.
Просто шейдеры стало легче программить на ПС3.0....
Про обратный процесс ПС3.0 в ПС2.0 я очень сомневаюсь......
Никого я не хотел ставить ниже чем я. Простите если чё не так...
Пора за работу...
Надо скриптец на AIX написать шоб таблицы почистить от дубликатов....
*Cofradia Intel*
Статус: Не в сети Регистрация: 25.05.2004 Откуда: Саров
То что касаемо шейдеров. 2.0 и 3.0 по сути одно и тоже. Просто есть ряд различий, который позволяет делать одну из двух вещей 1) Тот же шейдер в версии 3.0 будет исполняться быстрее ,чем в 2.0 2) При таком же объёме кода как и в 2.0 в 3.0 будет выглядеть красивше
Member
Статус: Не в сети Регистрация: 10.11.2005 Откуда: Череповец
Ну ладно, все мы с радостью убедились, что есть еще женщины в русских селеньях (в смысле люди знающие математическую оптимизацию). Интересно, вернется ли теперь обсуждение к теме Как я понимаю, на то это и флейм, чтобы можно было высказывать предположения без постоянных ссылок на www.intel...pdf и www.amd...pdf. Различие архитектур и без того разжевано в технических форумах, а вот перспективы и развитие - скорее область домыслов и спекуляций. Но очень уж интересно
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
Nimnul В сандре - теоретический максимум выполнения простых микроопераций и на него ориентироваться смычла нету, т.к. он совсем не отражает реальный уровень производительности процессора. Точно так же как и мемори тест.
Самсунг ТЦЦД на 300 МГц в сандре быстрее чем ВИНБОНД 250МГц 2-2-2-5 а в реальных приложениях зачастую ВИНБОНД быстрее.
Member
Статус: Не в сети Регистрация: 10.11.2005 Откуда: Череповец
TheJudge писал(а):
cooshoo Есть вопросы по следующему поколению ? Слушаю.
Ну какой главный вопрос для end-usera? Конечно о соотношении производительности Conroe и А64.
Если ориентироваться не на тексты, а на _изменение_тона_ прогнозов, у меня сложилось следующее впечатление: сперва говорили о преимушестве Conroe по производительности на такт (4 микрооперации против 3 у А64). Потом на этом перестали так акцентироваться, и перешли на преимущество в частоте (3.3 ГГц против 2.8 у А64). Мой вывод - до перехода АМД на .65 мкм у Интел будет незначительное преимущество по производительности. К осени оно нивелируется, и начнет настойчиво продвигаться идея "4 ядра в массы!". Пользу это принесет только тем, кто летом 2007-го закупится дешевыми двухядерниками.
А в способность архитектурных ухищрений ощутимо поднять производительность без смены технологического оборудования я не слишком верю. Из "революционных идей" меня поразила одна - возможность многоядерного процессора передавать _микрооперации_ простаивающим ядрам. Но я даже не представляю, как это может делаться.
Сейчас этот форум просматривают: Guzz, Varg и гости: 22
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения