Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 411 • Страница 20 из 21<  1 ... 17  18  19  20  21  >
  Версия для печати (полностью) Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

*Cofradia Intel*
Статус: Не в сети
Регистрация: 25.05.2004
Откуда: Саров
Andreika

Алгоритмы надо предлагать не клоунам с IDF а программерам ;)

Кстати про матрицы. Есть такой пакетик (не помню как правильно пишется, врде - lynk sys)

Ну так вот, смысл в том ,что идёт жестокое перемножение матриц различной размерности и типа. В итоге, машины на оптеронах показывют скорость около 90-95% от максимальной теоретической (Flops), А Зеоны около 60-70

Это так, к слову.

Теперь про инструкции. Чем хороша 3DNow в математике ? Если не ошибаюсь, они позволяют выполнять несколько действий с регистрами одновременно. Т.е. не просто складывать содержимое двух регистров ,но и одновременно эти значения перемножать.

В этом их сила. Слабось - малая распространённость оптимизированного под это софта.

Резюмирую. NetBurst - убогая архитектура. К8 смотрится намного лучше практически со всех сторон



Партнер
 

Member
Статус: Не в сети
Регистрация: 06.09.2005
Откуда: Москва
Andreika, зачем 2х2, для чего? Единственное применение, которое приходит в голову, это графика. Но зачем процу давать графику? Так что твой пример бессмыслен.
2All: Извиняюсь за высказанное, но меня такие товарищи просто добивают своей недалёкостью. Зачем выпендриваться знанием математики, если не знаешь, каков уровень в ней у собеседников?


 

Advanced member
Статус: Не в сети
Регистрация: 30.08.2003
Откуда: Санкт-Петербург
Andreika
причем тут конфиг в профиле? мне его просто банально лень обновить :P
а как насчет торобредовских и бартоновских либ?
Никто их не скачивал и не тестил? А вот фиг - там в ридми бенчи написаны.
Цитата:
Thunderbird 1.62Ghz @ 154fsb - (my normal running overclocked speed)
With DLL's = 248.5 fps
Without DLL's = 221.7 fps

ну, и где обещанные разы? Пожалуйста - реальное приложение. А не какая-нибудь специализированная задача (вроде посчитать миллион оптизированных косинусов - только смысл?).
TheJudge
Цитата:
Чем хороша 3DNow в математике ? Если не ошибаюсь, они позволяют выполнять несколько действий с регистрами одновременно.

Если быть точным, то, наверное, не множество операций с регистрами, а одну операцию над большим кол-вом регистров.
Вообще-то MMX, SSE и SSE2 с SSE3 позволяют делать те же самые действия. Другое дело, что MMX - целочисленный набор, а вот 3DNow! - уже для арифметики с плавающей точкой.
Добавлено спустя 8 минут, 56 секунд
TheJudge
а пакет, наверное - Linpack.

_________________
{:€ дед в законе :-) нородный окодемег
почетный пользователь OpenSuSE 11.3
Ремонт и модернизация ноутбуков IBM (Lenovo) ThinkPad


 

Member
Статус: Не в сети
Регистрация: 01.07.2005
Откуда: москва
Блин организуйте чтоли ветку про программирование и беседуйте там до посинения а то нахватались и здесь это всё вываливают в надежде кого нить поразить. Я тоже могу много чего сюда вывалить программирование у нас тоже будь здоров и Кнута мы тоже почитываем (Щас вот как раз пишу QR разложение для трёхдиаг. матрицы методом вращений ).
Andreika Организуй ветку по афуфенным алгоритмам и иди туда.

_________________
Radeon is Gaming


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Bozz Bishop писал(а):
Andreika, не вы****айся, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.


Давай посмотрим как твоя прога будет в 13 раз быстрее матрицы 2*2 перемножать....
А про мой уровень ламерства я бы не рассуждал....
Добавлено спустя 3 минуты, 35 секунд
amdfan ТУТ КТО-ТО называл меня ламером при упоминании 3д НАУ????
Добавлено спустя 14 минут, 51 секунду
Тут получается та же х***я как и в
http://forums.overclockers.ru/viewtopic ... &start=100

Только там ещё смешнее.....
Нули в программухе спорят про различия в PS2.0b & PS3.0 :)
Добавлено спустя 12 минут, 21 секунду
TheJudge писал(а):
Алгоритмы надо предлагать не клоунам с IDF а программерам

На самом деле программеры юзать его не смогут.... Там очень сложный алгоритм, кот. должен быть реализован в железе для начала.....


Последний раз редактировалось Andreika 18.01.2006 16:28, всего редактировалось 2 раз(а).

 

Member
Статус: Не в сети
Регистрация: 17.11.2003
Откуда: Екатеринбург
Andreika
Почему ты решил что 3днау рулит не подецки?? В перемножении матриц 2x2 3днау (все-таки 2 флоата за раз) может и рулит перед SSE (а тут 4 флоата за раз). Но я не могу придумать где такую хрень (перемножение матриц 2x2) надо применять..
Я тебе приведу пример из жизни: умножение массива векторов (Nx4) на матрицу (4x4) - это используется например в скелетной анимации (надеюсь не надо объяснять что это такое?). Здесь предпочтительнее использовать SSE, т.к. он работает с 4-ками флоатов, а 3днау только с 2-ками и использовав 3днау придется выполнять в 2 раза больше инструкций. И SSE в этом случае однозначно будет быстрее чем 3днау, главное не забывать что данные для SSE должны быть выровнены по 16-байт границе (т.е. и матрицы и массив вершин).
И кстати никакого увеличения производительности в разы использование SSE и 3DNow не дает, макс. - раза в 1,5. У меня получалось что использование SSE давало лишь 1% прирост по сравнению с обычным FP кодом, а 3DNow вообще ничего не дал..

_________________
|АМД процы не так уж и плохи|
|Но все-таки Интел лучше|


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
BloodyWerewolf Сейчас разговор не про это....
Меня обозвали ламом, пустобрёхом и сказали что я вы****юсь... Пусть теперь докажет товарисчь Bozz Bishop СВОИ слова по поводу
Bozz Bishop писал(а):
Andreika, не вы****айся, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.



На примере 2*2 матриц. Хоть на 3д нау хоть на ССЕ. Мне все равно. Был бы резалт.


 

*Cofradia Intel*
Статус: Не в сети
Регистрация: 25.05.2004
Откуда: Саров
http://www.ixbt.com/cpu/intel-yonah.shtml

в тему


 

Member
Статус: Не в сети
Регистрация: 02.08.2005
Откуда: с того света
Цитата:
где такую хрень (перемножение матриц 2x2) надо применять..

Помнится, для рассчета спектра отражения брэгговского зеркала весьма полезно. Хотя ресурсоёмкостью это не отличается.

_________________
There are more things in heaven and earth, Horatio, than are dreamt of in your philosophy


 

Member
Статус: Не в сети
Регистрация: 24.11.2005
Откуда: мир
А я никакой ни крутой программер, но синус в ряд разложу - не... делать.
Есть еще такая фенька - ускорение сходимости рядов. Там на порядки ускоряют. А ряды - так они везде.
Меня вот 3Dmax волнует - так там SSE дает 15% прироста на торике, а 3днав где? (хотя я за)
А детерминант от матриц Лапласовыми трансформациями делается - но это же приблизительно. А так там точно если, то сложность n*n!, т.е. матрицу 20*20 до второго пришествия на суперкомпьютере считать будешь - 1543 лет выполняя 1млрд операций в секунду, например. Вот и думай, что проще, хард крутой склепать, или софт нормально делать.
Andreika писал(а):
Только там ещё смешнее.....
Нули в программухе спорят про различия в PS2.0b & PS3.0

Спортивный, интерес. Да и в игры печь мы мостаки.
Приятно осознавать что ряды учил не один я, но ты почаще смотрясь в зеркало говори себе:
"я не бог, я не бог" - а то уж очень круто себя ставишь. Без обид.


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Nimnul писал(а):
Спортивный, интерес. Да и в игры печь мы мостаки.
Приятно осознавать что ряды учил не один я, но ты почаще смотрясь в зеркало говори себе:
"я не бог, я не бог" - а то уж очень круто себя ставишь. Без обид.


Ладна народ... Просто я хочу сказать одно:

При желании всё можно оптимизировать. И сатвить себя круто тоже не хочу...
Я просто не понимаю одного:
Почему народ дико верит в производительность цацок и попугаи???

И у П4 и у АМД есть свои преимущества и недостатки,
и их создатели не зря едят свой хлеб.....

Несомненно АМД с К7 и К8 очень неплохо поднялась и задает темп.

И у каждой заточки будь то 3дНАУ или ССЕ есть тоже свои области применения...
ИМХО почему не используется 3дНАУ:
С появлением ССЕ у АМД отпала необходимость писать два разных кода - пишут под ССЕ.
И даже опытный программер не будет переписывать код под 3ДНАУ потому что - ВЛОМ.

Как известно программеры очень ленивый народец... :)

Про ПС2.0 и ПС3.0 поясню свою точку зрения:
Изначально для обратной совместимости пишется ПС2.0 код,
который потом портируется в ПС3.0.
Сама ПС3.0 ничего революционного не принесла.
Просто шейдеры стало легче программить на ПС3.0....

Про обратный процесс ПС3.0 в ПС2.0 я очень сомневаюсь......

Никого я не хотел ставить ниже чем я. Простите если чё не так...
Пора за работу...

Надо скриптец на AIX написать шоб таблицы почистить от дубликатов....


 

*Cofradia Intel*
Статус: Не в сети
Регистрация: 25.05.2004
Откуда: Саров
То что касаемо шейдеров. 2.0 и 3.0 по сути одно и тоже. Просто есть ряд различий, который позволяет делать одну из двух вещей 1) Тот же шейдер в версии 3.0 будет исполняться быстрее ,чем в 2.0 2) При таком же объёме кода как и в 2.0 в 3.0 будет выглядеть красивше


 

Member
Статус: Не в сети
Регистрация: 10.11.2005
Откуда: Череповец
Ну ладно, все мы с радостью убедились, что есть еще женщины в русских селеньях (в смысле люди знающие математическую оптимизацию). Интересно, вернется ли теперь обсуждение к теме :)
Как я понимаю, на то это и флейм, чтобы можно было высказывать предположения без постоянных ссылок на www.intel...pdf и www.amd...pdf. Различие архитектур и без того разжевано в технических форумах, а вот перспективы и развитие - скорее область домыслов и спекуляций. Но очень уж интересно :wink:


 

*Cofradia Intel*
Статус: Не в сети
Регистрация: 25.05.2004
Откуда: Саров
cooshoo

Никаких домыслов. Про архитектуру Conroe, и архитектуру следующего поколения как Intel так и AMD уже всё известно.


 

Member
Статус: Не в сети
Регистрация: 10.11.2005
Откуда: Череповец
TheJudge писал(а):
Никаких домыслов. Про архитектуру Conroe, и архитектуру следующего поколения как Intel так и AMD уже всё известно.

:)
Ну Conroe еще туда-сюда, уже инженерные образцы наверняка рассылаются. А вот следующее поколение...


 

Member
Статус: Не в сети
Регистрация: 24.11.2005
Откуда: мир
Andreika писал(а):
И у П4 и у АМД есть свои преимущества и недостатки,
и их создатели не зря едят свой хлеб.....

Несомненно АМД с К7 и К8 очень неплохо поднялась и задает темп.

Только где ж эти оптимизации. Что в сандре значат линии с ссе и без? Фигня какая то! Нечестно.


 

*Cofradia Intel*
Статус: Не в сети
Регистрация: 25.05.2004
Откуда: Саров
cooshoo

Есть вопросы по следующему поколению ? Слушаю.

Кстати Conroe уже серийные есть, пока на склад работают.


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Nimnul В сандре - теоретический максимум выполнения простых микроопераций и на него ориентироваться смычла нету, т.к. он совсем не отражает реальный уровень производительности процессора. Точно так же как и мемори тест.

Самсунг ТЦЦД на 300 МГц в сандре быстрее чем ВИНБОНД 250МГц 2-2-2-5 а в реальных приложениях зачастую ВИНБОНД быстрее.


 

Member
Статус: Не в сети
Регистрация: 10.11.2005
Откуда: Череповец
TheJudge писал(а):
cooshoo
Есть вопросы по следующему поколению ? Слушаю.

Ну какой главный вопрос для end-usera? :) Конечно о соотношении производительности Conroe и А64.
Если ориентироваться не на тексты, а на _изменение_тона_ прогнозов, у меня сложилось следующее впечатление: сперва говорили о преимушестве Conroe по производительности на такт (4 микрооперации против 3 у А64). Потом на этом перестали так акцентироваться, и перешли на преимущество в частоте (3.3 ГГц против 2.8 у А64). Мой вывод - до перехода АМД на .65 мкм у Интел будет незначительное преимущество по производительности. К осени оно нивелируется, и начнет настойчиво продвигаться идея "4 ядра в массы!". Пользу это принесет только тем, кто летом 2007-го закупится дешевыми двухядерниками.
А в способность архитектурных ухищрений ощутимо поднять производительность без смены технологического оборудования я не слишком верю. Из "революционных идей" меня поразила одна - возможность многоядерного процессора передавать _микрооперации_ простаивающим ядрам. Но я даже не представляю, как это может делаться.


 

Member
Статус: Не в сети
Регистрация: 10.05.2005
Откуда: Нижний Новгород
cooshoo писал(а):
я даже не представляю, как это может делаться.

слишком сложно... переброс инфы между ядрами теоретически сложен и будет занимать много времени.

_________________
Чтобы стать похожей на своего кумира, 15-летняя фанатка Даны Борисовой вышибла себе мозги!
css.rinet.ru - Клан [Doc]


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 411 • Страница 20 из 21<  1 ... 17  18  19  20  21  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: Guzz, Varg и гости: 22


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan