Member
Статус: Не в сети Регистрация: 01.07.2005 Откуда: москва
Слушай Andreika я как смотрю ты у нас крутой программер, и знаешь всё не
Andreika писал(а):
только по прочитанным статьям
. Советую расслабится
твои слова "У АМД только один козырь - 3Д НАУ. Кто проги писал меня поймет...... ИМХО без 3Д НАУ АМД какал бы интелу тока ф путь...... " уже прекрасно проинформировали нас о том какой ты есть программер.
Advanced member
Статус: Не в сети Регистрация: 30.08.2003 Откуда: Санкт-Петербург
cooshoo я лично ручками доводил кваку (Q2&Q3) до состояния, когда с 3DNow! она бегала быстрее. Не в два-три раза, конечно, но на процентов 10%. Реально то, что ее авторы называет оптимизациями - всего лишь полторы строчки текста... Не серьезно. В любом случае напомню, что существуют библиотеки Q3 заточенные специально под P4, Barton'ы и Thoroughbred'ы (файлы обзываются - Q3A_P4_VS2003, q3tb-install и q3xp-132opt соответственно). Опять же там прирост не больше 50%.
Andreika
Цитата:
Изначально Все дрова и ВЫНЬ ХП точились под 3D Now. SSE на АМД архитектуре ничего не дает. 1-3% производительности это ничто по сравнению с 3D Now.
ну-ну. DirectX какой-то бородатой версии точился под 3DNow, какие-то дрова (nVidia Detonator), игры (UT99), но все равно на Интелах эти проги бегают не хуже. Что-то тук не так, не правда ли? Тем более, что после ручной доводки кода под 3DNow! прирост не такой уж и большой... Для справедливости отмечу, что 4-хкратное ускорение (которое интел всем обещала) на MMX тоже не получить.
_________________ {:€ дед в законе :-) нородный окодемег почетный пользователь OpenSuSE 11.3 Ремонт и модернизация ноутбуков IBM (Lenovo) ThinkPad
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
Root писал(а):
ну-ну. DirectX какой-то бородатой версии точился под 3DNow, какие-то дрова (nVidia Detonator), игры (UT99), но все равно на Интелах эти проги бегают не хуже. Что-то тук не так, не правда ли? Тем более, что после ручной доводки кода под 3DNow! прирост не такой уж и большой... Для справедливости отмечу, что 4-хкратное ускорение (которое интел всем обещала) на MMX тоже не получить
Особенно на твоем конфиге:
AMD K6-2+ 450(75*6)
ASUS TX97-E
256MB Hynix RAM
Radeon 9000 64MB PCI (Powercolor)
Fujitsu MAN3184MP 18Gb
SCSI Adaptec 29160N
sound ESS1868
modem Courier ISA
Microsoft IntelliMouse Explorer 3.0 Optical
Windows 2k SP2 Eng
Primax Profi 9600
HP LaserJet 6L
Да и оффициально мелкософт начал ставить пакеты 3dnow в VCC после 6.0. А ты говоришь про бородатый дирехт...
Kireev_A Про код - отрубаешь в дровах видюхи использование mmx/sse/3dnow.... Всё сам увидишь....
Получишь разницу в оптимизациях кода.... Если такие были
По моему опыту в активных мат. выч. 3днау дает о себе знать......
AddEdge - Original Version - 0.045543249ms
AddEdge - Optimized C++ Version - 0.036311321ms
AddEdge - Optimized Asm Last Version - 0.029943426ms
No comments
Учитесь программить и МАТЕМАТИКУ (особенно методы программирования и мат. оптимизации)
Ламаки.....
Любая функция в 3Д cos, sin...... разлагается в ряд.... Который потом можно оптимайзить
Самый простой пример:
Возведение в квадрат.... представляем в виде суммы ряда нечетных чисел.... С ССЕ или 3Днау на малых значениях аргумента прирост 150-200%....
Потом такие дятлы как вы софт пишут...... Который ни смотря на все заточки пашет медленне чем что либо......
З.Ы. Резалты получены на Интеле с ССЕ.
На АМД с его более мощным FPU прирост от юзания ПРАВИЛЬНОГО КОДА на некоторых функциях может достигать 300-400% В сумме по проге прирост 10-200% в зависимости от сложности......
Простой пример более сложной оптимизации про квадраты:
"А" в квадрате равно
1+3+5+7+9+....+ всего А чисел
т.о.
5 в квадрате = 25 = 1 + 3 + 5 + 7 + 9
в двоичном счислении
1 + 11 + 101 + 111 + 1001
Обединяя по парно
1 + 11 = бинарный сдвиг старшего разряда влево = результат 100
.
.
.
.
.
Итог 101 в квадрате = 11001
Проведя аналогию можно написать Афуенно быстрый алгоритм...... Добавлено спустя 31 минуту, 54 секунды
Root писал(а):
ну-ну. DirectX какой-то бородатой версии точился под 3DNow, какие-то дрова (nVidia Detonator), игры (UT99), но все равно на Интелах эти проги бегают не хуже. Что-то тук не так, не правда ли? Тем более, что после ручной доводки кода под 3DNow! прирост не такой уж и большой... Для справедливости отмечу, что 4-хкратное ускорение (которое интел всем обещала) на MMX тоже не получить.
Что толку точить дирек если дрова и проги не юзают 3DNow.......
Основной выйгрыш в 3Д движках которым нужны нормально написанные быстрые функции.....
Member
Статус: Не в сети Регистрация: 10.05.2005 Откуда: Нижний Новгород
Andreika ништяк, так бы сразу!;)
Andreika писал(а):
Ламаки.....
полегче на поворотах
Andreika писал(а):
такие дятлы как вы
более легче на поворотах!
Понимаешь, если ты умеешь писать проги с оптимизациями, а люди просят тебя показать как именно, чтобы ты не бросался пустыми словами (имею ввиду без аргументации), это не повод всех называть ламаками и дятлами. А то найдётся мильон людей, которые потом возьмут и опустят тебя по любым другим вопросам, вот и всё.
К тому же я ничего противоречащего тебе не писал, а требовал примера.
_________________ Чтобы стать похожей на своего кумира, 15-летняя фанатка Даны Борисовой вышибла себе мозги!
css.rinet.ru - Клан [Doc]
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
Kireev_A писал(а):
полегче на поворотах Andreika писал(а): такие дятлы как вы
более легче на поворотах! Понимаешь, если ты умеешь писать проги с оптимизациями, а люди просят тебя показать как именно, чтобы ты не бросался пустыми словами (имею ввиду без аргументации), это не повод всех называть ламаками и дятлами. А то найдётся мильон людей, которые потом возьмут и опустят тебя по любым другим вопросам, вот и всё. К тому же я ничего противоречащего тебе не писал, а требовал примера.
Ты нет но
Bozz Bishop писал(а):
Andreika, не выпендривайся. Уже то, что ты так говоришь про 3днау говорит только о твоей ламерозности. ЗЫ Давай сырцы, пустобрех.
amdfan писал(а):
Слушай Andreika я как смотрю ты у нас крутой программер, и знаешь всё не Andreika писал(а): только по прочитанным статьям . Советую расслабится твои слова "У АМД только один козырь - 3Д НАУ. Кто проги писал меня поймет...... ИМХО без 3Д НАУ АМД какал бы интелу тока ф путь...... " уже прекрасно проинформировали нас о том какой ты есть программер.
А после этого я вообще разговаривать не хочу...... ДЯТЛЫ.... Обидно когда нули в программухе пытаются сравнивать архитектуры.....
ВОПРОС К ВАМ ГУРУ:
Какой размер кэша предсказаний ветвлений оптимален для существующих процов и чтобы точность была >90%????
Слабо???
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
Kireev_A На самом деле по резалтам тестов IBM ната около 128К на кэш предсказаний. Точно алгоритм не помню но он прогрессивный циклический(цепочкой), т.е. несколько ветвлений вперед если на них статистика уже есть.
На первом ветвлении до 92% + просчитываются при необходимости остальные, если на них статистика уже есть.
Более 128К неэффективно т.к. 16к->128к процентная кривая растет от 65% практически линейно, а дальше спад......
Вот почему у П4 такая низкая эффективность по предсказанию ветвления.....
Да и у АМД дела не лучше
А вот RISC или какой нить СуперКопутерный проц имеет минимум 64К на енто дело, и как правило несколько алгоритмов....
Макс выйгрыш получается во всеми нами любимых циклах for,while
А многие "ГУРУ" думают что в if..... У меня к ним послание
CD& ~! BSD
Кто прошареный тот поймет......
*Cofradia Intel*
Статус: Не в сети Регистрация: 25.05.2004 Откуда: Саров
Andreika
Беда NetBurst не в том, что у них низкая эффективность предсказания ветвлений, а в том, что очень велика цена этой ошибки. Ведь очищать длинный конвейер дольше чем короткий. Поэтому одним из основных способов повышения производительности является улучшение предсказания ветвлений. И даже не так всё плачевно было бы, если не replay. К счастью в Conroe 1) Сильно улучшат алгоритм предсказания ветвлений 2) Уберут нафик Trace кэш, который также очень дорого обходиться в плане промаха 3) Вернут разноску кэшей как у Р6, т.е. одинаковые по размерам D и I кэши 4) Уберут Replay.
Таже просьба понять, что Conroe будет не просто доделкой Пентака М.
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
TheJudge АБСАЛЮТНА САГЛАСЕН.... Я даже разработал афуенный алгоритм для П4, но на IDF не захотели..... Ну что ж они сами отказались от 99% точности я не виноват.
Member
Статус: Не в сети Регистрация: 06.09.2005 Откуда: Москва
Andreika, не <удалено>, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.
Member
Статус: Не в сети Регистрация: 26.11.2004 Откуда: Минск Беларусь Фото: 29
Bozz Bishop Чё саскакиваем???
Bozz Bishop писал(а):
Andreika, не выёбывайся, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.
Давай посмотрим как твоя прога будет в 13 раз быстрее матрицы 2*2 перемножать.... А потом разберемся кто здесь
Сейчас этот форум просматривают: npa4ka, -SPQR- и гости: 16
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения