Часовой пояс: UTC + 3 часа




Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 411 • Страница 19 из 21<  1 ... 16  17  18  19  20  21  >
  Версия для печати (полностью) Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Kireev_A Пример в коде??? Слабо.... Пустая болтовня.... Что спорить с народом который ЗНАЕТ только по прочитанным статьям....



Партнер
 

Member
Статус: Не в сети
Регистрация: 12.12.2005
Откуда: Москва
Andreika писал(а):
SSE на АМД архитектуре ничего не дает. 1-3% производительности это ничто по сравнению с 3D Now.

А в некоторых приложениях даже наблюдается падение производительности на 1-5% при включении SSE!


 

Member
Статус: Не в сети
Регистрация: 01.07.2005
Откуда: москва
Слушай Andreika я как смотрю ты у нас крутой программер, и знаешь всё не
Andreika писал(а):
только по прочитанным статьям
. Советую расслабится
твои слова "У АМД только один козырь - 3Д НАУ. Кто проги писал меня поймет...... ИМХО без 3Д НАУ АМД какал бы интелу тока ф путь...... " уже прекрасно проинформировали нас о том какой ты есть программер. :D

_________________
Radeon is Gaming


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
amdfan

Пример в коде??? Слабо.... Уверен что ты даже не знаешь КАК включить использование SSE или 3Dnow.....


 

Advanced member
Статус: Не в сети
Регистрация: 30.08.2003
Откуда: Санкт-Петербург
cooshoo
я лично ручками доводил кваку (Q2&Q3) до состояния, когда с 3DNow! она бегала быстрее. Не в два-три раза, конечно, но на процентов 10%. Реально то, что ее авторы называет оптимизациями - всего лишь полторы строчки текста... Не серьезно. В любом случае напомню, что существуют библиотеки Q3 заточенные специально под P4, Barton'ы и Thoroughbred'ы (файлы обзываются - Q3A_P4_VS2003, q3tb-install и q3xp-132opt соответственно). Опять же там прирост не больше 50%.
Andreika
Цитата:
Изначально Все дрова и ВЫНЬ ХП точились под 3D Now. SSE на АМД архитектуре ничего не дает. 1-3% производительности это ничто по сравнению с 3D Now.

ну-ну. DirectX какой-то бородатой версии точился под 3DNow, какие-то дрова (nVidia Detonator), игры (UT99), но все равно на Интелах эти проги бегают не хуже. Что-то тук не так, не правда ли? Тем более, что после ручной доводки кода под 3DNow! прирост не такой уж и большой... :( Для справедливости отмечу, что 4-хкратное ускорение (которое интел всем обещала) на MMX тоже не получить.

_________________
{:€ дед в законе :-) нородный окодемег
почетный пользователь OpenSuSE 11.3
Ремонт и модернизация ноутбуков IBM (Lenovo) ThinkPad


 

Member
Статус: Не в сети
Регистрация: 10.05.2005
Откуда: Нижний Новгород
Andreika слушай, если можешь - приводи пример прямо здесь, а не лови на понт!

_________________
Чтобы стать похожей на своего кумира, 15-летняя фанатка Даны Борисовой вышибла себе мозги!
css.rinet.ru - Клан [Doc]


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Root писал(а):
ну-ну. DirectX какой-то бородатой версии точился под 3DNow, какие-то дрова (nVidia Detonator), игры (UT99), но все равно на Интелах эти проги бегают не хуже. Что-то тук не так, не правда ли? Тем более, что после ручной доводки кода под 3DNow! прирост не такой уж и большой... Для справедливости отмечу, что 4-хкратное ускорение (которое интел всем обещала) на MMX тоже не получить


Особенно на твоем конфиге:
AMD K6-2+ 450(75*6)
ASUS TX97-E
256MB Hynix RAM
Radeon 9000 64MB PCI (Powercolor)
Fujitsu MAN3184MP 18Gb
SCSI Adaptec 29160N
sound ESS1868
modem Courier ISA
Microsoft IntelliMouse Explorer 3.0 Optical
Windows 2k SP2 Eng
Primax Profi 9600
HP LaserJet 6L

Да и оффициально мелкософт начал ставить пакеты 3dnow в VCC после 6.0. А ты говоришь про бородатый дирехт...

Kireev_A Про код - отрубаешь в дровах видюхи использование mmx/sse/3dnow.... Всё сам увидишь....
Получишь разницу в оптимизациях кода.... Если такие были :)

По моему опыту в активных мат. выч. 3днау дает о себе знать......


 

Member
Статус: Не в сети
Регистрация: 06.09.2005
Откуда: Москва
Andreika, не выпендривайся. Уже то, что ты так говоришь про 3днау говорит только о твоей ламерозности.
ЗЫ Давай сырцы, пустобрех.


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
inline void AddEdge( WORD* pEdges, DWORD& dwNumEdges, WORD v0,WORD v1 )
{
_asm
{
xor ebx,ebx //ebx=0 íàäî
mov edi,pEdges //edi=pEdges

mov ax,v0 //eax=v0<<16|v1;
ror eax,16
mov ax,v1

mov bx,dwNumEdges
cmp bx,1
jbe endLoop

mov ecx,dwNumEdges
LoopStart:

cmp [edi],eax //if [edi]==eax
jne nextLoop
ror eax,16
cmp [edi],eax
jne nextLoop

dec bx
mov dwNumEdges,bx //dwNumEdges--

mov esi,pEdges //pEdges[i] = pEdges[2*dwNumEdges];
shl ebx,2 //pEdges[i+1] = pEdges[2*dwNumEdges+1];
add esi,ebx
movsd

jmp endFunc
nextLoop:
add edi,4
loop LoopStart
endLoop:
mov ax,v1 //eax=v0<<16|v1;
ror eax,16
mov ax,v0
mov [edi],eax
inc ebx
mov dwNumEdges,bx
endFunc:
};
};


Компилер настроен юзать 3д нау / ССЕ

Результаты:

AddEdge - Original Version - 0.045543249ms
AddEdge - Optimized C++ Version - 0.036311321ms
AddEdge - Optimized Asm Last Version - 0.029943426ms

No comments

Учитесь программить и МАТЕМАТИКУ (особенно методы программирования и мат. оптимизации)
Ламаки.....

Любая функция в 3Д cos, sin...... разлагается в ряд.... Который потом можно оптимайзить

Самый простой пример:

Возведение в квадрат.... представляем в виде суммы ряда нечетных чисел.... С ССЕ или 3Днау на малых значениях аргумента прирост 150-200%....


Потом такие дятлы как вы софт пишут...... Который ни смотря на все заточки пашет медленне чем что либо......

З.Ы. Резалты получены на Интеле с ССЕ.

На АМД с его более мощным FPU прирост от юзания ПРАВИЛЬНОГО КОДА на некоторых функциях может достигать 300-400% В сумме по проге прирост 10-200% в зависимости от сложности......

Простой пример более сложной оптимизации про квадраты:

"А" в квадрате равно
1+3+5+7+9+....+ всего А чисел
т.о.
5 в квадрате = 25 = 1 + 3 + 5 + 7 + 9

в двоичном счислении

1 + 11 + 101 + 111 + 1001

Обединяя по парно

1 + 11 = бинарный сдвиг старшего разряда влево = результат 100

.
.
.
.
.

Итог 101 в квадрате = 11001
Проведя аналогию можно написать Афуенно быстрый алгоритм......
Добавлено спустя 31 минуту, 54 секунды
Root писал(а):
ну-ну. DirectX какой-то бородатой версии точился под 3DNow, какие-то дрова (nVidia Detonator), игры (UT99), но все равно на Интелах эти проги бегают не хуже. Что-то тук не так, не правда ли? Тем более, что после ручной доводки кода под 3DNow! прирост не такой уж и большой... Для справедливости отмечу, что 4-хкратное ускорение (которое интел всем обещала) на MMX тоже не получить.



Что толку точить дирек если дрова и проги не юзают 3DNow.......

Основной выйгрыш в 3Д движках которым нужны нормально написанные быстрые функции.....


 

Member
Статус: Не в сети
Регистрация: 10.05.2005
Откуда: Нижний Новгород
Andreika ништяк, так бы сразу!;)
Andreika писал(а):
Ламаки.....

полегче на поворотах
Andreika писал(а):
такие дятлы как вы

более легче на поворотах!
Понимаешь, если ты умеешь писать проги с оптимизациями, а люди просят тебя показать как именно, чтобы ты не бросался пустыми словами (имею ввиду без аргументации), это не повод всех называть ламаками и дятлами. А то найдётся мильон людей, которые потом возьмут и опустят тебя по любым другим вопросам, вот и всё.
К тому же я ничего противоречащего тебе не писал, а требовал примера.

_________________
Чтобы стать похожей на своего кумира, 15-летняя фанатка Даны Борисовой вышибла себе мозги!
css.rinet.ru - Клан [Doc]


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Kireev_A писал(а):
полегче на поворотах
Andreika писал(а):
такие дятлы как вы

более легче на поворотах!
Понимаешь, если ты умеешь писать проги с оптимизациями, а люди просят тебя показать как именно, чтобы ты не бросался пустыми словами (имею ввиду без аргументации), это не повод всех называть ламаками и дятлами. А то найдётся мильон людей, которые потом возьмут и опустят тебя по любым другим вопросам, вот и всё.
К тому же я ничего противоречащего тебе не писал, а требовал примера.



Ты нет но

Bozz Bishop писал(а):
Andreika, не выпендривайся. Уже то, что ты так говоришь про 3днау говорит только о твоей ламерозности.
ЗЫ Давай сырцы, пустобрех.

amdfan писал(а):
Слушай Andreika я как смотрю ты у нас крутой программер, и знаешь всё не Andreika писал(а):
только по прочитанным статьям
. Советую расслабится
твои слова "У АМД только один козырь - 3Д НАУ. Кто проги писал меня поймет...... ИМХО без 3Д НАУ АМД какал бы интелу тока ф путь...... " уже прекрасно проинформировали нас о том какой ты есть программер.


А после этого я вообще разговаривать не хочу...... ДЯТЛЫ.... Обидно когда нули в программухе пытаются сравнивать архитектуры.....

ВОПРОС К ВАМ ГУРУ:
Какой размер кэша предсказаний ветвлений оптимален для существующих процов и чтобы точность была >90%????
Слабо???


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Kireev_A In KB?
Добавлено спустя 37 секунд
И для какова метода?


 

Member
Статус: Не в сети
Регистрация: 10.05.2005
Откуда: Нижний Новгород
Andreika а вот это уже не знаю... Факт того, что эта таблица была использована на атлонах (первых)...

_________________
Чтобы стать похожей на своего кумира, 15-летняя фанатка Даны Борисовой вышибла себе мозги!
css.rinet.ru - Клан [Doc]


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Kireev_A На самом деле по резалтам тестов IBM ната около 128К на кэш предсказаний. Точно алгоритм не помню но он прогрессивный циклический(цепочкой), т.е. несколько ветвлений вперед если на них статистика уже есть.

На первом ветвлении до 92% + просчитываются при необходимости остальные, если на них статистика уже есть.
Более 128К неэффективно т.к. 16к->128к процентная кривая растет от 65% практически линейно, а дальше спад......

Вот почему у П4 такая низкая эффективность по предсказанию ветвления.....
Да и у АМД дела не лучше

А вот RISC или какой нить СуперКопутерный проц имеет минимум 64К на енто дело, и как правило несколько алгоритмов....

Макс выйгрыш получается во всеми нами любимых циклах for,while

А многие "ГУРУ" думают что в if..... :)
У меня к ним послание
CD& ~! BSD
Кто прошареный тот поймет......


 

*Cofradia Intel*
Статус: Не в сети
Регистрация: 25.05.2004
Откуда: Саров
Andreika

Беда NetBurst не в том, что у них низкая эффективность предсказания ветвлений, а в том, что очень велика цена этой ошибки. Ведь очищать длинный конвейер дольше чем короткий. Поэтому одним из основных способов повышения производительности является улучшение предсказания ветвлений. И даже не так всё плачевно было бы, если не replay. К счастью в Conroe 1) Сильно улучшат алгоритм предсказания ветвлений 2) Уберут нафик Trace кэш, который также очень дорого обходиться в плане промаха 3) Вернут разноску кэшей как у Р6, т.е. одинаковые по размерам D и I кэши 4) Уберут Replay.

Таже просьба понять, что Conroe будет не просто доделкой Пентака М.


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
TheJudge АБСАЛЮТНА САГЛАСЕН.... Я даже разработал афуенный алгоритм для П4, но на IDF не захотели..... Ну что ж они сами отказались от 99% точности :( я не виноват.


 

Member
Статус: Не в сети
Регистрация: 06.09.2005
Откуда: Москва
Andreika, не <удалено>, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.

ЖК на месяц. Учимся нормально разговаривать!
Отредактировано модератором: Shurik Dribenetc. Дата: 01.18.2006 3:00


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Bozz Bishop CD& ~! BSD !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

Давай 2*2 матрицы погоняем....


 

Member
Статус: Не в сети
Регистрация: 06.09.2005
Откуда: Москва
Чтойта?
Добавлено спустя 38 секунд
Давай лучше 2000x2000.


 

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29
Bozz Bishop Чё саскакиваем???

Bozz Bishop писал(а):
Andreika, не выёбывайся, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.


Давай посмотрим как твоя прога будет в 13 раз быстрее матрицы 2*2 перемножать....
А потом разберемся кто здесь
Bozz Bishop писал(а):
ВЫЁБЫВАЕТСЯ
и
Bozz Bishop писал(а):
пустобрех
.....

Ещё раз для повторяю

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! CD& ~! BSD !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

ЖК на две недели. Учимся уважать оппонента.
Пост сам поправишь?

Отредактировано модератором: Shurik Dribenetc. Дата: 01.18.2006 3:47


Последний раз редактировалось Andreika 18.01.2006 14:35, всего редактировалось 1 раз.

Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 411 • Страница 19 из 21<  1 ... 16  17  18  19  20  21  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: npa4ka, -SPQR- и гости: 16


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan