Различие архитектур процессоров Intel и AMD и их развитие

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 21.07.2026 21:24

Сообщения без ответов | Активные темы

Список форумов » Разговоры обо всем » Флейм

Часовой пояс: UTC + 3 часа

Новая тема /

Ответить

Сообщений: 411 • Страница 19 из 21 • < 1 ... 16 17 18 19 20 21 >

Версия для печати (полностью)	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Andreika

Добавлено: 16.01.2006 14:41

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

Kireev_A Пример в коде??? Слабо.... Пустая болтовня.... Что спорить с народом который ЗНАЕТ только по прочитанным статьям....

Реклама
Партнер

maxuser

Добавлено: 17.01.2006 1:54

[профиль]

Member
Статус: Не в сети
Регистрация: 12.12.2005
Откуда: Москва

Andreika писал(а):

SSE на АМД архитектуре ничего не дает. 1-3% производительности это ничто по сравнению с 3D Now.

А в некоторых приложениях даже наблюдается падение производительности на 1-5% при включении SSE!

amdfan

Добавлено: 17.01.2006 3:33

[профиль]

Member
Статус: Не в сети
Регистрация: 01.07.2005
Откуда: москва

Слушай Andreika я как смотрю ты у нас крутой программер, и знаешь всё не

Andreika писал(а):

только по прочитанным статьям

. Советую расслабится
твои слова "У АМД только один козырь - 3Д НАУ. Кто проги писал меня поймет...... ИМХО без 3Д НАУ АМД какал бы интелу тока ф путь...... " уже прекрасно проинформировали нас о том какой ты есть программер.

_________________
Radeon is Gaming

Andreika

Добавлено: 17.01.2006 3:55

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

amdfan

Пример в коде??? Слабо.... Уверен что ты даже не знаешь КАК включить использование SSE или 3Dnow.....

Root

Добавлено: 17.01.2006 10:45

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 30.08.2003
Откуда: Санкт-Петербург

cooshoo
я лично ручками доводил кваку (Q2&Q3) до состояния, когда с 3DNow! она бегала быстрее. Не в два-три раза, конечно, но на процентов 10%. Реально то, что ее авторы называет оптимизациями - всего лишь полторы строчки текста... Не серьезно. В любом случае напомню, что существуют библиотеки Q3 заточенные специально под P4, Barton'ы и Thoroughbred'ы (файлы обзываются - Q3A_P4_VS2003, q3tb-install и q3xp-132opt соответственно). Опять же там прирост не больше 50%.
Andreika

Цитата:

Изначально Все дрова и ВЫНЬ ХП точились под 3D Now. SSE на АМД архитектуре ничего не дает. 1-3% производительности это ничто по сравнению с 3D Now.

ну-ну. DirectX какой-то бородатой версии точился под 3DNow, какие-то дрова (nVidia Detonator), игры (UT99), но все равно на Интелах эти проги бегают не хуже. Что-то тук не так, не правда ли? Тем более, что после ручной доводки кода под 3DNow! прирост не такой уж и большой...

Для справедливости отмечу, что 4-хкратное ускорение (которое интел всем обещала) на MMX тоже не получить.

_________________
{:€ дед в законе :-) нородный окодемег
почетный пользователь OpenSuSE 11.3
Ремонт и модернизация ноутбуков IBM (Lenovo) ThinkPad

Kireev_A

Добавлено: 17.01.2006 11:36

[профиль]

Member
Статус: Не в сети
Регистрация: 10.05.2005
Откуда: Нижний Новгород

Andreika слушай, если можешь - приводи пример прямо здесь, а не лови на понт!

_________________
Чтобы стать похожей на своего кумира, 15-летняя фанатка Даны Борисовой вышибла себе мозги!
css.rinet.ru - Клан [Doc]

Andreika

Добавлено: 17.01.2006 17:25

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

Root писал(а):

ну-ну. DirectX какой-то бородатой версии точился под 3DNow, какие-то дрова (nVidia Detonator), игры (UT99), но все равно на Интелах эти проги бегают не хуже. Что-то тук не так, не правда ли? Тем более, что после ручной доводки кода под 3DNow! прирост не такой уж и большой... Для справедливости отмечу, что 4-хкратное ускорение (которое интел всем обещала) на MMX тоже не получить

Особенно на твоем конфиге:
AMD K6-2+ 450(75*6)
ASUS TX97-E
256MB Hynix RAM
Radeon 9000 64MB PCI (Powercolor)
Fujitsu MAN3184MP 18Gb
SCSI Adaptec 29160N
sound ESS1868
modem Courier ISA
Microsoft IntelliMouse Explorer 3.0 Optical
Windows 2k SP2 Eng
Primax Profi 9600
HP LaserJet 6L

Да и оффициально мелкософт начал ставить пакеты 3dnow в VCC после 6.0. А ты говоришь про бородатый дирехт...

Kireev_A Про код - отрубаешь в дровах видюхи использование mmx/sse/3dnow.... Всё сам увидишь....
Получишь разницу в оптимизациях кода.... Если такие были

По моему опыту в активных мат. выч. 3днау дает о себе знать......

Bozz Bishop

Добавлено: 17.01.2006 17:34

[профиль]

Member
Статус: Не в сети
Регистрация: 06.09.2005
Откуда: Москва

Andreika, не выпендривайся. Уже то, что ты так говоришь про 3днау говорит только о твоей ламерозности.
ЗЫ Давай сырцы, пустобрех.

Andreika

Добавлено: 17.01.2006 19:18

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

inline void AddEdge( WORD* pEdges, DWORD& dwNumEdges, WORD v0,WORD v1 )
{
_asm
{
xor ebx,ebx //ebx=0 íàäî
mov edi,pEdges //edi=pEdges

mov ax,v0 //eax=v0<<16|v1;
ror eax,16
mov ax,v1

mov bx,dwNumEdges
cmp bx,1
jbe endLoop

mov ecx,dwNumEdges
LoopStart:

cmp [edi],eax //if [edi]==eax
jne nextLoop
ror eax,16
cmp [edi],eax
jne nextLoop

dec bx
mov dwNumEdges,bx //dwNumEdges--

mov esi,pEdges //pEdges[i] = pEdges[2*dwNumEdges];
shl ebx,2 //pEdges[i+1] = pEdges[2*dwNumEdges+1];
add esi,ebx
movsd

jmp endFunc
nextLoop:
add edi,4
loop LoopStart
endLoop:
mov ax,v1 //eax=v0<<16|v1;
ror eax,16
mov ax,v0
mov [edi],eax
inc ebx
mov dwNumEdges,bx
endFunc:
};
};

Компилер настроен юзать 3д нау / ССЕ

Результаты:

AddEdge - Original Version - 0.045543249ms
AddEdge - Optimized C++ Version - 0.036311321ms
AddEdge - Optimized Asm Last Version - 0.029943426ms

No comments

Учитесь программить и МАТЕМАТИКУ (особенно методы программирования и мат. оптимизации)
Ламаки.....

Любая функция в 3Д cos, sin...... разлагается в ряд.... Который потом можно оптимайзить

Самый простой пример:

Возведение в квадрат.... представляем в виде суммы ряда нечетных чисел.... С ССЕ или 3Днау на малых значениях аргумента прирост 150-200%....

Потом такие дятлы как вы софт пишут...... Который ни смотря на все заточки пашет медленне чем что либо......

З.Ы. Резалты получены на Интеле с ССЕ.

На АМД с его более мощным FPU прирост от юзания ПРАВИЛЬНОГО КОДА на некоторых функциях может достигать 300-400% В сумме по проге прирост 10-200% в зависимости от сложности......

Простой пример более сложной оптимизации про квадраты:

"А" в квадрате равно
1+3+5+7+9+....+ всего А чисел
т.о.
5 в квадрате = 25 = 1 + 3 + 5 + 7 + 9

в двоичном счислении

1 + 11 + 101 + 111 + 1001

Обединяя по парно

1 + 11 = бинарный сдвиг старшего разряда влево = результат 100

.
.
.
.
.

Итог 101 в квадрате = 11001
Проведя аналогию можно написать Афуенно быстрый алгоритм......
Добавлено спустя 31 минуту, 54 секунды

Root писал(а):

Что толку точить дирек если дрова и проги не юзают 3DNow.......

Основной выйгрыш в 3Д движках которым нужны нормально написанные быстрые функции.....

Kireev_A

Добавлено: 17.01.2006 21:40

[профиль]

Member
Статус: Не в сети
Регистрация: 10.05.2005
Откуда: Нижний Новгород

Andreika ништяк, так бы сразу!;)

Andreika писал(а):

Ламаки.....

полегче на поворотах

Andreika писал(а):

такие дятлы как вы

более легче на поворотах!
Понимаешь, если ты умеешь писать проги с оптимизациями, а люди просят тебя показать как именно, чтобы ты не бросался пустыми словами (имею ввиду без аргументации), это не повод всех называть ламаками и дятлами. А то найдётся мильон людей, которые потом возьмут и опустят тебя по любым другим вопросам, вот и всё.
К тому же я ничего противоречащего тебе не писал, а требовал примера.

Andreika

Добавлено: 17.01.2006 21:56

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

Kireev_A писал(а):

полегче на поворотах
Andreika писал(а):
такие дятлы как вы

более легче на поворотах!
Понимаешь, если ты умеешь писать проги с оптимизациями, а люди просят тебя показать как именно, чтобы ты не бросался пустыми словами (имею ввиду без аргументации), это не повод всех называть ламаками и дятлами. А то найдётся мильон людей, которые потом возьмут и опустят тебя по любым другим вопросам, вот и всё.
К тому же я ничего противоречащего тебе не писал, а требовал примера.

Ты нет но

Bozz Bishop писал(а):

Andreika, не выпендривайся. Уже то, что ты так говоришь про 3днау говорит только о твоей ламерозности.
ЗЫ Давай сырцы, пустобрех.

amdfan писал(а):

Слушай Andreika я как смотрю ты у нас крутой программер, и знаешь всё не Andreika писал(а):
только по прочитанным статьям
. Советую расслабится
твои слова "У АМД только один козырь - 3Д НАУ. Кто проги писал меня поймет...... ИМХО без 3Д НАУ АМД какал бы интелу тока ф путь...... " уже прекрасно проинформировали нас о том какой ты есть программер.

А после этого я вообще разговаривать не хочу...... ДЯТЛЫ.... Обидно когда нули в программухе пытаются сравнивать архитектуры.....

ВОПРОС К ВАМ ГУРУ:
Какой размер кэша предсказаний ветвлений оптимален для существующих процов и чтобы точность была >90%????
Слабо???

Andreika

Добавлено: 17.01.2006 22:14

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

Kireev_A In KB?
Добавлено спустя 37 секунд
И для какова метода?

Kireev_A

Добавлено: 18.01.2006 0:01

[профиль]

Member
Статус: Не в сети
Регистрация: 10.05.2005
Откуда: Нижний Новгород

Andreika а вот это уже не знаю... Факт того, что эта таблица была использована на атлонах (первых)...

Andreika

Добавлено: 18.01.2006 0:13

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

Kireev_A На самом деле по резалтам тестов IBM ната около 128К на кэш предсказаний. Точно алгоритм не помню но он прогрессивный циклический(цепочкой), т.е. несколько ветвлений вперед если на них статистика уже есть.

На первом ветвлении до 92% + просчитываются при необходимости остальные, если на них статистика уже есть.
Более 128К неэффективно т.к. 16к->128к процентная кривая растет от 65% практически линейно, а дальше спад......

Вот почему у П4 такая низкая эффективность по предсказанию ветвления.....
Да и у АМД дела не лучше

А вот RISC или какой нить СуперКопутерный проц имеет минимум 64К на енто дело, и как правило несколько алгоритмов....

Макс выйгрыш получается во всеми нами любимых циклах for,while

А многие "ГУРУ" думают что в if.....

У меня к ним послание
CD& ~! BSD
Кто прошареный тот поймет......

TheJudge

Добавлено: 18.01.2006 0:28

[профиль]

*Cofradia Intel*
Статус: Не в сети
Регистрация: 25.05.2004
Откуда: Саров

Andreika

Беда NetBurst не в том, что у них низкая эффективность предсказания ветвлений, а в том, что очень велика цена этой ошибки. Ведь очищать длинный конвейер дольше чем короткий. Поэтому одним из основных способов повышения производительности является улучшение предсказания ветвлений. И даже не так всё плачевно было бы, если не replay. К счастью в Conroe 1) Сильно улучшат алгоритм предсказания ветвлений 2) Уберут нафик Trace кэш, который также очень дорого обходиться в плане промаха 3) Вернут разноску кэшей как у Р6, т.е. одинаковые по размерам D и I кэши 4) Уберут Replay.

Таже просьба понять, что Conroe будет не просто доделкой Пентака М.

Andreika

Добавлено: 18.01.2006 0:34

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

TheJudge АБСАЛЮТНА САГЛАСЕН.... Я даже разработал афуенный алгоритм для П4, но на IDF не захотели..... Ну что ж они сами отказались от 99% точности

я не виноват.

Bozz Bishop

Добавлено: 18.01.2006 0:35

[профиль]

Member
Статус: Не в сети
Регистрация: 06.09.2005
Откуда: Москва

Andreika, не <удалено>, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.

ЖК на месяц. Учимся нормально разговаривать!
Отредактировано модератором: Shurik Dribenetc. Дата: 01.18.2006 3:00

Andreika

Добавлено: 18.01.2006 0:41

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

Bozz Bishop CD& ~! BSD !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

Давай 2*2 матрицы погоняем....

Bozz Bishop

Добавлено: 18.01.2006 0:43

[профиль]

Member
Статус: Не в сети
Регистрация: 06.09.2005
Откуда: Москва

Чтойта?
Добавлено спустя 38 секунд
Давай лучше 2000x2000.

Andreika

Добавлено: 18.01.2006 0:51

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 26.11.2004
Откуда: Минск Беларусь
Фото: 29

Bozz Bishop Чё саскакиваем???

Bozz Bishop писал(а):

Andreika, не выёбывайся, могу закинуть тебе пример перемножения матриц произвольного порядка, который работает в 13-15 раз быстрее чем запрограммированный по обычной формуле. Так там П4 2400 сливает axp 2500 и никакой ссе2 помочь не может.

Давай посмотрим как твоя прога будет в 13 раз быстрее матрицы 2*2 перемножать....
А потом разберемся кто здесь

Bozz Bishop писал(а):

ВЫЁБЫВАЕТСЯ

Bozz Bishop писал(а):

пустобрех

.....

Ещё раз для повторяю

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! CD& ~! BSD !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

ЖК на две недели. Учимся уважать оппонента.
Пост сам поправишь?
Отредактировано модератором: Shurik Dribenetc. Дата: 01.18.2006 3:47

Последний раз редактировалось Andreika 18.01.2006 14:35, всего редактировалось 1 раз.

Новая тема /

Ответить

Сообщений: 411 • Страница 19 из 21 • < 1 ... 16 17 18 19 20 21 >

Список форумов » Разговоры обо всем » Флейм

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: Hump и гости: 51

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти: