Member
Статус: Не в сети Регистрация: 24.03.2005 Откуда: Самара
Dron`t samum писал(а): Небыло ни одного случая подмачивания репутации у АМД до модели К5 это был аналог Intel
Цитата:
вот теперь скажи это в глаза (как говорит Серж)... ну ты понял кому раньше-то как раз Атлоны и дымились, и грелись. он сам, да и "знакомый один раз купили AMD, но потом пожалели". что ж, не убедишь
Я всегда говорил в глаза! тем кто жаловался на то что Атлоны грелись и горели, что экономить на процессоре который стоит дешевле Интела глупо, т.к. он, от того что дешевле не перестал быть полноправным процессором. Ведь никто из предпочитателей Интела не отказывается от современных Прескотов изза их сильного разогрева, просто покупают качественный куллер или производители в бокс вкладывают. Поэтому как говориться "нечего на зеркало пенять коли рожа крива", перегрев и дымление это ошибки сборщиков и жадных пользователей которые если покупали подешевле то и на куллере экономили (чтото не припоминаю проблем с боксовыми версиями Атлонов), но никак не разработчиков процессора которые прекрасно знали характеристики свего детища. Хотя на памяти есть упоминания не слишком удачных боксовых куллеров, но до задымления и сгорания они не доводили. Мой разогнанный дурик тех времен служил верой и правдой около 4 лет пока мать не убил БП, а вероятно живой проц не убили в другой битой матери, так чтож мне теперь утвердать что проц плохой? И у Интел в свое время небыло защиты от перегрева, и он мог теоретически сгореть при остановке куллера, но этот косят никто не упоминает.
_________________ На ваше мастерство мы ответим непредсказуемой глупостью. (Ответ асам на форуме FH) Летайте самолетами FH!
Как узнать, будет ли работать ваша программа быстрее на AMD или Intel? Запустите тест SiSoft Sandra. Он хоть и относительно, но все же показывает разницу в производительности.
В Битва ветеранов (обновлено, ноябрь2005) комрад vk6666 предложил в качестве бенча AtomicCPU и CPU MathMark.
Если почитать хэлп к первой программе, то станет понятно, что она выполняет некие физические расчёты. Поэтому в качестве предварительной оценки производительности процессоров на поставленных задачах лучше использовать именно AtomicCPU.
Mathmark можно использовать для более тонкого прогнозирования производительности.
#77
Программа выводит скорости сложения, вычитания, умножения и деления. Также считает число ПИ, как я думаю, через ряды.
Так вот, как раньше делали, но видимо потом разучились!?
Берётся алгоритм, считается количество сложений, вычитаний, умножений и делений затрачиваемые на реализацию алгоритма. Затем прикидывают сколько тактов процессора на что тратится. Если железо уже есть, то оптимизируют под него алгоритм. Если его - нет, то выбирают по полученным данным(и все равно потом оптимизируют).
А SiSoft Sandra считает непонятно что, и я уже сто раз говорил, что даже в описании к Сандре написано результаты полученные разными версиями могут отличаться!
Default member
Статус: Не в сети Регистрация: 23.06.2004 Откуда: Россия, г. Орёл
Dron`t , не кипятись. Я сегодня подобную системку собрал(навеяно тобой кстати), нормально, быстро шуршит. Игры там не тестил, ибо встроенное видео х200, но вот копи копирование, архивация, видео, офисные пакеты, одинеска-все очень быстро и целофаново.
Advanced member
Статус: Не в сети Регистрация: 23.12.2003 Откуда: Гатчина, ленобл
banifatich писал(а):
я уже сто раз говорил, что даже в описании к Сандре написано результаты полученные разными версиями могут отличаться!
так считайте одной: 2004SP2 или 2005SP3 Добавлено спустя 10 минут, 43 секунды banifatich щас качаю atomic cpu (http://softsearch.ru/programs/105-209-atomic-cpu-test-download.shtml) он вроде не такой большой прогу надеюсь скоро выложить (это ведь диалап напрягать надо) Добавлено спустя 1 минуту, 59 секунд
sErgillo писал(а):
Игры там не тестил, ибо встроенное видео х200, но вот копи копирование, архивация, видео, офисные пакеты, одинеска-все очень быстро и целофаново
это сарказм что ли? =) и что будешь делать с ней? Добавлено спустя 11 минут, 4 секунды
samum писал(а):
И у Интел в свое время небыло защиты от перегрева, и он мог теоретически сгореть при остановке куллера, но этот косят никто не упоминает.
Member
Статус: Не в сети Регистрация: 31.03.2005 Откуда: То там, то сям.
Dron`t писал(а):
кстати та программа тоже фигня, сравнивает по голому ССЕ (имеется в виду Atomic CPU)
Ну нихрена, заява! Я же говорил:
banifatich писал(а):
Если почитать хэлп к первой программе, то станет понятно, что она выполняет некие физические расчёты.
В каталоге программы не пробовал файл ACT.chm открыть!? Там русским по белому написано: При создании Atomic Cpu Test это учитывалось, и было принято решение, что надо усреднить наборы используемых инструкций и добавить решение каких-то конкретных задач. Был произведен статистический расчет количества конкретных операций дизассемблированием (фактически получение исходного кода) очень большого количества программ, начиная от игр и заканчивая математическими пакетами. После усреднения результатов, которое явилось «золотой» серединой набора операций для необходимых вычислений и нахождения именно той «скорости» вычислений – то есть пользователь будет знать, что у него и Photoshop будет нормально работать и игры не будут «тормозить» - были разработаны тесты.
Тест процессора. Естественно, при тестировании процессора надо использовать весь набор арифметических операций: not, *, div, mod, and, shl, shr, +, -, or, xor, =, <>, <, >, <=, >=, ror, rol; Но простым их «прогоном» дело не ограничилось, ведь программа показывает реальную скорость вычислений. Большой акцент был сделан на тестировании блока предсказаний процессора: суть заключалось в подаче процессору большого количества команд, за исключением некоторых, а потом загрузка неиспользуемой команды, а также комбинации с подобной методикой - весьма интересные результаты, так процессор, "привыкнув" к исполнению определенного набора, начинает долго думать над исполнением тех команд, которые не использовались, вопрос лишь в том, как быстро процессор "он подумает". Также в тесте процессора обсчитывались ханойские башни, рассчитывались определители, и производилось нахождения совершенных чисел.
Тест сопроцессора. Кроме всех операций с плавающей запятой, тестировалась скорость нахождения таких функций как Sin, Cos, Tn, Exp, Ln, Sqrt, Sqrt, без которых просто немыслим расчет физических явлений. Также внутри теста пробегала и одна реальная задача: расчет полета тела с учетом сопротивления воздуха.
Тест кэш/память. Сортировка 4 мегабайтных 32-х и 64-х битных массивов.
И, кстати:
Dron`t писал(а):
еще раз говорю, в науке не только все только и делают, что числа пи высчитывают
учёный-двоечник, млин! Число Пи считается как ряд:
pi/4=1 - 1/3 + 1/5 - 1/7 +...+ ((-1)^(n-1))/(2n-1) +... ; как видишь тут и сложение, и вычитание, и умножение, и деление участвует. Причём по затратам ресурсов на разные операции формула очень сбалансированная.
Ещё пример, пжалста:
e=1 + 1/1! + 1/2! + 1/3! +...+ 1/n! +... ; Косинусы и синусы писать или так успокоишься? Линейные уравнения, кстати, решаются матричными алгоритмами. А это тоже - елемент строки умножить на елемент столбца и т.д.
З.Ы. Чёто я не пойму. Тут кто-то в учёных играет, да? Ребят, мне прям стыдно даже с моими двумя высшими и диссертацией себя учёным называть, а Вы такие разговоры чинИте. Всем учить матчасть.
Member
Статус: Не в сети Регистрация: 31.03.2005 Откуда: То там, то сям.
Dron`t писал(а):
вообще-то не я программу писал, я только комп выбирал Smile
Ну так кто учёный, ты или нет? Я уже спрашивал:
banifatich писал(а):
Dron`t если ты проги свои с оптимизацией компилишь, я так понимаю ты азы решений своих задач знаешь. Может попробуешь сделать реализацию на MathCAD или нахудой конец в Excel, а потом потестить процессоры.
Ну и...? Ладно, если сам сомневаешься в себе, позови отца, пускай он почитает. Может чего интересное(конструктивное) в ветке назреет.
Про Mathmark что скажешь? По-моему, для предварительной оценки производительности процессора на какой-либо арифметической задаче самое то . Отцу обязательно покажи, только аккуратно (вдруг, он расстроится насчёт Intel Celeron D).
Member
Статус: Не в сети Регистрация: 21.06.2004 Откуда: Санкт-Петербург
Чтобы треп не был беспредметным, предлагаю спорящим по поводу рулезности архитектуры P4 vs Athlon в математике и оптимизации под P4 почитать http://www.emulators.com/docs/pentium_1.htm. Длинное, но крайне полезное и достаточно интересное чтиво. И уж не знакомым с этой информацией и рассуждающих что-то про скорость P4 в математике предлагаю помолчать или поговорить о другом.
Member
Статус: Не в сети Регистрация: 31.03.2005 Откуда: То там, то сям.
Mosga писал(а):
Чтобы треп не был беспредметным, предлагаю спорящим по поводу рулезности архитектуры P4 vs Athlon
А причём тут это? Ветка называется Комп для ученого: обзор и выбор платформы, и никаких vs. Только конструктивные предложения. Что-то лучше для одних задач, что-то для других. Пробуем чем определить лучшесть на реальных задачах. И что на реальных задачах лучше(по-моему Athlon уже лучше:)).
Сама дока, однозначно, разжигание межклановой розни. Полезна она для программистов, а не учёных-прикладников. А потом это и так все знают. Покрайней мере те, кто сюда зашёл, обязаны это знать.
Особенно понравилась таблица с ценами. Athlon всего-лишь Thunderbird, а P4 всего-лишь Williamate
Member
Статус: Не в сети Регистрация: 21.06.2004 Откуда: Санкт-Петербург
banifatich писал(а):
Сама дока, однозначно, разжигание межклановой розни.
Да ну? Очевидно, что ты читал невнимательно. Более объективный материал найти сложно.
banifatich писал(а):
А потом это и так все знают. Покрайней мере те, кто сюда зашёл, обязаны это знать.
Начинающие - точно не знают. Да и я в таком объеме не знал. Там даются совершенно четкие ответы на вопросы "почему архитектура PIII в итоге оказалась лучше P4", "зачем тогда делали P4", "почему P4 без изменения архитектуры стал быстрее атлона в мультимедии, хотя вначале сильно сливал" и "почему оптимизация под P1 может дать худший результат на P4, чем оптимизация для 386, и в чем разница для атлона".
banifatich писал(а):
Athlon всего-лишь Thunderbird, а P4 всего-лишь Williamate
Member
Статус: Не в сети Регистрация: 31.03.2005 Откуда: То там, то сям.
banifatich писал(а):
Сама дока, однозначно, разжигание межклановой розни.
Mosga писал(а):
Да ну? Очевидно, что ты читал невнимательно.
Ну да!
Цитата:
Pentium 4 - Generation 7 or complete stupidity?
Хороший заголовок, сразу навевает мысли от том, что P4 - complete stupidity. А это:
Цитата:
WHY THE PENTIUM 4 SUCKS
ничего личного, да? Просто так вырвалось. Так что статья написана предвзято, как ни крути.
Mosga писал(а):
Начинающие - точно не знают. Да и я в таком объеме не знал.
Тогда назовите ветку не Комп для ученого: обзор и выбор платформы, а Комп для того кто думает, что он - ученый.
Mosga писал(а):
"зачем тогда делали P4"
Особенно понятно "зачем" по таблице с ценами
Mosga писал(а):
Ты только первую страницу читал?
Да, нет. И остальную байду тоже.
Цитата:
Future outlook: GOOD!
просто добило. Купи Athlon XP сейчас и будет тебе счастье.
Mosga писал(а):
"почему оптимизация под P1 может дать худший результат на P4, чем оптимизация для 386, и в чем разница для атлона"
Кто-нибудь щас делает оптимизацию под i386 или хотя бы под Pentium MMX?
З.Ы. Повторюсь пожалуй, полезна дока для программистов, а не учёных-прикладников. Ключевое слово "учёные-прикладники". И посмотри выше по ветке, я давал ссылки на IXBT, где проводили реальные тесты рабочих станций на научных задачах.
Member
Статус: Не в сети Регистрация: 21.06.2004 Откуда: Санкт-Петербург
banifatich писал(а):
Кто-нибудь щас делает оптимизацию под i386 или хотя бы под Pentium MMX?
Может тебя это и удивит, но делают. А собственно, подо что делать, если нет информации о том, где программа будет запускаться? Это игры могут требовать железо под себя, а остальным программам нужно подстраиваться под железо. Практически все программы сейчас заработают и на P1. Нет, верю что есть какие-нибудь хитрые научные проги, которые без sse даже запускаться не будут, это где-то оправдано...
Обычно используется оптимизация под i686. Близка к ней по эффективности оптимизация под i386. Под i586 - плохо. Но вопрос, конечно, не в этом. Это просто к слову пришлось.
Member
Статус: Не в сети Регистрация: 31.03.2005 Откуда: То там, то сям.
Mosga писал(а):
Может тебя это и удивит, но делают. А собственно, подо что делать, если нет информации о том, где программа будет запускаться?
Mosga писал(а):
...которые без sse даже запускаться не будут, это где-то оправдано...
Mosga писал(а):
Обычно используется оптимизация под i686.
Под i686 нисколько не удивит. i686 стала уже классической архитектурой, а под i586 с его слабоватым FPU научные задачи не оптимизируют. Что бы Вы знали, под i386 и i586 компилируют только операционки и то не все(например, Mandrake 10.0 идет как минимум на i586, а Шлака на - i386). SSE - это довесок к кривому сопроцессору, поэтому люди понимающие, что нормальных процессоров больше, под SSE не оптимизируют. А кто-нибудь щас делает оптимизацию своих программ под i386 или хотя бы под Pentium MMX? Добавлено спустя 2 минуты, 50 секунд Представляю, сидит какой-нибудь бедный учёный в бывшем советском ящике, где-нибудь в Дубне на стареньком i486 или Pentium, и молит руководство, чтобы программное обеспечение покупали оптимизированное под него. Добавлено спустя 25 минут, 15 секунд
Mosga писал(а):
Обычно используется оптимизация под i686. Близка к ней по эффективности оптимизация под i386. Под i586 - плохо.
Это ты хочешь сказать, что i386(без конвейера который) работает почти как i686!? А i586 не может выполнять больше одной команды за такт и загружать операнды в регистры заранее, до выполнения над ними операций!? Что "плохо"? Опции оптимизации компиляции посмотри:
For CPU i686 or PentiumPro, Pentium II, Pentium III: CFLAGS='-O9 -mcpu=pentiumpro -march=pentiumpro -funroll-loops -ffast-math -malign-double -fomit-frame-pointer -fno-exceptions'
For CPU i586 or Pentium: CFLAGS='-O3 -mcpu=pentium -march=pentium -funroll-loops -ffast-math -fforce-mem -fforce-addr -malign-double -fomit-frame-pointer -fno-exceptions'
For CPU i486: CFLAGS='-O3 -mcpu=i486 -march=i486 -funroll-all-loops -malign-double -fomit-frame-pointer -fno-exceptions'
звято из Securing-Optimizing-Linux-RH-Edition.
Ну, как тебе i586 хотябы по сравнению с i486?
Member
Статус: Не в сети Регистрация: 21.06.2004 Откуда: Санкт-Петербург
banifatich писал(а):
Что бы Вы знали, под i386 и i586 компилируют только операционки и то не все
Однако мультимедия и математические библиотеки в этих операционках тоже собираются под эти процессоры. Под i686 - один-два пакета.
banifatich писал(а):
А кто-нибудь щас делает оптимизацию своих программ под i386 или хотя бы под Pentium MMX?
Да по-моему почти никто не делает, все включают опции оптимизатора в компиляции Ручная оптимизация - использование тех же sse или mmx2, если есть возможность и смысл, кое-кто делает..
banifatich писал(а):
Это ты хочешь сказать, что i386(без конвейера который) работает почти как i686!? А i586 не может выполнять больше одной команды за такт и загружать операнды в регистры заранее, до выполнения над ними операций!?
Нет, это я хочу сказать что в том же gcc (раз уж поднял тему) -mtune=i586 даст худший результат на p4, чем -mtune=i386, а последний будет довольно близок к -mtune=i686.
banifatich писал(а):
For CPU i686 or PentiumPro, Pentium II, Pentium III: CFLAGS='-O9 -mcpu=pentiumpro -march=pentiumpro -funroll-loops -ffast-math -malign-double -fomit-frame-pointer -fno-exceptions'
For CPU i586 or Pentium: CFLAGS='-O3 -mcpu=pentium -march=pentium -funroll-loops -ffast-math -fforce-mem -fforce-addr -malign-double -fomit-frame-pointer -fno-exceptions'
For CPU i486: CFLAGS='-O3 -mcpu=i486 -march=i486 -funroll-all-loops -malign-double -fomit-frame-pointer -fno-exceptions'
Ну давай посмотрим. Итак - O9 это бред, отличий от O3 нет, а -ffast-math вообще стремная опция, и может приводить к некорректному коду - я такое встречал. -funroll-loops и тем более -funroll-all-loops увеличивают размер кода и далеко не всегда делают его быстрее. Итого, по сути остается включение -march и -mcpu (-mtune) в соответствии с процессором. Если бы руководство было поновее, наверняка бы указывалось не только pentiumpro, а и pentium2 и pentium3 в соответствующих случаях - впрочем, разница была бы минимальная. Ну и что в этом всем такого? Ну да, правильно, раз компилируем код под процессор, выбираем этот процессор. Если проблема, что код под PII после такой сборки не запустится под P1, не волнует, в чем вообще вопрос?
А вот вопрос "как собирать, чтобы запустилось и там, и там, и по возможности была правильная универсальная оптимизация" - уже другое дело. И хороших вариантов тут нет. Если собирать под i586, будет хорошо на нем и плохо на i686 и p4. Если под p4 (-march=pentium4 или prescott), хуже будет на атлоне. Если под i686, атлону и p3 будет хорошо, а для p4 не лучший вариант.
Member
Статус: Не в сети Регистрация: 31.03.2005 Откуда: То там, то сям.
Mosga писал(а):
Однако мультимедия и математические библиотеки в этих операционках тоже собираются под эти процессоры. Под i686 - один-два пакета.
Яволь, полностью согласен. Но с мультимедия и так всё понятно, при вкл. MMX, 3DNow! или SSE - MPEG4 гораздо лучше проигрывается на старом железе, а без них вообще никак не проигрывается(ну нельзя эту порнографию назвать воспроизведением). А вот какие математические библиотеки кроме функций необходимых для работы ОС там собираются я не представляю, ибо все специализированные мат. библы собираются из исходников и под конкретное железо. Только это и значит моя фраза:
Цитата:
Представляю, сидит какой-нибудь бедный учёный в бывшем советском ящике, где-нибудь в Дубне на стареньком i486 или Pentium, и молит руководство, чтобы программное обеспечение покупали оптимизированное под него.
Далее..
Mosga писал(а):
Итак - O9 это бред, отличий от O3 нет
Бред не бред, а как опция оптимизации существует. Другое дело, что прироста производительности от такой оптимизации может не быть, а если он(прирост производительности) и будет, то в несколько процентов. Может эти проценты кому и пригодятся, хотя я в -O9 тоже не верю, но ведь это цитата была.
Mosga писал(а):
-funroll-loops и тем более -funroll-all-loops увеличивают размер кода и далеко не всегда делают его быстрее.
Про увеличение размера кода и, соответственно, требованиям к оперативе в описании GCC написано. А вот то, что далеко не всегда делают его быстрее, точно БРЕД. Как это развёртывание цикла(с известным количеством иттераций) на этапе компиляции
может не дать прироста производительности? А именно циклы с известным количеством иттераций и подлежат оптимизации(в Securing-Optimizing-Linux-RH-Edition так и написано). Ведь в этом случае исключаются переходы к началу цикла по счётчику, то есть из цикла получаем линейный код, где просто выполняются, нужное количество раз, однообразные действия над данными. Примеров очень много:
Матрицы афинного преобразования(размерностью 2x2 для задачи на плоскости, и 3x3 для пространственной задачи)
Те же видеокарты. Оптимизация шейдеров во время исполнения, про которую хвастается nVidia, тоже самое развёртывание циклов.
надеюсь убедил!?
А вот давайте разберём ещё такие опции: -fforce-mem -fforce-addr. Вы о них почему-то забыли.
И так, каждому порядочному могиканину известно, что i386 последний процессор Intel с чито CISK архитектурой. В i486(хотя его считают тоже CISK-процессором) уже был конвейер, который является атрибутом RISK архитектуры. Поэтому i386 мог выполнять только одну комманду за такт. К чему я клоню? А к тому, что прежде чем выполнить над данными какое-либо действие, эти данные необходимо загрузить в регистры. Загрузка данных - это такая же операция как и все остальные(мало того над адресами выполняются такие же арифметические действия как и над данными). Так, вот i386 за один такт загрузит из памяти операнд в регистр(например, EAX), за следующий такт загрузит другой операнд в другой регистр(например, EBX), а за следующий такт он сложит содержимое регистров(add EAX,EBX) и оставит результат в регистре EAX. А опции -fforce-mem -fforce-addr позволяют заранее(если не нагружено соответствующее исполнительное устройство), до того как понадобятся операнды загрузить их в регистры.
Если учесть, что i586 имеет уже два конвейера исполнительных устройств, то я не представляю - как оптимизация под равномерное иполнение x86 CISK-кода будет работать лучше на RISK процессоре(P4 как ни крути, а уже RISK - потому что работает не с x86 инструкциями, а со своими mOP), чем оптимизация с предвыборками.
З.Ы. Слышал много раз от "ушлых программистов", как они круто заюзали -O60, и всё у них залетало. :lol::lol:
Mosga А вообще мне понравилось с тобой общаться, интересно, блин! Mosga а хочешь я тебе Securing-Optimizing-Linux-RH-Edition перешлю, у меня ещё есть Securing-Optimizing-Linux-The-Ultimate-Solution-v2.0, тоже в PDF. И вобще много всякого чтива по линуху.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения