Member
Статус: Не в сети Регистрация: 21.10.2007 Откуда: Питер, Купчино
В этой теме обсуждаем всё, что связано с выбором компьютерных комплектующих для участия в проектах Folding@Home, Rosetta@Home и других поддерживаемых проектов распределённых вычислений
Процессоры Процессоры актуальны для проекта Rosetta@Home, желательно многоядерные от 4х ядер и выше, для проекта Folding@Home - видеокарты
Видеокарты nVidia RTX3070 и новее
AMD (ATI) AMD RX5600 и новее (в фолдинге не актуальны на данный момент, рекомендуется использовать в БОИНК проектах)
Ссылки: Оценить производительность видеокарт на реальных заданиях можно по таблице:
TSC! Russia member
Статус: Не в сети Регистрация: 24.07.2004 Откуда: Yaroslavl Фото: 32
Mad'Max насколько помню смысл "оптимизаций" это улучшены предсказатель ветвлений и планировщик - возможно специфика самих подсчетов такова что от этого пользы нету, требуеться как любят говорить пиндосы "грубая мощь" и все...
Добавлено спустя 5 минут 5 секунд: а может просто вещественночисленное деление часто вылазит и теряются данные для 2 ядер уже.. Ты же инглиш знаешь - попробуй у них на форуме спросить
Добавлено спустя 10 минут 50 секунд: или в порядке догадки - вдруг один из проектов при например получении бесконечной дроби останавливается и немного откатываеться назад чтобы ее избежать, а второй просто округляет до определенного знака и продолжает считать как ни в чем небывало...
_________________ Бег – искусство оставаться на месте
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
sco01 Это да, так и есть. Где-то +10% или даже +15% на той же частоте. Но где-то и около 0% прибавка, так что тут от конкретного приложения определенно зависит. Но чистой мощи (в виде частоты) тоже ведь прибавили: +400 мгц (FX-8350 vs FX-8150) В общем непонятно совсем, что же именно процу в ФАХ коде так не нравится (ну или наоборот).
Нашел кстати в логах, где ядро определяет поддержку SSE перед использованием Типа такого:
Цитата:
Configuring nonbonded kernels... Configuring standard C nonbonded kernels... Testing ia32 SSE2 support... present.
Это из лога A4 ядра (FahCore_a4.exe), который в файлах типа \work\00\wudata_01.log складывается.
Кстати, у кого современные Intel процы посмотрите - оно что-нибудь выше SSE2 хочет/умеет использовать? Ну или может кто официальную информацию читал от докторов - SSE2 это пока максимум под что оптимизация кода делалась?
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Mad'Max писал(а):
Кстати, у кого современные Intel процы посмотрите - оно что-нибудь выше SSE2 хочет/умеет использовать? Ну или может кто официальную информацию читал от докторов - SSE2 это пока максимум под что оптимизация кода делалась?
Уже не актуально. Как говорится сам спросил - сам ответил. Пока в логе копался заметил строчку указывающую на то, на базе какой версии GROMACS текущее ядро F@H сделано:
Код:
:-) VERSION 4.5.3 (-:
Ну а дальше нашел сайт самого GROMACS и его описание(http://www.gromacs.org/). В общем в 4.5.3 (а соответственно и в A3 и A4 SMP ядрах F@H которые из него собраны) есть оптимизация только под SSE/SSE2. Более новые наборы инструкций не поддерживаются(не используются).
Хорошая новость в том, что в разрабатываемом сейчас GROMACS 4.6 будет серьезная поддержка и оптимизация под новое железо - новые наборы инструкций и в том числе под архитектуру Бульдозера отдельно:
Цитата:
New x86 SIMD non-bonded kernels for the usual cut-off scheme, called group scheme and the new verlet scheme, use x86 SIMD intrinsics (no more assembly code): SSE2 SSE4.1 AVX-128-FMA (for AMD Bulldozer/Piledriver) AVX-256 (for Intel Sandy/Ivy Bridge)
Еще из интересного - одновременно будет внедрена поддержка и NV CUDA в Gromacs. Если доктора захотят ее использовать, то получется что-то вроде гибридных ядер, считающих одновременно и на CPU и на GPU (соответствно каждый свою часть, в которой его архитектура больше подходит). Вместо отдельных процессорных SMP и видяшных OPENMM
Плохая новость - будет это скорее всего еще не скоро. Самая первая бета-версия GROMACS 4.6 вышла только в конце ноября 2012. Пока они еще свои баги отладят, пока доктора надумают новый пакет опробовать, когда/если результат им понравится сделаю на его основе свое ядро и запустят его уже в свой цикл бета-тестирования...
Добавлено спустя 12 минут 11 секунд: Еще из интересного, что обнаружил в процессе. Не знаю, может "ветераны" F@H и давно в курсе, но для меня это было новостью: оказывается между ядрами A3 и A4 похоже вообще нет никакой разницы. Мало того, что они оба сделаны из одного и того же GROMACS 4.5.3, так что "движок" моделирования у них точно одинаковый. Так и размеры файлов ядер (по крайней мере версии для Windows x86) совпадают с точностью до байта - 10 057 216 байт оба (Файлы FahCore_a3.exe и FahCore_a4.exe) Правда контрольные суммы различаются, так что для интереса запустил бинарное сравнение этих файлов - отличия между ними всего 19 байт. И в нескольких местах, где я смог разобрать код - это была простая замена строк указывающих версию/наименование ядра.
Не понимаю тогда, зачем доктора этот цирк с двумя как бы разными (а на деле одинаковыми) ядрами устраивали. Бонусы там еще дополнительные вводили, чтобы люди с 1 ядра на другое активней переходили.
Не понимаю тогда, зачем доктора этот цирк с двумя как бы разными (а на деле одинаковыми) ядрами устраивали. Бонусы там еще дополнительные вводили, чтобы люди с 1 ядра на другое активней переходили.
Перетаскивали народ на 7 клиент. Ибо он в целом проще в настройке, но всё ещё недостаточно прост для common people, которым желательно чтобы было "просто нажал на кнопку и ушёл гулять".
Mad'Max писал(а):
Хорошая новость в том, что в разрабатываемом сейчас GROMACS 4.6 будет серьезная поддержка и оптимизация под новое железо - новые наборы инструкций и в том числе под архитектуру Бульдозера отдельно. Еще из интересного - одновременно будет внедрена поддержка и NV CUDA в Gromacs. Если доктора захотят ее использовать, то получется что-то вроде гибридных ядер, считающих одновременно и на CPU и на GPU (соответствно каждый свою часть, в которой его архитектура больше подходит). Вместо отдельных процессорных SMP и видяшных OPENMM
Тут имею 2 мысли неглубоких, насчёт GROMACS 4.6:
Мысль №1: Оптимизация под Sandy/Ivy/Bulldozer кмк сильно полегче, чем гибридное ядро под CUDA-Gromacs, следовательно, должна появиться раньше. Причём, некоторые отдельные инструкции из AVX в разы быстрее их аналогов в более ранних CPU, так что, кмк, сейчас не стоит закладываться на новые дорогие 2-4 CPU конфигурации без поддержки AVX. Ибо после оптимизации может оказаться, что оптимизированное под Sandy/Ivy расчётное ядро на одном 4.5-4.7 ГГц СPU выдаст на обычных заданиях почти столько же, сколько не оптимизированное на не сильно гнатом/негнатом 2 CPU конфиге, единственным преимуществом которого останутся bigadv задания. Даже сейчас на 12-ти поточном Xeon 3.85 ГГц еле-еле отрываюсь от 4.6-4.7 ГГц 8-ми поточного Sandy всего на 3-5к PPD на одинаковых заданиях и условиях, а c AVX они вообще закопаютъ всё, что без AVX. Насчёт AMD процессоров никаких мыслей не имею, не курил эту тему.
Мысль №2: После обновления статистики проекта на сайте Стэнфорда по количеству задействованных CPU/GPU и их суммарных петафлопсов вырисовывается интересная картинка, что средний по больнице гигафлопс на 1 GPU для ATI и NV примерно одинаков, но PPD для ATI ниже в разы. Стоит ввести одинаковый "справедливый" PPD для ATI и NV - народ дружно скинет подавляющую часть NV, пересядет на ATI и начнёт суетливо бегать между фолдингом и всякими непотребствами вроде MilkyWay и биткойна. Надеюсь, что в Стэнфорде хорошо понимают, что в таком случае фолдинг окажется на грани песца.
Суммируя мысли №1 и №2, легко прийти к выводу, что наиболее правильной была бы одновременная поддержка новых CPU инструкций и CUDA-Gromacs в новом гибридном ядре CPU-GPU, для того, чтобы отсутствие поддержки новых инструкций в не самых свежих CPU можно было компенсировать более мощными NV GPU.
TSC! Russia member
Статус: Не в сети Регистрация: 13.04.2008 Откуда: Смоленск
Jeepster, мысль №2 не понял. Кто хочет считать фолдинг - будет считать фолдинг, кто хочет считать "непотребства", тот будет их считать и на невидии или сменит видик на радеон в любом случае. Так что выравнивание по очкам радеонов и жерафов тут ни к чему не приведет.
_________________ «Ты можешь рассчитывать на человечество, они всегда сведут все к наименьшему знаменателю и насрут на все сверху!» Lemmy Kilmister
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Jeepster писал(а):
Перетаскивали народ на 7 клиент. Ибо он в целом проще в настройке, но всё ещё недостаточно прост для common people, которым желательно чтобы было "просто нажал на кнопку и ушёл гулять".
Jeepster Ну я же не сравнение клиентов (6 и 7) делал, а SMP ядер между собой. A3 и A4 если конкретно. А они что в 6м клиенте могут считать, что в 7м - скачиваются сами по мере надобности(и для 6го и 7го сами ядра выполняющие непосредственно расчеты они одни и те же). Но привязаны (только вот зачем? с учетом того, что внутри они одинаковые...) к проектам - какие-то считаются на A3 только, какие-то только на A4. И за счет проектов на A4 даже вводили бонусы (всысле дополнительных, кроме обычных за быструю сдачу). Вот новость про это: [F@H] Научные новости проекта #9861695
Там правда написано, что для A4 нужен и клиент минимум версии 6.34. Возможно как раз с целью стимулировать обновление самых древних(я так вообще ничем ниже 6.34 и не пользовался никогда для SMP) клиентов все это только и затевалось...
Добавлено спустя 58 минут 51 секунду:
Jeepster писал(а):
Мысль №1: Оптимизация под Sandy/Ivy/Bulldozer кмк сильно полегче, чем гибридное ядро под CUDA-Gromacs, следовательно, должна появиться раньше.
Скорее всего они появятся одновременно/почти одновременно. Это же я не о планах на будущее писал, а о работе которая уже подходит к концу. Бета версия Gromacs УЖЕ вышла. Т.к. собственно функционал УЖЕ реализован (можно даже скачать, только самостоятельно конечно не получится его в F@H клиент интегрировать). Дальше будут идти в освном разнообразное тестирование и отлов багов. А потом "научное" тестирование - с целью определить не повлияли все эти оптимизации на точность/надежность получаемого результата. И в Gromacs 4.6 работа через CUDA и оптимизация под все новые инструкции процессоров вводятся паралельно: http://www.gromacs.org/About_Gromacs/Re ... ions_4.6.x
Вопрос только сколько это займет времени до практического внедрения. Мое ИМХО, что достаточно много.
Jeepster писал(а):
Насчёт AMD процессоров никаких мыслей не имею, не курил эту тему.
Насчет AVX и AMD. У AMD тоже есть поддержка AVX (начиная с бульдозера - т.е. практически во всех сейчас новых продающихся камнях от AMD). Реализация правда другая, но она есть. И сказано что в сдед. поколении ядер, оптимизация под архитектуру AMD будет. И кстати, если считать все что требует операций с плавающей точкой через AVX, то "полуядра" Бульдозеров ничем не уступают HT потокам Intel: #77 У Intel 256-битный AVX на кажое физическое ядро. (и половинка оного на каждое виртуальное HT ядро, точнее 2 потока конкурирующих за 1 общий блок) У AMD в модуле по 2 128-битных AVX блока (см. картинку). Могущих либо выполнять 2 128бит иструкции за такт либо объединяться и выполнять 1 256-бит инструкцию. Так что в части счета через AVX 8 "ядер" (потоков) Intel i7 и 8 ядер старших бульдозеров (FX-8ххх) на одной частоте должны быть примерно равны (если во впомогательных вещах типа загрузки-выгрузки данных из кэша AMD сильно не налажала)
Что еще интереснее, в новом грамакс-ядре заявляется так же поддержка FMA (Fused Multiply–Add). Кто не знает что это - это иструкции позволяющие проводить 2 наиболее часто используемые в вычислениях операции (умножения и сложения) как 1 операцию за 1 такт. Что позволяет подходящие участки кода ускорить еще почти в 2 раза. И во всех последних AMD процессорах (поколения FX) поддержка FMA есть уже сейчас. У Intel она только запланирована к реализации (начиная с Haswell). Крайне редкий пример, когда AMD что-то вперед Intel реализовала(а не повторяла за Intel с задержкой или изобретала собственную кривую версию известного велосипеда)...
Ну а в купе с поддержкой CUDA в Громаксе и переспективой гибридных ядер, и так же обещанным массовым ввением ГПУ-бонусов после обновления софта (которого надеюсь мы в этом году все-таки дождемся) в F@H будет очень "весело" Можно будет смело забыть/выкинуть все привычные расклады и соотношения по производительности и набора очков, рекомендации к покупке и опримальные конфиграции. И начинать изучать все заново с нуля.
Добавлено спустя 23 минуты 38 секунд:
Jeepster писал(а):
После обновления статистики проекта на сайте Стэнфорда по количеству задействованных CPU/GPU и их суммарных петафлопсов вырисовывается интересная картинка, что средний по больнице гигафлопс на 1 GPU для ATI и NV примерно одинаков, но PPD для ATI ниже в разы. Стоит ввести одинаковый "справедливый" PPD для ATI и NV - народ дружно скинет подавляющую часть NV, пересядет на ATI и начнёт суетливо бегать между фолдингом и всякими непотребствами вроде MilkyWay и биткойна. Надеюсь, что в Стэнфорде хорошо понимают, что в таком случае фолдинг окажется на грани песца.
Ну то, что между ATI и NV разница больше в системе оценки заданий, чем собственно скорости счета оно вполне возможно. Просто "эталон" взят разный, а все очки начисляются относительно него. Это можно кстати проверить если интересно, чтобы выяснить что вносит главный вклад в низкие очки на ATI: плохая оптимизация кода под ATI(и соотвественно низкая скорость счета) или же разные способы оценки начисляемых очков (вообще и то и другое, но не ясно в каких пропорциях)
Взять 2 OPENMM проекта (один для ATI другой для NV карт) с примерно одинаковым размером молекулы белка (число атомов - указывается в параметрах проекта). И сравнить скорость счета не в виртуальных очках, а собственно сколько шагов (итераций) моделирования карта обсчитывает за 1 единицу времени. (число выполненных шагов клиент тоже пишет каждый фрейм). По ATI карточке я данные могу подогнать. Правда на ATI выбор жаб очень ограниченный. Фактически всего 1 модель белка обысчитывается - 627 атомов. Нужно на NV подобрать жабы с максимально близкими размерами белка.
А что насчет того, что если по очкам NV и ATI сравняют и кто-то куда-то побежит... С чего вдруг? Кто хочет считать другие проекты может легко делать это и сейчас - благо это только в F@H ATI считает очень медленно. А вот NV(которых в F@H большинство) в других проектах показывают себе нормально. (из РВ только а Милки плохо, а Биткоин вообще не из нашей оперы РВ). Так что можно ничего не менять и не ждать, а уходить прямо сейчас. Не уходят? Значит хотят считать именно F@H. Если же ATI вдруг по очкам уровняют, так наоборот часть ушедших в другие проекты с ATI картами в F@H придет (т.к. часть уходила не потому, что не хочет, а потому что в текущей ситуации это практически бесполезно). Проблема будет скорее в другом. Если привалит считающих на ATI(как вернувшихся так и кто специально ATI карточки закупать будет), то будет дисбаланс по проектам. Т.к. на AMD сейчас вообще фактически 1 проект и 1 белок считается. И ничего другого сейчас считать на ATI нельзя (ядра не совместимы).
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Mad'Max писал(а):
Взять 2 OPENMM проекта (один для ATI другой для NV карт) с примерно одинаковым размером молекулы белка (число атомов - указывается в параметрах проекта). И сравнить скорость счета не в виртуальных очках, а собственно сколько шагов (итераций) моделирования карта обсчитывает за 1 единицу времени. (число выполненных шагов клиент тоже пишет каждый фрейм).
Ну собственно я сам и сравнил уже почти... По крайней мере почти всю нужную информацию собрал: Среди NV проектов нашелся белок подходящего размера обсчитываемый на OPENMM ядре Проект p7613 - 612 атомов. На ATI считается белок размером 627 атомов (проекты 11292, 11293 - немного отличаются только кол-вом шагов на 1 жабу и какими-то мелкими настройками) Практичеки одинаковые, совсем небольшая фора в пользу NV карт.
Записываем: Ср. время на шаг: 0:15:17 = 5070 PPD (GeForce 430GT(850/1700/1150) Ср. время на шаг: 0:05:10 = 14987 PPD (GTX 560-Ti @1000/2000_4700MHz) Бонусов нет
Записываем: Ср. время на шаг: 0:05:12 = 5081 PPD (Radeon HD 5750@750/1100) Ср. время на шаг: 0:03:23 = 7810 PPD (Radeon HD 6930@790/1200)
Осталось, чтобы кто-нибудь из считающих на NV картах поймал такое задание (p7613, еще p7612 тоже подойдет) если они еще выдаются. Или из считавших их раньше нашел информацию в логах и сказал - сколько там шагов моделирования на 1 жабу обсчитывается. Эта информация регулярно при за запуске и каждый фрем в лог выдается. Тогда останется только рассчитать скорость в физических величинах (шагов моделирования / минуту) и станет сразу ясно: - или ATI в F@H действительно медленно считают (из-за "плохой" архитектуры железа или неоптимизированного софта) - или на них просто очки сильно занижены за выполнение примерно той же работы - или то и другое одновременно в каких-то пропорциях...
Member
Статус: Не в сети Регистрация: 01.03.2005 Откуда: г.Братск
Здравствуйте! Меня интересует выбор процессора между i5-750 и i7-870. Разница по цене около полутора тысяч, стоит ли переплачивать за гипертрединг? Процессор будет занят расчетами 24/7, плюс - максимально стабильный разгон.
_________________ - Знаете, - вспоминала Раневская, - когда я увидела
этого лысого на броневике, то поняла: нас ждут большие неприятности.
Mad'Max Нельзя между собой разные проекты сравнивать, хоть и количество атомов близкое. Каких атомов, в каком протеине, по какому алгоритму оно считается - ничего этого мы не знаем, общего OpenCL ядра и одного проекта для прямого сравнения NV и ATI GPU - у нас нету, ток количество атомов близкое.
Там у них общей в статистике кстати может быть сумма теоретических пиковых гигафлопс от производителя, а не гигафлопсы конкретного OpenMM/OpenCL алгоритма. С учётом того, что в проекте немало слабых карт, средние 370/400 гигафлопс на карту для ATI и NV соответственно вполне могут оказаться пиковыми, а не реальными.
По поводу ядра А4 - просто не стали приделывать 10% бонус к уже существующим проектам, а только к вновь запускаемым. Стимулируют народ к апгрейду со старого железа, часть длинных заданий с А4 на s775 Core2Quad не уложится в сутки счёта.
На бульдозер я тож сильно надеялся в своё время - "Ща как выйдет, как порвёт Gulftown, цены на CPU падают, ура и здравствуйте старые добрые времена P4 vs Athlon XP 3200+". Вышел. Матюкнулся, кинул шапку о землю - "Ага, меньше 4-х штук в одну плату не ставить, мы все этого очень ждали".
Добавлено спустя 2 минуты 32 секунды: Я бы посоветовал вместо процессора поменять видеокарточку. 560Ti б/у можно купить за 4,5-5 т.р., а она сейчас на 900МГц делает порядка 27-29,5К ППД на заданиях 762х...
Member
Статус: Не в сети Регистрация: 01.03.2005 Откуда: г.Братск
economist2000 А я меняю не только процессор, так же сменю диск на Вертекс 4 128 Гб, и видеокарту на Gigabyte GTX 660 Ti. моя 450 сейчас выдает 13-14К ППД на заданиях 762х
_________________ - Знаете, - вспоминала Раневская, - когда я увидела
этого лысого на броневике, то поняла: нас ждут большие неприятности.
TSC! Russia member
Статус: Не в сети Регистрация: 20.03.2010 Откуда: Омск
uhbujhbq Меня смущает, потянет ли эта имеющаяся матплата фолдинговую нагрузку при разгоне 870-го... По результатам 660Ti выложи пожалуйста потом результаты в ветку по статистике, очень интересно ее сравнить с 660 и 650Ti... В принципе, если система апгредится под игровую нагрузку, то есть смысл остаться на 1156 сокете. 870-й в разгоне однозначно потянет эту видеокарту. Единственное, под фолдинг боксового кулера не хватит, нужно будет брать башню приличную, типа Мургена, Ниндзи, Перформы, Майн 2 или даже что-то более мощное. Смотрел тесты, 870-й легко раскрывает 2 шт. 580-ки, и даже 2 шт. 590-ых на нем показывают заметный прирост fps в сравнении 3 шт. 580-ых. Однако я его сейчас планирую продавать. Вертекс 4 с сентября использую, только положительные впечатления, но у меня чипсетный Сата 3, на Сата 2 он помедленнее будет. Бери в магазине, который дает полную, 60 месячную гарантию. Идущий ему на смену Вектор имеет гарантийное ограничение в 36,5 Тб по объему записанной информации, у этой же модели такого ограничения еще нет.
Member
Статус: Не в сети Регистрация: 01.03.2005 Откуда: г.Братск
economist2000 Если не потянет, прокляну всё и сменю платформу У меня башенный кулер с тремя трубками, что-то из айсхаммеров (если точно помню , планирую сменить вентилятор для лучшей продувки пластин. да, продавец дает 60 месяцев гарантии, да, у меня на материнской плате сата3 тоже чипсетный
_________________ - Знаете, - вспоминала Раневская, - когда я увидела
этого лысого на броневике, то поняла: нас ждут большие неприятности.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения