650ti это Кеплер с 4 CU - с ним мало что можно сделать. Под Кеплер сложно код оптимизировать (но он лучше чем VLIW4 VLIW5 для больших расчётов и логики).
Немцы хотели чтобы одна codebase выполнялась на всем, поэтому реально можно было оптимизировать только на один тип архитектуры. Было выбрано GCN. Maxwell2 (9XX) тоже на удивление эффективен без изменения кода - похоже в этом поколении нвидиа будет в отрыве. VLIW4 VLIW5 - совсем медленно будут работать - железо не создавалось для больших формул и сложной логики... да и особенности компилятора совсем не помогают.
650ti больше 1 WU и 1 CPU не надо.
как вариант можно кранчить GPUGRID - они на CUDA и оптимизированы лучше (и похоже финансируются). и вроде комп более живой под нагрузкой будет.
CPU код вряд ли кто трогать будет - у них сейчас только 1 програмер на полставки на кучу проектов и нет финансирования (я на добровольных началах переписал на GPU).
TSC! Russia member
Статус: Не в сети Регистрация: 20.10.2014 Фото: 14
sashmxm Просадок так же не наблюдаю во время других действий за компом, график закрузки гп стабильно 97%, а цп задания стали дольше обрабатываться на версии 2.21.
_________________ TSC! Russia - добровольные распределённые вычисления. Не используемые мощности твоего ПК могут помочь науке и людям в борьбе с тяжелыми заболеваниями.
Дико извиняюсь. Конфиг, размещенный vtankovich на форуме poem@home.
0.999 cpu позволяет освободить одно ядро под другую задачу. GPU юниты считаются чуть медленнее, хотя, вроде бы, незначительно. Температура снизилась на 4 градуса.
Ламерский вопрос к vtankovich. Программа, написанная конкретно для OpenCL 2.0, может быть намного быстрее или прироста совсем не будет? Просто, словосочетания "поддержка разделяемой виртуальной памяти" и "динамический параллелизм" звучат многообещающе.
Member
Статус: Не в сети Регистрация: 24.02.2014 Откуда: Санкт_Петербург Фото: 2
Здравствуйте!!! Начал я сегодня POEM считать и сразу возник вопроc, видеокарта( R7 260x) загружена не полностью, одно задание считала 4:44 на 8400 очков, так вот есть ли такой конфиг, чтобы запустить 2 потока на видяхе, но при этом проц по минимому использовать т.к он считает Розетту!
Куратор темы Статус: Не в сети Регистрация: 23.12.2006 Откуда: Rīga Фото: 0
IgorGavrish файлы настройки имеются (их полным полно в шапке темы), но не это главное. Сейчас на последнем приложении пока полностью не реализован счёт на несколько потоков ( не у всех считает без ошибок ). У меня на данный момент 280Х с загрузкой ~ 87% задание считает за 30-35 мин.
Добавлено спустя 55 секунд: 1 GPU + 1 CPU , и параллельно 7 потоков розетты.
Member
Статус: Не в сети Регистрация: 25.02.2015 Откуда: Москва
У меня 7770 считает в два потока (0.5GPU+0.5CPU) около трех часов, т.е. по 1:30 на задание при загрузке ГПУ ~98%. Если выставить 0.5GPU+0.05CPU, загрузка ГПУ падает, время счета на поток вырастает до 3:30, но добавляется еще один поток розетты. Конфиг самый простой:
TSC! Russia member
Статус: Не в сети Регистрация: 01.02.2014 Откуда: регион 64 Фото: 34
Считаю POEM@HOME за вашу команду с сегодня, 19:55. Перешел на этот проэкт по совету MegaCalcii Задание на (0.318 CPU's+1AMD GPU) выполнено на 63.25%, работает уже 9ч 8мин. Это еще имхо быстро, вот ядро 17 в F@H для моей 7560D это сущий ад Потерял на том задании все очки, бонусы и что только можно) Там оставил ядро a4 в 4 треда. Вот на вкладке Передача у BOINC манагера пока пусто. Так и должно быть?
_________________ "...Никем не ставший, зачем ты жил?!..."
TSC! Russia member
Статус: Не в сети Регистрация: 01.02.2014 Откуда: регион 64 Фото: 34
Ясно. А сколько трафика за сессию увидел, благодаря Process Explorer #77Только я бы не поверил, что он 500 метров скачал или отослал по удаленой сети. Возможно, мэнеждер и боинк обмениваются данными по протоколу TCP-IP между собой... впрочем это не практический вопрос а из праздного любопытства.
_________________ "...Никем не ставший, зачем ты жил?!..."
Member
Статус: Не в сети Регистрация: 25.02.2015 Откуда: Москва
Похоже нашел способ, как получить максимальный выхлоп с радеона, не жертвуя при этом ни одним ядром/потоком процессора. Только не знаю, подойдет ли он для виндоуз. Дело в том, что процесс poemcl для АМД съедает в среднем совсем немного (у меня -- около 5%) от одного ядра CPU, но если выделить ему столько, или даже 50%, то ядро загрузится, к примеру, четвертым процессом minirosetta (для 4-ядерной системы), который будет конфликтовать с poemcl, что неизбежно приведет к просадкам ГПУ. Однако, если задать приоритет процесса poemcl много больше розетты, то просадок ГПУ почти нет, и процессорное время используется оптимально. У меня этим занимается скрипт, который каждые пять минут тупо считывает pid'ы работающих процессов poemcl и minirosetta и изменяет их приоритеты на соответсвующие (под форточками можно использовать WinAFC, наверно).
Сейчас на четырехядерном Xeon E5450 (аналог q9650) считается 4 потока розетты и 2 потока ПОЕМ в конфигурации (0.1CPU+0.5GPU), загрузка карты при этом 98-99%. Два задания 2k39 выполняются за два часа, два 2f21 -- за 2:45. Карта HD7770.
Member
Статус: Не в сети Регистрация: 09.04.2011 Фото: 10
Lecc писал(а):
Похоже нашел способ, как получить максимальный выхлоп с радеона, не жертвуя при этом ни одним ядром/потоком процессора. Только не знаю, подойдет ли он для виндоуз. Дело в том, что процесс poemcl для АМД съедает в среднем совсем немного (у меня -- около 5%) от одного ядра CPU, но если выделить ему столько, или даже 50%, то ядро загрузится, к примеру, четвертым процессом minirosetta (для 4-ядерной системы), который будет конфликтовать с poemcl, что неизбежно приведет к просадкам ГПУ. Однако, если задать приоритет процесса poemcl много больше розетты, то просадок ГПУ почти нет, и процессорное время используется оптимально. У меня этим занимается скрипт, который каждые пять минут тупо считывает pid'ы работающих процессов poemcl и minirosetta и изменяет их приоритеты на соответсвующие (под форточками можно использовать WinAFC, наверно).
Сейчас на четырехядерном Xeon E5450 (аналог q9650) считается 4 потока розетты и 2 потока ПОЕМ в конфигурации (0.1CPU+0.5GPU), загрузка карты при этом 98-99%. Два задания 2k39 выполняются за два часа, два 2f21 -- за 2:45. Карта HD7770.
А для F@H не проверял ? Интересно, будет работать или нет.
Куратор темы Статус: Не в сети Регистрация: 23.12.2006 Откуда: Rīga Фото: 0
Lecc всё бы ничего , если задания не сыпались в 2 потока. И тут уже не какие-то жалкие проценты - тут повально, и поэтому никак не удаётся перейти на идеальную комбинацию в 2 потока GPU. работает всё на виндовс. С линуксом, к сожалению, не дружим.
Member
Статус: Не в сети Регистрация: 24.02.2014 Откуда: Санкт_Петербург Фото: 2
Triglav88 Процессор Core Quad 2.66 Ghz и считает Розетту в 4 потока.
Добавлено спустя 33 минуты: Да и кстати еще вопросик возник- почитал я файлы настроек в шапке, но у меня нет папки C:\ProgramData\BOINC\projects\boinc.fzk.de_poem, в папке BOINC у меня всего 2 папки - Locate и Skins!
Добавлено спустя 10 минут 52 секунды: Сори это я туплю немного после работы И скал не в ProgramData ,а в Program Files....в итоге конфиг запустил, но Розетта предсказуемо стала считать в 2 потока вместо 4х а Poem в 2 вместо 1го..
TSC! Russia member
Статус: Не в сети Регистрация: 01.02.2014 Откуда: регион 64 Фото: 34
Lecc писал(а):
Похоже нашел способ, как получить максимальный выхлоп с радеона, не жертвуя при этом ни одним ядром/потоком процессора. Только не знаю, подойдет ли он для виндоуз. Дело в том, что процесс poemcl для АМД съедает в среднем совсем немного (у меня -- около 5%) от одного ядра CPU, но если выделить ему столько, или даже 50%, то ядро загрузится, к примеру, четвертым процессом minirosetta (для 4-ядерной системы), который будет конфликтовать с poemcl, что неизбежно приведет к просадкам ГПУ. Однако, если задать приоритет процесса poemcl много больше розетты, то просадок ГПУ почти нет, и процессорное время используется оптимально.
Вот спасибо, ты пишешь актуальные вещи. Дело в том, что после перехода с F@H GPU на PoemCL меня не перестала беспокоить проблема тормозов как локального видео, так и ютуба, игр и окон DWM в Семерке. На данный момент понимаю, что эту проблему не решить, и надо как-то найти в себе силы с ней смириться. Но новый проблемас - именно просадки GPU (~ 50%). И всё видео как тормозило, так и тормозит, как если бы это было при 89-99% загрузки ГП. И я уж никак не думал, что исполняемому образу poemcl_2.21_windows_intelx86__opencl_ati_101 не хватает ресурсов проца - потреблял же он до FahCore_a4.exe (который, между прочим, молотит во все 4 потока) 1-5%, так и потребляет с последним. Твой пост натолкнул меня на нужные действия. 1. в процесс експлорере глянул в потоки poemcl_2.21_windows_intelx86__opencl_ati_101, какой Ideal Processor соответствует самому тяжелому потоку. Оказалось, CPU1. Вот и задал я ему только CPU1. 2. следующим шагом повысил приоритет poemcl_2.21_windows_intelx86__opencl_ati_101 выше среднего. 3.FahCore_a4.exe (=minirosetta) осталось без изменений: заданы все ядра, приоритет Idle. Результат #77 Как это все автоматизировать, чтобы каждый раз самому не выставлять этот порядок вещей? С WinAFC пока не дружу, но об этом лучше отпишусь в теме по ней.
_________________ "...Никем не ставший, зачем ты жил?!..."
Последний раз редактировалось Duce H_K_ 15.03.2015 23:16, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 25.02.2015 Откуда: Москва
IgorGavrish По всей видимости, ты использовал конфиг (1CPU+0.5GPU). Если задания не вылетают с ошибками вычислений, а загрузка карты увеличилась, попробуй оставить так и посмотреть время счета. А потом уже будешь ориентироваться на этот результат. По умолчанию (т.е. без app_info) под ПОЕМ должен выделяться один поток, а под розетту остается 3.
Duce H_K_ Я рад, если мой пост помог разобраться с ситуацией, хотя проблема тормозов и неполной загрузки карты, по-моему, несколько разные вещи. Тормоза говорят о недостаточной мощности или особенностях архитектуры ГПУ (у тебя же встройка?), и, может статься, что повышение приоритета poemcl лишь усугубит эту проблему. Как автоматизировать управление приоритетами под виндами, я могу только предполагать, поскольку на всех машинах стоит линукс. Принцип я описал.
Member
Статус: Не в сети Регистрация: 24.02.2014 Откуда: Санкт_Петербург Фото: 2
Lecc Я использовал конфиг 1CPU+0.395GPU и сейчас у меня считает Розетта в 2 потока и Poem в 2 при этом загрузка видеокарты 95-100%, загрузка процессора 70-80%, а по умолчанию у меня Розетта считала в 4 потока, а Poem 1 поток и загрузка была 100% процессра и 15-70%(в среднем где-то 35-40%) видеокарты. При этом в первом варианте POEM считает одно задание за 4ч 40 мин примерно, а во втором 2 задания за 100мин одно и за 150мин второе...
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения