Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
Тема предназначена для тех, кто ещё не очень хорошо разбирается в структуре форума и не знает, где искать ответы на вопросы, и где лучше задать вопрос. Если вы более-менее освоились, пожалуйста, используйте тематические ветки для того, чтобы задавать вопросы.
Внимание! Прежде чем задавать вопрос, рекомендуется посетить тему "[TSC!] Общий FAQ". Также можно воспользоваться поиском по этому форуму (через "Расширенный поиск" выберите поиск только в форуме нашей команды и введите нужный контекст).
Junior
Статус: Не в сети Регистрация: 28.12.2008 Откуда: Казань
Здравствуйте! Недавно начал считать в Folding@Home. Хочу задать некоторые вопросы. (Система в профиле.)
1) При работе только GPU клиента, также идёт загрузка процессора ~25%. Не многовато ли?
2) Смотрю мониторинг активности GPU через RivaTuner. Вижу, что Gpu всегда загружен на 98%, но через каждую минуту происходят просадки до 77%. Клиент специально так делает? Или что-то с видеокартой/драйверами?
3) Включаю параллельно SMP-клиент с ключами -smp -verbosity 9 -forceasm. Появляются ещё 4 процесса, причём 3 из них, как и положено, поедают по ~25% процессорного времени, но 4-ый ~4%. Притом активность GPU падает до 90%, среднее время на шаг увеличивается на ~ 10сек (по мониторингу FahSpy) на задании 5735. Но самое главное, что SMP считает, по-моему, ну очень медленно: задание 3065, PPD 455, время на шаг 1:07:51! Правильно ли я понимаю, что виноват тот самый 4-ый поток, который "тормозит" остальные 3?
4) Тут что-то говорилось про FLUSH_INTERVAL, который уменьшает загрузку процессора при работе GPU-клиента. Уменьшает в ущерб производительности GPU?
5) Советуют использовать WinAFC. А почему нельзя просто задать соответствия потокам через Диспетчер Задач?
Может ещё что-нибудь посоветуете? Заранее спасибо.
Member
Статус: Не в сети Регистрация: 04.02.2005 Откуда: Россия\Москва Фото: 3
ColdFlame приветствуем в наших рядах 1) клиент для АТИвидюх кушает ровно 1 ядро проца... т.е. всё ОК...
2) у меня на 4850 так же... видимо сохраняет промежуточные результаты (или что-нить ещё)
3) видимо да...
4) должен влиять, но сам не экспериментировал...
5) диспетчер задач мало эфективен потому, что СМП стартует как дочерний процесс системного mpich и каждый раз разный...
в итоге задать ему "на_постоянку" зависимость ядер не представляется возможным (на следующем WU скинется ибо пересоздаст процессы)
ColdFlame писал(а):
Может ещё что-нибудь посоветуете? Заранее спасибо.
возможно для тебя идеальным будет 3SMP+ 1GPU, но такая система гораздо сложнее в исполнении и я тебе в этом не подскажу...
поспрашивай тех, у кого много SMP, как они их сдружили
_________________ Присоединяйтесь к команде распределённых вычислений TSC! Russia
Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
anubias писал(а):
только на 30 секунд,вернется все обратно
нет-нет, не вводи в заблуждение. Вернется обратно только при запуске нового задания или если был перезапуск клиента. Если текущее задание не прерывать, то как выставишь соответствие, так оно и будет. Вот только зачем руками, да еще караулить смену заданий, когда это легко делается автоматом, только один раз настроить? И ни потерь времени, ни проблем в случае нештатных перезагрузок и др.
Member
Статус: Не в сети Регистрация: 13.05.2006 Откуда: Питер
NWolf писал(а):
жабы то качает !
а начать расчет не дает.Отключи на время первого запуска файревол и проверь или сразу дай все разрешения процессам smpd.exe и mpiexec.exe если это smp.
Hil наверное уже забыл,давно c WinAFC сижу.
Member
Статус: Не в сети Регистрация: 23.04.2007 Откуда: Москва Фото: 3
Что-то ужас какой-то
первая жабка
Цитата:
[19:56:33] Folding@Home Gromacs SMP Core [19:56:33] Version 1.74 (March 10, 2007) [19:56:33] [19:56:33] Preparing to commence simulation [19:56:33] - Ensuring status. Please wait. [19:56:50] - Assembly optimizations manually forced on. [19:56:50] - Not checking prior termination. [19:56:54] - Expanded 4763121 -> 24426905 (decompressed 512.8 percent) [19:56:54] - Starting from initial work packet [19:56:54] [19:56:54] Project: 2665 (Run 3, Clone 448, Gen 48) [19:56:54] [19:56:56] Assembly optimizations on if available. [19:56:56] Entering M.D. [19:57:02] Rejecting checkpoint [19:57:04] Protein: HGG in waterExtra SSE boost OK. [19:57:04] [19:57:07] Extra SSE boost OK. [19:57:07] Writing local files [19:57:08] Completed 0 out of 250000 steps (0 percent) [20:05:22] Warning: long 1-4 interactions [20:05:23] Quit 101 - NaN detected: (ener[0]) [20:05:23] [20:05:23] Simulation instability has been encountered. The run has entered a [20:05:23] state from which no further progress can be made. [20:05:23] This may be the correct result of the simulation, however if you [20:05:23] often see other project units terminating early like this [20:05:23] too, you may wish to check the stabilie size: 9421 [20:05:23] - Writing 9970 bytes of core data to disk... [20:05:23] ... Done. [20:05:23] - Failed to delete work/wudata_02.arc [20:05:23] No C.P. to delete. [20:05:23] - Failed to delete work/wudata_02.Warning: check for stray f [20:05:23] Folding@home Core Shutdown: EARLY_UNIT_END [20:05:23] [20:05:23] Folding@home Core Shutdown: EARLY_UNIT_END [20:05:27] CoreStatus = 7B (123) [20:05:27] Sending work to server
вторая жабка
Цитата:
[20:12:47] Folding@Home Gromacs SMP Core [20:12:47] Version 1.74 (March 10, 2007) [20:12:47] [20:12:47] Preparing to commence simulation [20:12:47] - Ensuring status. Please wait. [20:12:50] - Starting from initial work packet [20:12:50] [20:12:50] Project: 2665 (Run 2, Clone 411, Gen 81) [20:12:50] [20:12:51] Assembly optimizations on if available. [20:12:51] Entering M.D. [20:13:09] on if available. [20:13:09] Entering M.D. [20:13:15] Rejecting checkpoint [20:13:16] Protein: HGG with glycosylations [20:13:16] Writing local files [20:13:20] Extra SSE boost OK. [20:13:20] Writing local files [20:13:20] Completed 0 out of 250000 steps (0 percent) [20:16:20] [20:16:20] - Writing 9958 bytes of core daGromacs cannot continue further. [20:16:20] Going to send back what have done. [20:16:20] logfile size: 9422 [20:16:20] - Writing 9958 bytes of core data to disk... [20:16:20] ... Done. [20:16:20] iled to delete work/wudata_01.sas [20:16:20] - Failed to delete work/wudata_01.goe [20:16:20] Warning: check for stray files [20:16:20] heck for stray files [20:16:20] [20:16:20] Folding@home Core Shutdown: EARLY_UNIT_END [20:16:20] Finalizing output
ничего не понимаю:weep:
_________________ We treat you right when rest of the world treats you rough.
Member
Статус: Не в сети Регистрация: 10.10.2008 Откуда: г. Владимир
Necrodancer, было такое когда я под ХР на домашней машине mpich поставил... клиент скачивал жабы и тутже EUE выдавал. И что я только не делал ... Потом плюнул, поставил deino и всё пошло как по маслу. Недавно пересел на висту64, там и mpich нормально запустился.
Member
Статус: Не в сети Регистрация: 23.04.2007 Откуда: Москва Фото: 3
Я с этим клиентом и разгоном уже жаб 50 посчитал, а тут на тебе. Так что нестабильность и перегрев исключаются. Поиском воспользовался, вроде задания такие "битые" бывают, и ходят косяками. Вот опять EUE...
_________________ We treat you right when rest of the world treats you rough.
Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
Ну, значит, задания такие.
Еще вот проскакивают глюки серверов или чего-то еще... У меня последние дни периодически 1 из 2 СМП-клиентов на компе вдруг не может задание новое скачать с сервера. Потом само проходит. При этом второй мирно стучится и скачивает. В то же самое время.
Member
Статус: Не в сети Регистрация: 25.12.2007 Откуда: Красноярск
Necrodancer, я позавчера штук 7 таких жаб подряд поймал: максимум до 3 процентов доживали, а некоторые мгновенно дохли. Теперь все нормально считается... тьфу-тьфу-тьфу
Junior
Статус: Не в сети Регистрация: 31.03.2009 Откуда: Москва
Доброго времени суток!
Начал считать - нормально сидят 2 smp и 1 gpu
Есть пара вопросов:
Если завершать работу клиента ctrl+c, то при повторном запуске клиенту не удается продолжить предыдущее задание,
можно ли поправить?
В config должно быть прописано local=1? gpu клиент постоянно меняет это значение, но все работает.
Member
Статус: Не в сети Регистрация: 06.07.2004 Откуда: РФ Фото: 6
ID_Nait писал(а):
нормально сидят 2 smp
Виндовые СМП дурные, не различают свои и чужие ядра Как-то наши парни выкручиваются, попробуй поищи в теме про СМП. Вроде резервное копирование у них по-расписанию прога делает каждые сколько-то минут.
Сейчас этот форум просматривают: LeonMer и гости: 7
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения