Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
Тема предназначена для тех, кто ещё не очень хорошо разбирается в структуре форума и не знает, где искать ответы на вопросы, и где лучше задать вопрос. Если вы более-менее освоились, пожалуйста, используйте тематические ветки для того, чтобы задавать вопросы.
Внимание! Прежде чем задавать вопрос, рекомендуется посетить тему "[TSC!] Общий FAQ". Также можно воспользоваться поиском по этому форуму (через "Расширенный поиск" выберите поиск только в форуме нашей команды и введите нужный контекст).
Member
Статус: Не в сети Регистрация: 16.08.2006 Откуда: Ро100в-на-Дону
Что-то не получается у меня отлавливать нужные задания.
Я заметил, что задания для DGromacs считаются раза в полтора (а некоторые почти в 4) раза быстрее остальных. Решил их отлавливать. В файрволле разрешил клиенту доступ только к раздающему серверу и тем серверам, где лежат соответствующие задания. Посмотрел статистику - на этих серверах задания есть и процент распределения на некоторых отличен от нуля.
Второй день уже клиент ломится на один и тот же сервер. Меняю настройку clienttype, на некоторых вариантах начинает так же устойчиво ломиться на другой сервер.
Потом, меняю настройку checkpoint с 5 на 30 минут - начинает ломиться еще на один сервер.
То есть при каждом наборе настроек клиент ломится исключительно на один сервер и все тут.
Посоветуйте что-нибудь, что еще можно сделать.
_________________ Верный путь это тот, по которому ты уже идешь.
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
MikhailoMMX
MikhailoMMX писал(а):
checkpoint с 5 на 30 минут - начинает ломиться еще на один сервер
Распределения по серверам от параметра checkpoint не зависит, т.к. это интервал сохранения промежуточных результатов. Тут скорее играет роль перезапуск клиента после изменения параметра.
Распределение зависит от следующих параметров:
type=0-5
bigpacket=yes/no (big/normal/small)
memory= (можно тут посмотреть для какого сервера какой порог по минимуму оперативной памяти).
И кто сказал, что на сервере именно DGromacs есть? Берём к примеру 171.64.122.70: на нём задания DGROMACS (2584, 2585) GROMACS (2586, 2587, 2588, 2589), а распределение между ними мы не знаем. Может там 1 штука 2584, 2 штуки 2585 и 40000 штук 2588.
_________________ Революционеров можно убить, идеи — никогда.
Member
Статус: Не в сети Регистрация: 16.08.2006 Откуда: Ро100в-на-Дону
Ладно, остановился на таком варианте - запускается два экземпляра клиента. Один с низким приоритетом, файрволлом не блокируется. Второй - в более высоким но с доступом только на нужные сервера.
_________________ Верный путь это тот, по которому ты уже идешь.
Member
Статус: Не в сети Регистрация: 06.02.2008 Откуда: Москва
Считаю на GPU клиенте
из желаемого срока выбился но в дедлайн укладывался
весь день возился с обработкой видео и по-прогнозу выбивался и за дедлайн. Но когда работа с видео закончилась прогноз опять бы стал благоприятным!!! Ан нет после пеерзагрузки клиент наполовину посчитанное старое задание послал на ... и взял считать новое.
Бред какой то. Зачем он исходит из прогноза на расчет, а не из самого расчета?
Иль сбой в расчете был? Вроде клиент тормозил по Ctrl+C
_________________ Боишься - не делай. Делаешь - не бойся.
Member
Статус: Не в сети Регистрация: 06.02.2008 Откуда: Москва
Behc вот кусок где был сбой
Цитата:
[13:22:43] - Ask before connecting: No [13:22:43] - User name: Haron (Team 47191) [13:22:43] - User ID: 21BB54F14051DF54 [13:22:43] - Machine ID: 1 [13:22:43] [13:22:43] Loaded queue successfully. [13:22:43] [13:22:43] + Processing work unit [13:22:43] Core required: FahCore_10.exe [13:22:43] Core found. [13:22:43] Working on Unit 04 [April 6 13:22:43] [13:22:43] + Working ... [13:22:50] [13:22:50] *------------------------------* [13:22:50] Folding@Home GPU Core - Beta [13:22:51] Version 0.10 (Mon Oct 30 12:32:17 PST 2006) [13:22:51] [13:22:51] Compiler : Microsoft (R) 32-bit C/C++ Optimizing Compiler Version 13.10.3077 for 80x86 [13:22:51] Build host: CYGWIN_NT-5.1 vishal-gpu 1.5.19(0.150/4/2) 2006-01-20 13:28 i686 Cygwin [13:22:51] Preparing to commence simulation [13:22:51] - Looking at optimizations... [13:22:55] - Files status OK [13:23:00] - Expanded 82487 -> 443713 (decompressed 537.9 percent) [13:23:00] [13:23:00] Project: 2746 (Run 8, Clone 192, Gen 0) [13:23:00] [13:23:00] Assembly optimizations on if available. [13:23:00] Entering M.D. [13:23:06] Will resume from checkpoint file [13:23:17] Working on 1258 p2746_GPUlambda [13:23:18] Starting GUI Server [13:23:18] Resuming from checkpoint [13:23:18] File work/wudata_04.log has changed since last checkpoint [13:23:18] mdrun_gpu returned 114 [13:23:18] Going to send back what have done. [13:23:18] logfile size: 19030 [13:23:18] - Writing 19568 bytes of core data to disk... [13:23:18] Done: 19056 -> 3329 (compressed to 17.4 percent) [13:23:18] ... Done. [13:23:18] [13:23:18] Folding@home Core Shutdown: EARLY_UNIT_END [13:23:21] CoreStatus = 72 (114) [13:23:21] Sending work to server [13:23:21] - Read packet limit of 540015616... Set to 524286976.
[13:23:21] + Attempting to send results [13:23:42] - Couldn't send HTTP request to server [13:23:42] + Could not connect to Work Server (results) [13:23:42] (171.64.65.20:8080) [13:23:42] - Error: Could not transmit unit 04 (completed April 6) to work server. [13:23:42] Keeping unit 04 in queue. [13:23:42] - Read packet limit of 540015616... Set to 524286976.
[13:23:42] + Attempting to send results [13:24:03] - Couldn't send HTTP request to server [13:24:03] + Could not connect to Work Server (results) [13:24:03] (171.64.65.20:8080) [13:24:03] - Error: Could not transmit unit 04 (completed April 6) to work server. [13:24:03] - Read packet limit of 540015616... Set to 524286976.
[13:24:03] + Attempting to send results [13:24:24] - Couldn't send HTTP request to server [13:24:24] + Could not connect to Work Server (results) [13:24:24] (171.64.122.76:8080) [13:24:24] Could not transmit unit 04 to Collection server; keeping in queue. [13:24:24] - Preparing to get new work unit... [13:24:24] + Attempting to get work packet [13:24:24] - Connecting to assignment server [13:24:46] - Couldn't send HTTP request to server [13:24:46] + Could not connect to Assignment Server [13:25:07] - Couldn't send HTTP request to server [13:25:07] + Could not connect to Assignment Server 2 [13:25:07] + Couldn't get work instructions. [13:25:07] - Attempt #1 to get work failed, and no other work to do. Waiting before retry. [13:25:17] + Attempting to get work packet [13:25:17] - Connecting to assignment server [13:25:38] - Couldn't send HTTP request to server [13:25:38] + Could not connect to Assignment Server [13:25:59] - Couldn't send HTTP request to server [13:25:59] + Could not connect to Assignment Server 2 [13:25:59] + Couldn't get work instructions. [13:25:59] - Attempt #2 to get work failed, and no other work to do. Waiting before retry. [13:26:22] + Attempting to get work packet [13:26:22] - Connecting to assignment server [13:26:23] - Successful: assigned to (171.64.65.20). [13:26:23] + News From Folding@Home: GPU folding beta [13:26:23] Loaded queue successfully. [13:26:25] - Read packet limit of 540015616... Set to 524286976.
[13:26:25] + Attempting to send results [13:26:26] + Results successfully sent [13:26:26] Thank you for your contribution to Folding@Home. [13:26:26] + Closed connections [13:26:31] [13:26:31] + Processing work unit [13:26:31] Core required: FahCore_10.exe [13:26:31] Core found. [13:26:31] Working on Unit 05 [April 6 13:26:31] [13:26:31] + Working ... [13:26:33] [13:26:33] *------------------------------* [13:26:33] Folding@Home GPU Core - Beta [13:26:33] Version 0.10 (Mon Oct 30 12:32:17 PST 2006) [13:26:33] [13:26:33] Compiler : Microsoft (R) 32-bit C/C++ Optimizing Compiler Version 13.10.3077 for 80x86 [13:26:33] Build host: CYGWIN_NT-5.1 vishal-gpu 1.5.19(0.150/4/2) 2006-01-20 13:28 i686 Cygwin [13:26:33] Preparing to commence simulation [13:26:33] - Looking at optimizations... [13:26:33] - Created dyn [13:26:33] - Files status OK [13:26:33] - Expanded 87194 -> 443713 (decompressed 508.8 percent) [13:26:33] [13:26:33] Project: 2743 (Run 0, Clone 175, Gen 6) [13:26:33] [13:26:33] Assembly optimizations on if available. [13:26:33] Entering M.D. [13:26:39] Working on 1258 p2743_GPUlambda [13:26:40] Starting GUI Server [13:51:52] Completed 1% [14:17:48] Completed 2%
_________________ Боишься - не делай. Делаешь - не бойся.
Junior
Статус: Не в сети Регистрация: 13.04.2008 Откуда: Курск-Измаил
Всем привет.
Вторые сутки как включился в команду.
Начал с консольного клиента, отправил 2 задания.
Сейчас осваиваю SMP, работает, 2% посчитал.
До сих пор ни на одном сервере статистики себя не вижу.
Мой ник в проекте как и на форуме.
Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
BVV_RUA 1. Какой ник в проекте? Поищу.
2. Какой номер команды ввёл клиенту?
3. Можно увидеть client.cfg от консольного клиента?
4. Если запустить его конфигурацию, он пишет правильный номер тебе - 47191?
Junior
Статус: Не в сети Регистрация: 13.04.2008 Откуда: Курск-Измаил
Так-с, в папке WORK есть 2 файла logfile_01.txt, logfile_03.txt хвост файла _01: Completed 125000 out of 125000 steps (100%)
Writing final coordinates.
Past main M.D. loop
Finished Work Unit:
- Reading up to 3024264 from "work/wudata_01.arc": Read 3024264
- Reading up to 5239764 from "work/wudata_01.xtc": Read 5239764
goefile size: 0
logfile size: 36339
Leaving Run
- Writing 8349895 bytes of core data to disk...
Done: 8349383 -> 8126947 (compressed to 97.3 percent)
... Done.
- Shutting down core
Folding@home Core Shutdown: FINISHED_UNIT
как мне кажется тут всё в порядке. Второго почему-то нет, третий в работе, сейчас 16% обсчитал. После завершения 1-го задания я следил за попытками отправки и когда увидел, что не уходят задания, поставил параметр "usereg=no", т.к. изначально настроил "yes". Всё равно не уходили, и в итоге из командной строки запустил клиента с параметром -send all А вот кусок из FAHlog.txt, завершение 2-го задания и отправка результатов: [17:56:39] Completed 125000 out of 125000 steps (100)
[17:56:40] Writing final coordinates.
[17:56:41] Past main M.D. loop
[17:57:41]
[17:57:41] Finished Work Unit:
[17:57:41] - Reading up to 3024264 from "work/wudata_02.arc": Read 3024264
[17:57:41] - Reading up to 5424348 from "work/wudata_02.xtc": Read 5424348
[17:57:41] goefile size: 0
[17:57:41] logfile size: 64320
[17:57:41] Leaving Run
[17:57:44] - Writing 8564348 bytes of core data to disk...
[17:57:48] Done: 8563836 -> 8198363 (compressed to 95.7 percent)
[17:57:48] ... Done.
[17:57:48] - Shutting down core
[17:57:48]
[17:57:48] Folding@home Core Shutdown: FINISHED_UNIT
[17:57:52] CoreStatus = 64 (100)
[17:57:52] Sending work to server
[17:57:52] + Attempting to send results
[18:00:52] + Results successfully sent
[18:00:52] Thank you for your contribution to Folding@Home.
[18:00:52] + Number of Units Completed: 2
Что, где не так? Нихт ферштеен. Будет сильно досадно когда дочитается SMP и нигде не зачтётся. Ещё вот что - в какой момент я должен появится в статистике команды, хотя бы без очков?
Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
BVV_RUA в статистике проекта тебя нет. Увы. Скажи пожалуйста, ты настраивал клиента только через него или правил файл client.cfg редакторами какими-либо? Если последнее, то возможно, что повреждены концы строк, и в результате что-либо не срабатывает. Сейчас останови клиента (СМП) и запусти его консоль с ключом -configonly. Там введи только свой ник и номер команды, остальное подтверди Enter'ом до выхода из настройки. После этого запусти клиента обратно - всё должно работать нормально.
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
BVV_RUA На счет первого до конца не понятно, отправилось нормально или нет. Из лога этого не видно
Второе вроде отправилось нормально, но это было всего два часа назад, могло просто в статистику докторов ещё не добавиться.
BVV_RUA писал(а):
в какой момент я должен появится в статистике команды
После расчета задания, отправления и занесения в статистику хотя бы одного результата.
_________________ Революционеров можно убить, идеи — никогда.
Сейчас этот форум просматривают: Bing [Bot] и гости: 1
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения