Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
Тема предназначена для тех, кто ещё не очень хорошо разбирается в структуре форума и не знает, где искать ответы на вопросы, и где лучше задать вопрос. Если вы более-менее освоились, пожалуйста, используйте тематические ветки для того, чтобы задавать вопросы.
Внимание! Прежде чем задавать вопрос, рекомендуется посетить тему "[TSC!] Общий FAQ". Также можно воспользоваться поиском по этому форуму (через "Расширенный поиск" выберите поиск только в форуме нашей команды и введите нужный контекст).
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
Mike_DZhomart Если сбой произойдёт по время записи промежуточных результатов, то задание почти 100% слетит. Чем чаще стоят сохранения, тем эта вероятность больше.
_________________ Революционеров можно убить, идеи — никогда.
В общем такая трабла: посчитался юнит, но отправиться не смог, толи оттого что инета в этот оммент не стало, толи из-за глюков с правами в висте, короче и когда починил инет просто стало качаться новое ядро (которое к тому же не распаковывалось пока права все не переправил) а старые результаты никуда не отправились. Но остался файл wuresults_01.dat можно его как то применить для отправки старых результатов или они полностью пропали?
в логе написала вот что
Цитата:
[05:28:51] Completed 1500000 out of 1500000 steps (100) [05:28:51] Writing final coordinates. [05:28:52] Past main M.D. loop [05:29:52] [05:29:52] Finished Work Unit: [05:29:52] - Reading up to 297216 from "work/wudata_01.arc": Read 297216 [05:29:52] - Reading up to 505120 from "work/wudata_01.xtc": Read 505120 [05:29:52] goefile size: 0 [05:29:52] logfile size: 113420 [05:29:52] Leaving Run [05:29:55] - Writing 1057246 bytes of core data to disk... [05:29:55] Done: 1056734 -> 803607 (compressed to 76.0 percent) [05:29:55] ... Done. [05:29:55] - Shutting down core [05:29:55] [05:29:55] Folding@home Core Shutdown: FILE_IO_ERROR [05:29:58] CoreStatus = 75 (117) [05:29:58] Error opening or reading from a file. [05:29:58] Deleting current work unit & continuing... [05:30:18] - Preparing to get new work unit... [05:30:18] + Attempting to get work packet [05:30:18] - Connecting to assignment server [05:30:20] - Successful: assigned to (171.65.103.162). [05:30:20] + News From Folding@Home: Welcome to Folding@Home [05:30:20] Loaded queue successfully. [05:30:20] - Couldn't send HTTP request to server [05:30:20] + Could not connect to Work Server [05:30:20] - Error: Attempt #1 to get work failed, and no other work to do. Waiting before retry. [05:30:30] + Attempting to get work packet [05:30:30] - Connecting to assignment server [05:30:31] - Successful: assigned to (171.65.103.162). [05:30:31] + News From Folding@Home: Welcome to Folding@Home [05:30:31] Loaded queue successfully. [05:30:31] - Couldn't send HTTP request to server [05:30:31] + Could not connect to Work Server [05:30:31] - Error: Attempt #2 to get work failed, and no other work to do.
Member
Статус: Не в сети Регистрация: 05.01.2006 Откуда: Вятка
grokin вернее всего в это время "лежал" сервер докторов. Если дедлайн задания не жмет - подожди оно само уйдет - при включени клиент отсылает задания и раз в день включается автоотпрака юнитов. Если же хочется отправить - запусти клиента с ключем - send all . (про ключи подробнее есть в ) Добавлено спустя 58 секунд grokin вернее всего в это время "лежал" сервер докторов. Если дедлайн задания не жмет - подожди оно само уйдет - при включени клиент отсылает задания и раз в день включается автоотпрака юнитов. Если же хочется отправить - запусти клиента с ключем - send all . (про другие ключи подробнее есть в FAQ).
Sanko Пробовал и перезапускать клиент и send all ничего не происходит и не отправляется, в логах только малоинформативное
[19:28:57] Attempting to return result(s) to server...
Folding@Home Client Shutdown.
Ошибка ввода-вывода в файл [05:29:58] Error opening or reading from a file. Не может прочитать/открыть
grokin писал(а):
[05:29:58] Deleting current work unit & continuing...
Удаляет текущее задание и продолжает
grokin писал(а):
[05:30:20] - Couldn't send HTTP request to server [05:30:20] + Could not connect to Work Server [05:30:20] - Error: Attempt #1 to get work failed, and no other work to do.Waiting before retry.
Не может получить доступ к серверу с заданием, чтобы получить новое. Старого НЕТ, удалил он его.
Грохни папку клиента совсем, создай заново, дай сразу нормально все права на неё и начни заново. Проверь наличие места на диске. Временные файлв у клиента могут достигать сотен мегабайт. Проверь наличие и настройку файрволла.
Member
Статус: Не в сети Регистрация: 04.01.2005 Откуда: Москва
Товарищи, объясните новичку: досчитал я задания до 73%, а потом, при следующей загрузке, клиент мне в FAHSpy написал
[22:12:19] - Previous termination of core was improper.
[22:12:19] - Files status OK
[22:12:40] - Expanded 4959960 -> 34521892 (decompressed 696.0 percent)
[22:12:42] - Checksums don't match (work/wudata_01.xvg)
[22:12:42] - Starting from initial work packet
...и начал считать все заново. Скажите, часто ли такое бывает и как можно минимизировать подобное?
(Я использую консольный вариант вместе с FAHSpy. Система в профиле, если надо.)
И ещё такой вопрос: как выставить время, так, чтобы оно соответствовало системному?
Member
Статус: Не в сети Регистрация: 06.07.2004 Откуда: РФ Фото: 6
Skydancer Тогда тебе просто не повезло. Дело в том, что сбой в процессе сохранения чекпоинта практически = потере задания. Чем чаще сохраняет - тем выше вероятность попасть на момент сохранения. С другой стороны, при редких сохранениях теряется время счета. То есть, при сохранении раз в час, например, можно потерять 59 минут счета просто потому, что машину выключили прямо перед очередным сохранением и оно продолжит считать с того, что сделало час назад.
Member
Статус: Не в сети Регистрация: 22.10.2004 Откуда: Королёв
Skydancer писал(а):
как можно минимизировать подобное?
Настроить автоматическое сохранение по расписанию папки work и файла queue.dat - тогда есть откуда восстанавливаться. Можешь глянуть примеры в файлах у меня на ПС.
Member
Статус: Не в сети Регистрация: 22.10.2004 Откуда: Королёв
targitaj А зачем закрывать?
После нештатного завершения задание просто начинает считаться с нуля, ничего не отсылая на сервер. В этом случае можно восстановиться. А вот при EUE - как повезет. Мне несколько раз удавалось досчитать "упавшие" жабы - и они засчитывались.
А, что будет если установить две консольные версии клиента с одинаковым machineid. Я сначала установил, а потом вычитал, что надо ставить разные значения для каждой. В таком виде уменя да же успелось посчитаться одно задание и слиться на учет, но статистика молчит уже больше 6 часов, наверное посчитал в пустую.
Member
Статус: Не в сети Регистрация: 22.10.2004 Откуда: Королёв
alex.12 писал(а):
А, что будет если установить две консольные версии клиента с одинаковым machineid.
Имеется в виду - на одном компе? Тогда задание, полученное первым, доктора считают слетевшим. И очков за него не получить.
Если на разных компах, и UserID на них разные, тогда все нормально - очки дадут.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 6
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения