Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
Тема предназначена для тех, кто ещё не очень хорошо разбирается в структуре форума и не знает, где искать ответы на вопросы, и где лучше задать вопрос. Если вы более-менее освоились, пожалуйста, используйте тематические ветки для того, чтобы задавать вопросы.
Внимание! Прежде чем задавать вопрос, рекомендуется посетить тему "[TSC!] Общий FAQ". Также можно воспользоваться поиском по этому форуму (через "Расширенный поиск" выберите поиск только в форуме нашей команды и введите нужный контекст).
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
BVV_RUA Как вариант можно попробовать получить новый UserID (уникальный номер идентификации компьютера). Для этого нужно остановить клиента и удалить ключ HKEY_LOCAL_MACHINE\SOFTWARE\PandeGroup\Folding@Home из реестра.
_________________ Революционеров можно убить, идеи — никогда.
Junior
Статус: Не в сети Регистрация: 13.04.2008 Откуда: Курск-Измаил
Фух, досчитался первый юнит SMP.
Отправился, я вижу себя в статистике Folding@Home.
Уже начал считать второе и досчитывает задание консольной версии.
Жалко бросать, пусть отправит и потом оставлю только SMP.
Кстати, кусок лога 2-го юнита:
[04:54:14] Writing local files
[04:54:14] Completed 0 out of 500000 steps (0 percent)
[05:04:14] Timered checkpoint triggered.
[05:14:15] Timered checkpoint triggered.
[05:24:15] Timered checkpoint triggered.
[05:34:16] Timered checkpoint triggered.
[05:43:18] Writing local files
[05:43:19] Completed 5000 out of 500000 steps (1 percent)
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
BVV_RUA Timered checkpoint triggered - сохранение промежуточных результатов. В client.cfg стоит наверно checkpoint=10, вот он каждые 10 мин и сохраняет. Рекомендуется это значение увеличить до 20-25 минут.
_________________ Революционеров можно убить, идеи — никогда.
Member
Статус: Не в сети Регистрация: 16.03.2008 Откуда: г. Покров
В очередной раз проклял всю эту затею и в частности FAH клиент!
Я зол!!! Хотя это мягко сказано. У меня "нечаянно" рестартанулся комп и задание слетело в известном направлении (считалось неделю!). Это не первый случай. Если сложить все что у меня чудным образом "упало" то получится около 30% из всех заданий! Это без приувеличений! Как минимум 5 заданий упало (а я считаю только меньше месяца).
Неужели нельзя сделать было нормальную систему сохранения промежуточного результата? Программерам надо оторвать все органы!!!! (мне возможно тоже, но им в первую очередь)
Сам не знаю что я хочу сказать этим постом, но одно могу сказать: каждый такой облом приближает меня к тому моменту когда я удалю всю эту считалку нафиг.
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
vkToxa Тоже ничего не умирало, только есть сам убивал. Ни обычные, ни SMP задания не умирают просто так у меня, ни BSOD'ов виндовс не ловит.
Может у тебя в системе что не то? Слабый БП, глючная память, куча пыли в компе? Или чтоит что-то вроде checkpoint=2?
_________________ Революционеров можно убить, идеи — никогда.
Member
Статус: Не в сети Регистрация: 16.03.2008 Откуда: г. Покров
Цитата:
Придется тебе налаживать бэкап... на всякий случай батник написал
Вроде пробовал делать но он вроде битый получается если программа уже запущена. Кинь текст батника.
Цитата:
Может у тебя в системе что не то? Слабый БП, глючная память, куча пыли в компе? Или чтоит что-то вроде checkpoint=2?
БП мощный, пыли ноль, checkpoint=5 (на одном, а на другом по умолчанию, но слетали оба), на счет памяти не знаю.
А не может кэш на винте виноватым быть (8 Мб)? У меня лампочка обращения к винту мигает примерно с периодичностью в 1 сек (когда ничего не работает кроме FAH).
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
vkToxa checkpoint=5 - а вот это зря! checkpoint= надо ставить чем больше, тем лучше (20-25). Т.е. если сбой произойдётт во время checkpoint (записи промежуточных результатов), то задание с 99% вероятностью накроется.
vkToxa писал(а):
А не может кэш на винте виноватым быть (8 Мб)? У меня лампочка обращения к винту мигает примерно с периодичностью в 1 сек
У меня тоже кеш 8 Мб и ничего. И периодичность обращения к винчестеру что с FAH, что без одинаковая.
_________________ Революционеров можно убить, идеи — никогда.
Member
Статус: Не в сети Регистрация: 06.02.2008 Откуда: Москва
На целероне D на работе была интересная история. Если рестартануть комп то задание потом запускается нормально, а если комп выключить наночь то утром уже фигу задание
_________________ Боишься - не делай. Делаешь - не бойся.
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
vkToxa Я тут ещё вот что вспомнил: файловая система какая? На FAT32 по сравнению с NTFS вероятность слёта задания на порядок выше.
АлексЕ Предлагаю провести простой эксперимент. Поставить флешку, запустить копирование папки FAH на неё и во время копирования вытащить её из компьютера. Какова вероятность того, что задание из папки на флешке можно будет запустить и последнего %? Или вообще запустить?
Да, OS X по сравнению с Windows, более надёжная система, но суть с checkpoint одна и та же.
_________________ Революционеров можно убить, идеи — никогда.
Member
Статус: Не в сети Регистрация: 16.03.2008 Откуда: г. Покров
Цитата:
файловая система какая?
FAT32 На работе считается круглосуточно тоже на ФАТ, и пару раз приходя утром, находил комп выключенным (может свет вырубали, может уборщица) и пока слетов не было. А дома ну прям наказание какое-то - чуть на резет нажмешь и считай с нуля.
Еще вопрос: можно обычный клиент запустить как службу вручную? Т.е. я через диспетчер закрываю ее и потом когда запускаю то окно маячит, как бы его скрыть. Может с параметрами какими запустить?
И еще пока не забыл: как прописать клиент как службу? Запускаю через -конфигонли, указываю что запускать как службу а ничего не запускается при рестарте. Может подскажет кто чего в реестре написать где?
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
vkToxa
vkToxa писал(а):
Запускаю через -конфигонли, указываю что запускать как службу а ничего не запускается при рестарте.
В смысле окошко не появляется или через Диспетчер задач проверяешь?
Я запуск как сервис без всяких -configonly делаю (хотя это достаточно простой вариант). Просто экспортирую вот такой reg файл и вся любовь.
Member
Статус: Не в сети Регистрация: 06.02.2008 Откуда: Москва
ПОМОГИТЕ!!! ГЛЮКАЮ!!!
началось все с того, что посчитанный результат мне не засчитали, начал разбор полета. Оказалось что в файле client осталось всего 2 строчки!!!
machineid=1
и ещё какя-то
ни client ни что либо другое не менял!!!
взял файл client с другой машины
заработало
смотрю client, а там опять 2 строчки осталось
по совету REX9895 снес файл client запустил клиент, заново ответил на все вопросы и поставил галочку в свойствах "тока для чтения". Все заработало. Расслабился. А рано!!!
тут началось 2 отделение кардабалета.
Прихожу вечером, а нифига не посчитано выдало ошибку в том духе, что "не активизировался ассемблеровский движок". Делаю презапуск клиента. Он подумал, нашел (нецензурное слово) этот движок и начал считать.
Вечерком была посчитана кучка процентов. Ну думаю наладилось. На ночь выключаю машину (не могу спать над ухом жужжит). Утром клиент помыкался, послал нахер это задание и взял другое. Я аж со стула чуть не упал увидив скорость. на шаг примерно 1 минута!!!
Но потом долго ржал, очков за задание 0 (ноль)
Цитата:
Конфигурация: Thorton 3100+ socket A, Radeon X1600 (400 MHz), 1024 DDR-400, XP SP2, 1GPU Номер задачи: 0 (71-59-4) Имя задачи: нет данных (возможно следует обновить базу по заданиям) Размер задачи: 19,0 КБ Размер результата: Очки: 0 Фреймы: 0 Ядро: IP сервера: Очков в час: Очков в сутки: Ср. время на шаг: 0:01:04 Client.cfg: bigpackets=no Завершено: 17% FahSpy 1.5.0
(bigpackets=no исправил на yes)
а с вечера это задание было посчитано на 40%
и вот с утра все заново. что за траблы?
Цитата:
[02:37:55] - Ask before connecting: No [02:37:55] - User ID: 21BB54F14051DF54 [02:37:55] - Machine ID: 1 [02:37:55] [02:37:56] Loaded queue successfully. [02:37:56] + Benchmarking ... [02:37:58] [02:37:58] + Processing work unit [02:37:58] Core required: FahCore_82.exe [02:37:58] Core found. [02:37:58] Working on Unit 01 [April 23 02:37:58] [02:37:58] + Working ... [02:37:58] [02:37:59] *------------------------------* [02:37:59] Folding@Home PMD Core [02:37:59] Version 1.03 (September 7, 2005) [02:37:59] [02:37:59] Preparing to commence simulation [02:37:59] - Looking at optimizations... [02:37:59] - Files status OK [02:37:59] - Expanded 12256 -> 74839 (decompressed 610.6 percent) [02:37:59] [02:37:59] Project: 4513 (Run 41, Clone 37, Gen 11) [02:37:59] [02:37:59] Assembly optimizations on if available. [02:37:59] Entering M.D. [02:38:28] (decompressed 610.6 percent) [02:38:28] [02:38:28] Project: 4513 (Run 41, Clone 37, Gen 11) [02:38:28] [02:38:28] Error: Could not write local file. Exiting. [02:38:33] - Shutting down core [02:38:33] [02:38:33] Folding@home Core Shutdown: FILE_IO_ERROR [02:39:19] ogfile size: 249216 [02:39:19] - Writing 249736 bytes of core data to disk... [02:39:19] ... Done. [02:39:19] [02:39:19] Folding@home Core Shutdown: EARLY_UNIT_END [02:39:23] CoreStatus = 72 (114) [02:39:23] Sending work to server
[02:39:23] + Attempting to send results [02:39:44] - Couldn't send HTTP request to server [02:39:44] + Could not connect to Work Server (results) [02:39:44] (169.230.26.30:8080) [02:39:44] - Error: Could not transmit unit 01 (completed April 23) to work server. [02:39:44] Keeping unit 01 in queue.
[02:39:44] + Attempting to send results [02:39:48] + Results successfully sent [02:39:48] Thank you for your contribution to Folding@Home. [02:39:49] - Preparing to get new work unit... [02:39:49] + Attempting to get work packet [02:39:49] - Connecting to assignment server [02:39:52] - Successful: assigned to (169.230.26.30). [02:39:52] + News From Folding@Home: Welcome to Folding@Home [02:39:52] Loaded queue successfully. [02:39:53] + Closed connections [02:39:58] [02:39:58] + Processing work unit [02:39:58] Core required: FahCore_82.exe [02:39:58] Core found. [02:39:58] Working on Unit 02 [April 23 02:39:58] [02:39:58] + Working ... [02:39:58] [02:39:58] *------------------------------* [02:39:58] Folding@Home PMD Core [02:39:58] Version 1.03 (September 7, 2005) [02:39:58] [02:39:58] Preparing to commence simulation [02:39:58] - Ensuring status. Please wait. [02:40:15] - Looking at optimizations... [02:40:15] - Working with standard loops on this execution. [02:40:15] - Previous termination of core was improper. [02:40:15] - Files status OK [02:40:15] - Expanded 19425 -> 121734 (decompressed 626.6 percent) [02:40:15] [02:40:15] Project: 4514 (Run 71, Clone 59, Gen 4) [02:40:15] [02:40:16] Error: Could not write local file. Exiting. [02:40:20] - Shutting down core [02:40:59] steps (1) [02:40:59] Writing checkpoint files [02:42:01] Writing local files [02:42:01] Completed 10000 out of 500000 steps (2) [02:42:01] Writing checkpoint files
Это обычно посде неудачной ручной правки так бывает. 3)
Инженегр писал(а):
не активизировался ассемблеровский движок
Дописать ключ -forceasm и будет принудительная активация 4)
Инженегр писал(а):
Но потом долго ржал, очков за задание 0 (ноль)
Базу данный в программе FahSpy обновлять не пробовал? 5) Какая файловая система? Похоже, что проблемы с записью на диск. Если так, то FAT32 - плохо, NTFS - хорошо. Добавлено спустя 1 минуту, 45 секунд 6)
Инженегр писал(а):
asknet=yes
Зачем стоит спрашивать о возможности работы с сетью? Со включением этой опции добавляется куча глюков.
_________________ Революционеров можно убить, идеи — никогда.
Member
Статус: Не в сети Регистрация: 06.02.2008 Откуда: Москва
1. Файловая система NTFS
2. В том то и дело что ничего не правил. потом несколько раз исправлял и останавляивая расчет и "на лету". Сохраняю. закрываю. Открываю. есть. Смотрю через FahSpy 2 строчки. Открываю опять блокнотом, точно 2 строчки. Я изматерился там весь. Взял файл client с другой машины. смотрю - опять 2 строчки осталось!!!
3. Хорошо попробую (это по пути ярлык - свойства - объект?)
4. Это как? По F6? пробовал не помогает
5. NTFS
6/ Это клиент с другой машины, которая не в сети. Забыл подправить. Добавлено спустя 20 минут, 34 секунды вот досчиталось нулевое задание и клиент пишет
Цитата:
[04:34:32] Completed 500000 out of 500000 steps (100) [04:34:32] Writing checkpoint files [04:35:32] [04:35:32] Finished Work Unit: [04:35:32] Leaving Run [04:35:37] - Writing 1130344 bytes of core data to disk... [04:35:37] ... Done. [04:35:37] - Shutting down core [04:35:37] [04:35:37] Folding@home Core Shutdown: FINISHED_UNIT
что это?
_________________ Боишься - не делай. Делаешь - не бойся.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 3
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения