полностью посчитанные жабы ни у кого не отваливаются с ошибкой инициализации MPICH? костыль как лечить нашел, но вот почему так стало - непонятно... на форуме докторов молчок. седня буду копать плотно...
targitaj странно даже не то, что я скачал клиента по-новой, а он опять так же вылетает, а то, что сие случилось одновременно на 3-х клиентах (считают они по очереди, потому как с работы отправлять жабы не могу, только с дома). сегодня убью fah_core и скачаю клиента еще раз. не поможет - даже не знаю, что может быть за причина: или вмваря, или убунта... почему-то повреждается queue.dat
Moderator
Статус: Не в сети Регистрация: 03.05.2005 Откуда: Московская обл. Фото: 547
targitaj писал(а):
Что же такое, почему у меня на всех линуксовых машинах смп после отправки останавливается??? Процесс консоли остаётся висеть и ничего не делать
Нормально считается. Там просто есть временной лаг между отправкой и новым стартом
Код:
[05:45:53] Completed 247500 out of 250000 steps (99%) [05:57:16] Completed 250000 out of 250000 steps (100%) [05:57:17] DynamicWrapper: Finished Work Unit: sleep=10000 [05:57:27] [05:57:27] Finished Work Unit: [05:57:27] - Reading up to 21120768 from "work/wudata_02.trr": Read 21120768 [05:57:29] trr file hash check passed. [05:57:29] - Reading up to 4540404 from "work/wudata_02.xtc": Read 4540404 [05:57:29] xtc file hash check passed. [05:57:29] edr file hash check passed. [05:57:29] logfile size: 183646 [05:57:29] Leaving Run [05:57:30] - Writing 25989570 bytes of core data to disk... [05:57:30] ... Done. [05:57:35] - Shutting down core [05:57:35] [05:57:35] Folding@home Core Shutdown: FINISHED_UNIT [06:00:51] CoreStatus = 64 (100) [06:00:52] Unit 2 finished with 27 percent of time to deadline remaining. [06:00:52] Updated performance fraction: 0.406559 [06:00:52] Sending work to server [06:00:52] Project: 2669 (Run 12, Clone 14, Gen 121)
***здесь всякая ерунда об отправке и т.п.
[06:27:50] Folding@Home Gromacs SMP Core [06:27:50] Version 2.07 (Sun Apr 19 14:51:09 PDT 2009) [06:27:50] [06:27:50] Preparing to commence simulation [06:27:50] - Ensuring status. Please wait. [06:28:00] - Assembly optimizations manually forced on. [06:28:00] - Not checking prior termination. [06:28:01] - Expanded 4842320 -> 24001453 (decompressed 495.6 percent) [06:28:01] Called DecompressByteArray: compressed_data_size=4842320 data_size=24001453, decompressed_data_size=24001453 diff=0 [06:28:01] - Digital signature verified [06:28:01] [06:28:01] Project: 2675 (Run 0, Clone 89, Gen 130) [06:28:01] [06:28:01] Assembly optimizations on if available. [06:28:01] Entering M.D. [06:28:11] Completed 0 out of 250000 steps (0%)
Итого 30 минут 55 секунд.
starche_old писал(а):
полностью посчитанные жабы ни у кого не отваливаются с ошибкой инициализации MPICH? костыль как лечить нашел, но вот почему так стало - непонятно... на форуме докторов молчок. седня буду копать плотно...
Бывает изредка, но досчитывается, отправляется и засчитывается, скачивается новое и считает дальше.
Advanced member
Статус: Не в сети Регистрация: 26.08.2005 Откуда: 34
Люди, скажите, как расшарить папку для фахспая не включая убунту в домен? Самбу поднял, в винде всё видится. При этом в окнах нормально можно открывать лог. Т.е. фахспай пытается с доменной учёткой лезть в убунту и получает от туда болт Чую надо или пользователя доменного подсунуть в доступ или запускать отдельный фахспай под каким-то не доменным пользователем (с локальной учёткой). Добавлено спустя 1 час, 26 минут, 56 секунд
starche_old писал(а):
полностью посчитанные жабы ни у кого не отваливаются с ошибкой инициализации MPICH?
Member
Статус: Не в сети Регистрация: 22.05.2004 Откуда: Санкт-Петербург
Behc +1.
на убунте должна быть расшарена папка с FAH, средствами убунты это делается где-то через верхнее меню, там ищется и жмётся пункт, который называется наподобие "расшарить папку (SMB)". далее с виндового компа к убунте можно получить доступ, набрав в "пуск - выполнить"
Код:
\\имя_компа_с_убунтой
, тут же винда спросит логин-пароль пользователя на убунте и (если это не XP home edition) предложит поставить галку "сохранить пароль", которая позволит больше не запрашивать пароль на соединение с этой шарой (включая вариант перезагрузки компа).
Advanced member
Статус: Не в сети Регистрация: 26.08.2005 Откуда: 34
Behc Естественно пробовал, не выходит - фах спай не хочет работать через сетевой диск FilterIZVR Убунта серверная, надо в конфиге самбы прописать пользователя, логин пароль.. а у меня мозгов пока не хватило. Хотя можно попробовать отключить в убунте гостевой вход, вдруг запросит имя\пароль...
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
LAV48 Я обычно ставлю Webmin и уже через него все настраиваю.
В Samba ubuntu почему-то пользователи автоматически не добавляются, их надо сперва прописать/подключить. Вот можно почитать, где-то ближе к середине.
_________________ Революционеров можно убить, идеи — никогда.
Advanced member
Статус: Не в сети Регистрация: 26.08.2005 Откуда: 34
Behc Всё б хорошо, но у меня домен и консольный линух на виртуальной машине.., а ещё я в лине 0,00001 Пока юзаю копирование в виндовую папку (просто в тотале) Может позже надумаю включить убунту в домен (с десктопной версией у меня не получилось, посмотрим как с сервером и консолью управлюсь).
Так, ну помогайте!
Поставил Убунту 9.4, с помощью ФАК-а запустил 4 SMP клиента, (2-я в профиле машина) - РАБОТАЮТ!! (не так оказался страшен чёрт...). Собственно прошу помощи по привязке клиентов на Nehaleme, если можно "на пальцах" и по русски, ну и главное мониторинг - бы через ФахСпая настроить, тогда "Обезьяна" ещё тысяч восемь наверное получит. Всё хлеб!
Member
Статус: Не в сети Регистрация: 30.01.2006 Откуда: Химки
АлексЕ, 8 тысяч в номинале?
_________________ 5 мая начинается The Chimp Challenge '2010! Присоединяйся к российской команде! Инфо: http://forums.overclockers.ru/viewtopic.php?f=21&t=351237
Member
Статус: Не в сети Регистрация: 06.03.2008 Откуда: Москва
АлексЕ В логах вроде бы криминала нет (что конкретно пишет у меня смогу посмотреть только вечером дома).
Проверить, что процессы распределились на нужные ядра можно в системном мониторе (Система->Администрирование->Системный монитор).
_________________ Помогите нашей Российской обезьянке TSCh!mp ! подробности тут: http://forums.overclockers.ru/viewtopic.php?f=50&t=441789
Проверить, что процессы распределились на нужные ядра можно в системном мониторе (Система->Администрирование->Системный монитор).
Проверил, уменя там теперь целых 20 процессов FahCore_a2.
Перезагрузиться?
Перезагрузка. 1 клиент начал считать это-же задание сначало,
[13:07:23]
[13:07:23] Project: 2669 (Run 15, Clone 26, Gen 52)
[13:07:23]
[13:07:23] Assembly optimizations on if available.
[13:07:23] Entering M.D.
[13:07:29] Using Gromacs checkpoints
[13:07:33]
[13:07:33] Entering M.D.
[13:07:39] Using Gromacs checkpoints
[13:07:41] _01.log has changed since last checkpoint
[13:07:45] CoreStatus = FF (255)
[13:07:45] Sending work to server
[13:07:45] Project: 2669 (Run 15, Clone 26, Gen 52)
[13:07:45] - Error: Could not get length of results file work/wuresults_01.dat
[13:07:45] - Error: Could not read unit 01 file. Removing from queue.
[13:07:45] - Preparing to get new work unit...
[13:07:45] + Attempting to get work packet
[13:07:45] - Connecting to assignment server
[13:07:47] - Successful: assigned to (171.64.65.56).
[13:07:47] + News From Folding@Home: Welcome to Folding@Home
[13:07:47] Loaded queue successfully.
[13:08:19] + Closed connections
а остальные продолжили нормально.
Что-то криво привязка получилась:weep:
Последний раз редактировалось АлексЕ 20.05.2009 16:21, всего редактировалось 1 раз.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения