Исходное сообщение: Подумал, что рационально завести тут на какое-то время - до появления нормального клиента SMP-Win, такую тему.
На самом деле, обобщая собственный опыт, могу предположить, что будет рационально пускать такую штуку на круглосуточно включенных машинах, но не очень удобно - на тех, что работают только часть суток. Во-первых, сложновато заставить всё запускаться автоматически (ну, а замаскировать эту штуку толком вообще нереально), во-вторых, дедлайн поджимает, в-третьих, когда я попытался сегодня возобновить расчёт, получил ошибку и был отправлен на закачку нового задания. Что, естественно, делает невозможным завершить хотя бы одно.
TSC! Russia member
Статус: Не в сети Регистрация: 02.10.2003 Откуда: Ревель.Колывань Фото: 3
Вобла!!!!! После совсем незапланированного выключения компа из розетки, БигЖаба, перенесённая из ВиртуалБокса в 6-поточную ВмВарю и просчитанная на 80% отказалась умирать и продолжила считацца с чекпойнта. Сижу, офигевший.
Member
Статус: Не в сети Регистрация: 25.12.2007 Откуда: Красноярск
spider66, исходя из моего опыта, обесточивание - это самый надежный способ остановки бигжаб, ещё ни одна так не сдохла
Добавлено спустя 25 минут 55 секунд: Оба-на! Чуть не сглазил. Рубанули свет на секунду, после включения компьютера жаба в виртуалке продолжила счет с 91%
_________________ Доктор едет-едет сквозь снежную равнину, Порошок целебный людям он везет.
Интересно, в каких пределах может изменяться время расчета одного шага? Оставил комп спецом на сутки, не трогал его, мониторил исключительно по сети, т.е "лишних" воздействий по минимуму. Так вот время шага варьировалось от 55:05 до 55:17.
[16:15:37] - Ask before connecting: No [16:15:37] - User name: t4tune (Team 47191) [16:15:37] - User ID: 177CF6D05EEE0184 [16:15:37] - Machine ID: 1 [16:15:37] [16:15:37] Loaded queue successfully. [16:15:37] - Preparing to get new work unit... [16:15:37] - Autosending finished units... [June 11 16:15:37 UTC] [16:15:37] Trying to send all finished work units [16:15:37] + No unsent completed units remaining. [16:15:37] - Autosend completed [16:15:37] Cleaning up work directory [16:15:37] + Attempting to get work packet [16:15:37] Passkey found [16:15:37] - Will indicate memory of 4457 MB [16:15:37] - Connecting to assignment server [16:15:37] Connecting to http://assign.stanford.edu:8080/ [16:15:38] Posted data. [16:15:38] Initial: 43AB; - Successful: assigned to (171.67.108.22). [16:15:38] + News From Folding@Home: Welcome to Folding@Home [16:15:38] Loaded queue successfully. [16:15:38] Connecting to http://171.67.108.22:8080/ [16:16:16] Posted data. [16:16:16] Initial: 0000; - Receiving payload (expected size: 30239606) [16:34:48] - Downloaded at ~26 kB/s [16:34:48] - Averaged speed for that direction ~115 kB/s [16:34:48] + Received work. [16:34:48] + Closed connections [16:34:48] [16:34:48] + Processing work unit [16:34:48] Core required: FahCore_a2.exe [16:34:48] Core found. [16:34:48] Working on queue slot 08 [June 11 16:34:48 UTC] [16:34:48] + Working ... [16:34:48] - Calling './mpiexec -np 8 -host 127.0.0.1 ./FahCore_a2.exe -dir work/ -nice 19 -suffix 08 -checkpoint 15 -forceasm -verbose -lifeline 993 -version 629'
[16:34:49] CoreStatus = 7E (126) [16:34:49] Client-core communications error: ERROR 0x7e [16:34:49] Deleting current work unit & continuing... [16:35:01] - Warning: Could not delete all work unit files (8): Core file absent [16:35:01] Trying to send all finished work units [16:35:01] + No unsent completed units remaining. [16:35:01] - Preparing to get new work unit... [16:35:01] Cleaning up work directory [16:35:01] + Attempting to get work packet [16:35:01] Passkey found [16:35:01] - Will indicate memory of 4457 MB [16:35:01] - Connecting to assignment server [16:35:01] Connecting to http://assign.stanford.edu:8080/ [16:35:03] Posted data. [16:35:03] Initial: 43AB; - Successful: assigned to (171.67.108.22). [16:35:03] + News From Folding@Home: Welcome to Folding@Home [16:35:03] Loaded queue successfully. [16:35:03] Connecting to http://171.67.108.22:8080/ [16:35:42] Posted data. [16:35:42] Initial: 0000; - Receiving payload (expected size: 30239606)
Что было сделано 1. Переустановлена винда 2. Установлена вмваря 7.1 3. Сэмулирована сборка FAH 1.2 и с нуля вручную настроен клиент
Что вышло 1. Клиент сразу получил бигжабу на ядре А3 и благополучно ее сегодня досчитал. После этого пошла эта канитель. Как от этого избавиться? Если дело в линухе - то если кто знает и ему не в лом, то какой-нибудь пошаговый мануал, где что и как сделать.
Еще могу добавить - эта же самая вмваря с линухой ставилась еще на две машины - там таких проблем нет
UPDATE: Снес клиент из вмвари, поставил заново, настроил - загрузилось ядро А2, считает. Посмотрим не вернется ли глюк после подсчета
Сейчас этот форум просматривают: TimopheySnz и гости: 5
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения