Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
Hashish Ну, на 160 можно особо не спешить. Только вот уверен ли ты, что дело в сервере, а не у тебя какие-то проблемы с интернетом? Может, злой админ заблочил порты или сервер в блэклист внёс?
Hil Ты оказался прав. Не знаю с какого бодуна такое началось, но помогла отключение антивируса на аппаратном файрволе Juniper SSG5. При том, что до этого он совершенно не мешал ФАХу, да и с других машин отправляется всё нормал. Возможно дело в размере жабы, которая заставила антивирус задуматься, а клиент распсиховался и решил, что таймаут.
targitaj Я читал там дядя командир писал в новостях на оф. сайте, что они апгрейдят коллекшн сервер. Думал может чего накосячили, ln с rm перепутали или наподобие. Но уже разрешилось.
Member
Статус: Не в сети Регистрация: 27.08.2006 Откуда: Moscow
Сегодня утром на меня снизошло прозрение Сменил вчера комбинацию Outpost Firewall+NOD32 на Comodo Firewall+Avast!, и о чудо! FAH начал корректно закрываться, с первых попыток начинал возобновлять расчеты и ни разу бекапы заданий не пригодились, всякие IO_EROR и т.д исчезли! К тому же исчезли некоторые глюки с другими прогами, так SpeedFan после его закрытия оставался висеть в памяти, грешил на бедную прогу, оказалось она тут совсем не причем. Сегодня вечером прийду посмотрю пропал ли глюк когда задание заканчивало считаться и следующее не считалось. Мне кажется дело было все-таки в антивире. Вот такие пироги товарищи.
Member
Статус: Не в сети Регистрация: 06.07.2004 Откуда: РФ Фото: 6
Только что удалось слить задание, которое не могло слиться. Размер результата около 56 мегабайт. Слиться не могло через прокси, Проксомитрон. Перенаправил этот прокси на другой, второй проксомитрон, который выходит в инет по НАТу. Слилось. Опять двадцать пять... Что за нелюбовь такая к проксикам??? Добавлено спустя 44 минуты, 33 секунды
Цитата:
[09:47:49] Loaded queue successfully. [09:47:49] Attempting to return result(s) to server... [09:47:49] Trying to send all finished work units
[09:47:49] + Attempting to send results [09:47:49] - Reading file work/wuresults_00.dat from core [09:47:49] (Read 52427776 bytes from disk) [09:47:49] Connecting to http://171.64.65.65:8080/ [10:08:03] Posted data. [10:08:03] Initial: 0000; - Uploaded at ~42 kB/s [10:08:03] - Averaged speed for that direction ~34 kB/s [10:08:03] - Server reports packet it received an incomplete payload. [10:08:03] (May be due to packet loss during network transmission or a corrupted file.) [10:08:03] - Error: Could not transmit unit 00 (completed April 30) to work server. [10:08:03] - 138 failed uploads of this unit.
[10:08:03] + Attempting to send results [10:08:03] - Reading file work/wuresults_00.dat from core [10:08:03] (Read 52427776 bytes from disk) [10:08:03] Connecting to http://171.65.103.100:8080/ [10:08:04] - Couldn't send HTTP request to server [10:08:04] + Could not connect to Work Server (results) [10:08:04] (171.65.103.100:8080) [10:08:04] Could not transmit unit 00 to Collection server; keeping in queue.
Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
Камрады. Можете меня пристрелить, коли вру, но у меня на работе интернет для главной машины напрямую, остальные через проксомитрон на главной ходят. На всех машинах стоит аутпост версий от 3 до 4, по-разному. После начальной настройки проксомитрона (были глючки) с тех пор ни одного раза не было, чтобы по непонятным причинам был затык. Только если с серверами у докторов проблемы. И слив, и закачка, и блокировка нехороших серверов - всё протекает без проблем. ОС вин2000 или винХР (на 1 машине). Нигде проблем нет.
Поэтому никак не пойму, с чем проблемы у всех. Или одни и те же программы на одних и тех же ОС так по-разному работают, или тут что-то другое.
Советую отключать сразу и нахрен все расширенные функции защиты аутпоста - контроль компонентов, памяти процессов и т.п. Вот это точно вредит больше, чем помогает.
Member
Статус: Не в сети Регистрация: 27.08.2006 Откуда: Moscow
Hil
Цитата:
Советую отключать сразу и нахрен все расширенные функции защиты аутпоста - контроль компонентов, памяти процессов и т.п. Вот это точно вредит больше, чем помогает.
Возможно так и было, поскольку все они у меня были включены, но провести доп. исследование увы не удастся, сменил свой девиз - теперь я за альтернативный, опенсорсный и безглючный софт!
Поделюсь своими наблюдениями ибо сегодня первый раз столкнулся с ошибками FFFFFFFF и Initial: 0000; - Successful: assigned to (0.0.0.0) для которой дохтора делают фиксы и рекомендуют ждать очередного релиза(If you are assigned to 0.0.0.0, there's nothing you can do except to wait for the guys at Stanford to fix the problem).
Начал копать, вспомнил что ставил Hamchi, который в свою очередь почему-то плохо переваривается файрволом при загрузке винды+добавляет новый сетевой интерфейс, которому я благополучно сделал Disable. Возможно у Fah в свою очередь плохая реакция на задизэйбленные или виртуальные сетевые интерфейсы ибо различные пляски с бубном не помогали, зато когда снес Hamachi всё заработало.
Member
Статус: Не в сети Регистрация: 27.08.2006 Откуда: Moscow
Вчера отправлял результаты и в логах сначала написало что типа про такое задание мы нифига не знаем попробуйте позже, при этом задание туда перед этим полностью слилось. Через 5 мин. снова попробовал, снова слилось но уже засчиталось.
Кстати, после смены файрвола и антивиря, о чем я писал выше, ушел баг, когда посчитанное задание отправлялось, а новое не считалось.
Advanced member
Статус: Не в сети Регистрация: 12.06.2004 Откуда: Николаев, UA
Камрады, думал я что перегрев, а кажись это не он. Жабки некоторые дохнут в самом начале:
Цитата:
[11:48:30] Completed 960000 out of 4000000 steps (24) [12:03:31] Timered checkpoint triggered. [12:10:48] Writing local files [12:10:48] Completed 1000000 out of 4000000 steps (25) [12:25:49] Timered checkpoint triggered. [12:30:38] Quit 101 - Fatal error: [12:30:38] Step 1035049, time 2070.1 (ps) LINCS WARNING [12:30:38] relative constraint deviation after LINCS: [12:30:38] max 0.548956 (between atoms 236 and 237) rms 1.#QNAN0 [12:30:38] [12:30:38] Simulation instability has been encountered. The run has entered a [12:30:38] state from which no further progress can be made. [12:30:38] This may be the correct result of the simulation, however if you [12:30:38] often see other project units terminating early like this [12:30:38] too, you may wish to check the stability of your computer (issues [12:30:38] such as high temperature, overclocking, etc.). [12:30:38] Going to send back what have done. [12:30:38] logfile size: 63552 [12:30:38] - Writing 64234 bytes of core data to disk... [12:30:38] ... Done. [12:30:38] [12:30:38] Folding@home Core Shutdown: EARLY_UNIT_END [12:30:41] CoreStatus = 72 (114) [12:30:41] Sending work to server
Это 3405 (3-510-4).
_________________ Опасайтесь ваших желаний - они могут сбыться... TSC! Russia Member; *Cofradia Intel*; пенсионер оверклокинга.
Member
Статус: Не в сети Регистрация: 12.10.2006 Откуда: РОССИЯ ОРЕНБУРГ
Полная попа....
уже пятое здание:
Name: p3049_human_hpin1_m1_99p_373K
Download time: May 28 09:06:29
Due time: August 2 09:06:29
Progress: 2% [__________]
и все на 2% заканчиваются...
А теперь и ни одно задание не может принять......
Код:
[03:36:08] Couldn't send HTTP request to server (wininet) [03:36:08] + Could not connect to Work Server (results) [03:36:08] (171.65.103.100:8080) [03:36:08] Could not transmit unit 02 to Collection server; keeping in queue. [03:36:08] + Sent 0 of 1 completed units to the server [03:36:08] - Autosend completed [03:36:20] + Attempting to get work packet [03:36:20] - Will indicate memory of 380 MB [03:36:20] - Connecting to assignment server [03:36:20] Couldn't send HTTP request to server (wininet) [03:36:20] + Could not connect to Assignment Server [03:36:20] Couldn't send HTTP request to server (wininet) [03:36:20] + Could not connect to Assignment Server 2 [03:36:20] + Couldn't get work instructions. [03:36:20] - Error: Attempt #2 to get work failed, and no other work to do. Waiting before retry.
уже 2 сутки.....
Фаервола нету!!!!!
_________________ ДОБРО ПОБЕДИТ ЗЛО!!! ПОТОМ ПОСТАВИТ НА КОЛЕНИ И ЗВЕРСКИ УБЬЕТ!
Присоединяйтесь к TSC! Russia - www.tsc.overclockers.ru RUSSIA FOREVER!!!
Member
Статус: Не в сети Регистрация: 12.10.2006 Откуда: РОССИЯ ОРЕНБУРГ
Hil Хочешь сказать заблокировал ip раздающего сервера ?
Так вообще на все сайты попадаю, включая статистику стенфорда...
В бравузере 171.65.103.100 пишет OK!!!!
_________________ ДОБРО ПОБЕДИТ ЗЛО!!! ПОТОМ ПОСТАВИТ НА КОЛЕНИ И ЗВЕРСКИ УБЬЕТ!
Присоединяйтесь к TSC! Russia - www.tsc.overclockers.ru RUSSIA FOREVER!!!
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения