Member
Статус: Не в сети Регистрация: 01.08.2005 Откуда: Tver
Прошу поделиться людей с опытом блокировки серверов с неугодными заданиями собственными наработками в этом деле.
Сегодня блокирнул на проксе доступ к 171.64.122.138, т.к. оттуда прут одни сплошные Gromacs с крайне низким ppd. Какие меня теперь ждут "подводные камни"?
И вообще прошу поделиться вашими блэк-листами с комментариями...
_________________ Crunched UD: 22 года, FAD: 14 лет; Crunching Fah&Rah@50+Ghz (~87+ лет @ ~Core2Duo 2Ghz)
TSC! Russia member
Статус: Не в сети Регистрация: 22.03.2004 Откуда: Россия, Королев
IsiaNTвот мой лист все сервера что красным забанены + 171.64.122.138 (удосужился только сегодня), подводные камни, все очень просто клиент будет до посинения долбиться в один сервер и машина соответственно простаивать. Небольшой выход это завести несколько сервисов на одной машине, я у себя сделал везде 2 потока, даже на машинах без гипертрейдинга моменты одновременного подсчета 2 заданий сразу редки ................... а теперь убегай от меня
_________________ Найдем лекарство вместе!
Последний раз редактировалось Agafonov_KY 13.07.2006 9:22, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 01.10.2003 Откуда: Челябинск
IsiaNT Был такой опыт. Порядка 2 суток простоя. Потом клиент одумался и не эти серваки больше не обращается. Добавлено спустя 2 минуты, 51 секунду Agafonov_KY А ссылочка-то битая...
Member
Статус: Не в сети Регистрация: 01.08.2005 Откуда: Tver
мало того, что эти Gromacs'ы трафика жрут много, считаются на двухядерниках абы-кабы, так ещё и слетают на пустом месте... температура камня 59 град с 9600 Zalman'ом и первый сбой за 2-3 месяца:
[10:49:05] Protein: p761_vln3.3pbc
[10:49:05]
[10:49:05] Writing local files
[10:49:05] Extra SSE boost OK.
[10:49:05] Writing local files
[10:49:05] Completed 0 out of 500000 steps (0)
.............
[08:02:41] Completed 315000 out of 500000 steps (63)
[08:25:56] Writing local files
[08:25:57] Completed 320000 out of 500000 steps (64)
[08:40:33] Quit 101 - Fatal error:
[08:40:33] Step 323130, time 646.26 (ps) LINCS WARNING
[08:40:33] relative constraint deviation after LINCS:
[08:40:33] max 0.001185 (between atoms 489 and 491) rms 0.000059
[08:40:33]
[08:40:33] Simulation instability has been encountered. The run has entered a
[08:40:33] state from which no further progress can be made.
[08:40:33] This may be the correct result of the simulation, however if you
[08:40:33] often see other project units terminating early like this
[08:40:33] too, you may wish to check the stability of your computer (issues
[08:40:33] such as high temperature, overclocking, etc.).
[08:40:33] Going to send back what have done.
[08:40:33] logfile size: 20541
[08:40:33] - Writing 21222 bytes of core data to disk...
[08:40:33] ... Done.
[08:40:33]
[08:40:33] Folding@home Core Shutdown: EARLY_UNIT_END
[08:40:35] CoreStatus = 72 (114)
[08:40:35] Sending work to server
Мой блэк-лист сейчас следующий:
171.64.122.138
171.65.103.149
off: на почтовике тоже сегодня решил составить блэк-лист:
*@rmegion.ru *@rosbalt.ru *mygo.com *simpex.ru *theplanet.com *polenet.ru *.iks.ru *adexec.com *azultv.com - с них прут одни сплошные вири по 30-40 Кб штук по 20-30 в час...
_________________ Crunched UD: 22 года, FAD: 14 лет; Crunching Fah&Rah@50+Ghz (~87+ лет @ ~Core2Duo 2Ghz)
Member
Статус: Не в сети Регистрация: 22.10.2004 Откуда: Королёв
Tinker'ы тоже слетают
Вчера при перезагрузке на работе слетел тинкер, посчитанный больше чем на 50%. Не заметил. Ночью он слетел еще раз. Попытки восстановиться из бэкапов ни к чему не привели:
Цитата:
[04:32:40] Loaded queue successfully. [04:32:40] + Benchmarking ... [04:32:43] [04:32:43] + Processing work unit [04:32:43] Core required: FahCore_65.exe [04:32:43] Core found. [04:32:43] Working on Unit 01 [July 14 04:32:43] [04:32:43] + Working ... [04:32:43] Folding@Home Client Core Version 2.53 (June 29, 2004) [04:32:43] [04:32:43] Proj: work/wudata_01 [04:32:43] Done: 22864 -> 142982 (decompressed 625.3 percent) [04:32:43] nsteps: 5000000 dt: 2.000000 dt_dump: 250.000000 temperature: 298.000000 [04:32:43] xyzfile: [04:32:43] " 393 p1110_L939_K12M_nat_min1 [04:32:43] 1 N -202.685175 89.698262 100.893978..." [04:32:43] keyfile: [04:32:43] "parameters ./proj1110.prm [04:32:43] NOVERSION [04:32:43] ARCHIVE [04:32:43] [04:32:43] cutoff 16.0 [04:32:43] taper 12..." [04:32:43] [04:32:43] Hashes matched on file work/wudata_01.dyn [04:32:43] Header on frame 211 differs from expected header [04:32:43] Got: 160456-220003-44B39F89-60C2D273: 0211 [04:32:43] Expected: 160456-220003-44B39F89-60C2D273: 0212 [04:32:44] Starting from initial work packet [04:32:44] [04:32:44] Protein: p1110_L939_K12M_nat_min1 [04:32:44] - Run: 22 (Clone 3, Gen 34) [04:32:44] - Frames Completed: 0, Remaining: 400 [04:32:44] - Dynamic steps required: 5000000 [04:32:44] [04:32:44] Writing local files: [04:32:44] [04:32:44] parameters work/wudata_01.prm [04:32:44] - Writing "work/wudata_01.key": (overwrite) successful. [04:32:44] - Writing "work/wudata_01.xyz": (overwrite) successful. [04:32:46] - Writing "work/wudata_01.prm": (overwrite) successful. [04:32:50] - Writing "work/wudata_01.key": (append) successful. [04:32:50] [04:32:50] PROJECT="work/wudata_01", NSTEPS=5000000, DT=2.0000, DTDUMP=25.000000, TEMP=298.00 [04:32:51] TINKER: Software Tools for Molecular Design [04:32:51] Version 3.8 October 2000 [04:32:51] Copyright (c) Jay William Ponder 1990-2000 [04:32:51] portions Copyright (c) Michael Shirts 2001 [04:32:51] portions Copyright (c) Vijay S Pande 2001 [04:41:55] Finished a frame (1)
Member
Статус: Не в сети Регистрация: 22.10.2004 Откуда: Королёв
WildCat Вот именно!
Только это запуск с данными, восстановленными из бэкапа (250 фреймов).
В бэкапе - вся папка work и файл queue.dat. Для других ядер этого хватало (дома слетали GB, и D, и обычные громаксы - все восстанавливалось из бэкапа нормально).
Member
Статус: Не в сети Регистрация: 10.12.2002 Откуда: Cherkassy
хай всем
блин зашел на стату посотреть и офигел, как вы все считаете у меня например 32 - UA_kvn_z - 110780 - 2518 , у всех шо возле меня посчитаных WU - 300-700, а у меня 2518, как вы так считаете шо делаете, давно небыло меня тут, може шота вы научились новому ?
Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
kvn z Это не мы, это ты. У тебя из-за переразгона постоянно "слетают" недосчитанными жабы, и отправляются недосчитанными на сервер. В итоге очков мало, а заданий много...
Надо или разгон сбрасывать, или охлаждение улучшать.
Member
Статус: Не в сети Регистрация: 22.10.2004 Откуда: Королёв
norlang писал(а):
у меня такой вопрос: какой type мне поставить в настройках чтобы минимизировать трафик - а то через gprs по 3-5 мб сливать не очень прикольно
type=2 (и bigpackets=no ) - почти гарантированно - Tinker: 20kB in / 1500 out
type=3 - GB: аналогично
а если повезет с серией 25хх - то до 370out
type=1 (? вроде бы) - Amber - 80/380 - но я уже не помню, когда их получал
p.s. при 1 и 3 могут падать и обычные громаксы (есть и с малым трафиком, есть и с большим)
p.p.s. Подробнее смотри у Agafonov_KY:
http://www.podm.ru/fad/fh/stat/stat.FH.rar
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения