Member
Статус: Не в сети Регистрация: 30.01.2006 Откуда: Химки
Вопрос про сообщение о trp файле перед начало расчетов. Пишет, что он в старом формате и что для уменьшения количества памяти и увеличения быстродействия его нужно обновить. Что это и можно ли обновить? Писало вроде всегда, просто сейчас озадачился.
Цитата:
NOTE: The tpr file used for this simulation is in an old format, for less memory usage and possibly more performance create a new tpr file with an up to date version of grompp
_________________ 5 мая начинается The Chimp Challenge '2010! Присоединяйся к российской команде! Инфо: http://forums.overclockers.ru/viewtopic.php?f=21&t=351237
Добрый день! У меня счетная машинка работает под CentOS 5.3 (полноценная установка, не VMWare). Вопрос: как корректно остановить FAH? Что то скачалось жирное, но потом расчет не пошел (судя по логам):
Код:
[02:27:24] + Attempting to get work packet [02:27:24] - Will indicate memory of 2001 MB [02:27:24] - Connecting to assignment server [02:27:24] Connecting to http://assign.stanford.edu:8080/ [02:27:24] Posted data. [02:27:24] Initial: 40AB; - Successful: assigned to (171.64.65.56). [02:27:24] + News From Folding@Home: Welcome to Folding@Home [02:27:25] Loaded queue successfully. [02:27:25] Connecting to http://171.64.65.56:8080/ [02:27:33] Posted data. [02:27:33] Initial: 0000; - Receiving payload (expected size: 1503451) [02:27:51] - Downloaded at ~81 kB/s [02:27:51] - Averaged speed for that direction ~82 kB/s [02:27:51] + Received work. [02:27:51] Trying to send all finished work units [02:27:51] + No unsent completed units remaining. [02:27:51] + Closed connections [02:27:51] [02:27:51] + Processing work unit [02:27:51] At least 4 processors must be requested.Core required: FahCore_a2.exe [02:27:51] Core found. [02:27:51] Working on queue slot 03 [August 20 02:27:51 UTC] [02:27:51] + Working ... [02:27:51] - Calling './mpiexec -np 4 -host 127.0.0.1 ./FahCore_a2.exe -dir work/ -suffix 03 -checkpoint 15 -forceasm -verbose -lifeline 2542 -version 624'
[02:27:51] [02:27:51] *------------------------------* [02:27:51] Folding@Home Gromacs SMP Core [02:27:51] Version 2.07 (Sun Apr 19 14:51:09 PDT 2009) [02:27:51] [02:27:51] Preparing to commence simulation [02:27:51] - Ensuring status. Please wait. [02:28:00] - Assembly optimizations manually forced on. [02:28:00] - Not checking prior termination. [02:28:01] - Expanded 1502939 -> 24031357 (decompressed 1598.9 percent) [02:28:01] Called DecompressByteArray: compressed_data_size=1502939 data_size=24031357, decompressed_data_size=24031357 diff=0 [02:28:01] - Digital signature verified [02:28:01] [02:28:01] Project: 2677 (Run 19, Clone 22, Gen 31) [02:28:01] [02:28:01] Assembly optimizations on if available. [02:28:01] Entering M.D. [04:06:56] - Autosending finished units... [August 20 04:06:56 UTC] [04:06:56] Trying to send all finished work units [04:06:56] + No unsent completed units remaining. [04:06:56] - Autosend completed [10:06:56] - Autosending finished units... [August 20 10:06:56 UTC] [10:06:56] Trying to send all finished work units [10:06:56] + No unsent completed units remaining. [10:06:56] - Autosend completed ..................... [22:06:56] - Autosending finished units... [August 23 22:06:56 UTC] [22:06:56] Trying to send all finished work units [22:06:56] + No unsent completed units remaining. [22:06:56] - Autosend completed [04:06:56] - Autosending finished units... [August 24 04:06:56 UTC] [04:06:56] Trying to send all finished work units [04:06:56] + No unsent completed units remaining. [04:06:56] - Autosend completed [10:06:56] - Autosending finished units... [August 24 10:06:56 UTC] [10:06:56] Trying to send all finished work units [10:06:56] + No unsent completed units remaining. [10:06:56] - Autosend completed
Процессор используется на 0%, и тишина. В top висят два процесса:
Проц у меня DualCore Intel Core 2 Duo E8400, 3000 MHz (9 x 333). В логе написано что то про 4 ядра. По ходу клиент скачал жабу которую он "ниасилит" и застопился? Посоветуйте, что делать.
RU_ZaBoR останавливается как обычно - Cntr+C в консоли.
Е8400 не может "ниасилить" - у меня Е6300 и бучгый Т9300 считают.
камрад Fergity дело говорит.
кстати, утром такая вот фигня феерическая случилась, впервые такое вижу
Код:
Program mdrun, VERSION 4.0.99_development_20090307 Source code file: nsgrid.c, line: 357
Range checking error: Explanation: During neighborsearching, we assign each particle to a grid based on its coordinates. If your system contains collisions or parameter errors that give particles very high velocities you might end up with some coordinates being +-Infinity or NaN (not-a-number). Obviously, we cannot put these on a grid, so this is usually where we detect those errors. Make sure your system is properly energy-minimized and that the potential energy seems reasonable before trying again.
Variable ci has value -2147483269. It should have been within [ 0 .. 9464 ]
For more information and tips for trouble shooting please check the GROMACS Wiki at http://wiki.gromacs.org/index.php/Errors
RU_ZaBoR останавливается как обычно - Cntr+C в консоли.
камрад Fergity дело говорит.
Хых. Ctrl+C в консоли не катит. Я подрубаюсь к машинке через SSH, а fah висит сервисом через:
Код:
# chkconfig: 345 93 14 # description: will start FAH client as a service cd /user/fah_smp; ./fah6 -smp -verbosity 9 < /dev/null > /dev/null 2>&1 &
Полагаю, надо выполнять kill с одним из параметров. Вопрос только с какой силой (SIG***) и в какой последовательности мочить: сначала ядра или сам fah.
Behc спасибо! Получилось покилять fah6 обычным SIGTERM. mpiexec и FahCore_a2.exe убились лишь SIGKILL. Потом удалил файлы ядер. Перезапустил фолдинг и о чудо, счет пошел! Было:
[13:24:26] Completed 0 out of 250000 steps (0%) [13:24:26] [13:24:26] Folding@home Core Shutdown: INTERRUPTED [13:24:31] CoreStatus = 66 (102) [13:24:31] + Shutdown requested by user. Exiting. Folding@Home Client Shutdown. На линуксе один клиент такое выдал А остальные три считают как ни в чём не бывало! Что-же это интересно за кака? Поиск по форуму ответа не дал.
Проблемы прдолжаются! После переустановки клиента получил подряд три CoreStatus = 7F (127) Client-core communications error: ERROR 0x7f и в итоге: + Sleeping...
И всё равно: подряд три CoreStatus = 7F (127) Client-core communications error: ERROR 0x7f и в итоге: + Sleeping... А три клиента продолжают счёт
Правда добавилась вот такая строка: Folding@Home will go to sleep for 1 day as there have been 5 consecutive Cores executed which failed to complete a work unit.
в новой строчке говорится о том, что после 5 безуспешных попыток досчитать фолдинг вырубается на сутки. такое было у меня при переразгоне. попробуйте проверить систему линпаком. просто бывает такое, что одно ядро из 4 - паршивая овца со всеми вытукающими... температура на том ядре какая?
захотел проверить КУДУ - посмотреть картики. что странно - не находится stubs-32.h:
Код:
roman@roman-desktop:~/NVIDIA_GPU_Computing_SDK/C/src/fluidsGL$ sudo make In file included from /usr/include/features.h:354, from /usr/local/cuda/bin/../include/host_config.h:68, from /usr/local/cuda/bin/../include/cuda_runtime.h:45, from <command-line>:0: /usr/include/gnu/stubs.h:7:27: error: gnu/stubs-32.h: No such file or directory make: *** [obj/release/fluidsGL.cu.o] Error 255
и вот еще одна странность:
Код:
roman@roman-desktop:~$ sudo ldconfig /sbin/ldconfig.real: ) is not a known library type Segmentation fault
roman@roman-desktop:~/fah/gpu/soft/cudart$ make winegcc -m32 -c -I/usr/local/cuda/include -DUSE_SLEEPWAIT=300000 -o cudart.o cudart.c cudart.c:1:21: error: windows.h: No such file or directory In file included from /usr/include/features.h:354, from /usr/include/limits.h:27, from /usr/lib/gcc/x86_64-linux-gnu/4.3.3/include-fixed/limits.h:122, from /usr/lib/gcc/x86_64-linux-gnu/4.3.3/include-fixed/syslimits.h:7, from /usr/lib/gcc/x86_64-linux-gnu/4.3.3/include-fixed/limits.h:11, from /usr/local/cuda/include/driver_types.h:60, from /usr/local/cuda/include/builtin_types.h:43, from /usr/local/cuda/include/cuda_runtime_api.h:54, from cudart.h:1, from cudart.c:2: /usr/include/gnu/stubs.h:7:27: error: gnu/stubs-32.h: No such file or directory cudart.c:3:24: error: wine/debug.h: No such file or directory cudart.c:18: warning: data definition has no type or storage class cudart.c:18: warning: parameter names (without types) in function declaration cudart.c:24: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘eventInitialized’ cudart.c:82: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘WINAPI’ cudart.c:99: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaConfigureCall’ cudart.c:113: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaGetDeviceProperties’ cudart.c:118: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaGetErrorString’ cudart.c:123: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaGetLastError’ cudart.c:133: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaLaunch’ cudart.c:206: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaMemcpy’ cudart.c:218: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaMemcpyFromSymbol’ cudart.c:224: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaMemcpyToSymbol’ cudart.c:230: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaRegisterFatBinary’ cudart.c:235: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaRegisterFunction’ cudart.c:243: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaRegisterVar’ cudart.c:250: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaRegisterShared’ cudart.c:255: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaRegisterSharedVar’ cudart.c:261: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaSetDevice’ cudart.c:266: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaUnregisterFatBinary’ cudart.c:271: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaFree’ cudart.c:276: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘wine_cudaMalloc’ winegcc: x86_64-linux-gnu-gcc failed make: *** [cudart.o] Error 2
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 12
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения