Advanced member
Статус: Не в сети Регистрация: 16.12.2002 Откуда: TSC! | Москва
Тема предназначена для тех, кто ещё не очень хорошо разбирается в структуре форума и не знает, где искать ответы на вопросы, и где лучше задать вопрос. Если вы более-менее освоились, пожалуйста, используйте тематические ветки для того, чтобы задавать вопросы.
Внимание! Прежде чем задавать вопрос, рекомендуется посетить тему "[TSC!] Общий FAQ". Также можно воспользоваться поиском по этому форуму (через "Расширенный поиск" выберите поиск только в форуме нашей команды и введите нужный контекст).
подскажите как спровоцировать отправку?
и есть какие нить соображения почему не идет?
Код:
[16:22:40] + Attempting to send results [February 25 16:22:40 UTC] [16:22:41] - Couldn't send HTTP request to server [16:22:41] + Could not connect to Work Server (results) [16:22:41] (171.65.103.100:8080) [16:22:41] + Retrying using alternative port [16:24:42] - Couldn't send HTTP request to server [16:24:42] + Could not connect to Work Server (results) [16:24:42] (171.65.103.100:80) [16:24:42] Could not transmit unit 01 to Collection server; keeping in queue.
п.с. 171.65.103.100 прингуется.
_________________ Все равно вы никогда не поймете, что думать -- это не развлечение, а обязанность... (c)
я особо не запариваюсь.. пусть считает дальше.. до дед лайна еще далеко.
пытался разобраться с http://fah-web.stanford.edu/serverstat.html не вышло, зачем так сложно все делать!? Добавлено спустя 2 минуты, 18 секунд хотя с этого текста
Код:
128.59.74.4 - foldathome - FAIL Reject
похоже что с сервером не лады.
_________________ Все равно вы никогда не поймете, что думать -- это не развлечение, а обязанность... (c)
Не подскажите, чота GF9500GT не запускается, хотя должна, говорит, что не найден файл типа cuda*.dll хотя все что надо поставил, дрова 180,2 с Cuda, Net-FW2.0, клиент, и т.д.
С Радиком было проще, поставил клиент, запустил, открыл, а он уже считает, сорри за оффтоп, вроде бы все правильно сделал, но чета не идет.
Запуск только клиента 1 (ID#1): загрузка GPU 99.9%, температура GPU: 65, частоты 600/400 (дефолтные). Загрузка CPU 50%, температура CPU 48. Среднее PPD 470, PPH 20 (GROGPU2)
Запуск дополнительно к первому клиента 2 (ID#2): загрузка CPU 98%, температура CPU 54, все остальное для GPU без изменений. Среднее PPD 70, PPH 3 (GROMACS)
Вывод: клиент для CPU запущенный паралельно с GPU совершенно ничем не влияет на скорость расчета GPU. Просто дает дополнительное количество очков, но очень уж мизерное. Клиент GPU запущенный отдельно - всегда грузит CPU на 50%, не реагируя на слайдер приоритета. Потому и решил пускать CPU паралельно GPU, чтобы грузился проц по полной. Но, клиент GPU прилично просаживает PPD для CPU, если сравнивать чистый CPU и CPU+GPU.
Если верить тестам бенчмарка vs тестам реальным, то можно получить с системы:
833ppd при одном потоке GPU vs 500ppd при одном потоке GPU
407ppd при одном потоке CPU vs 36ppd при одном потоке CPU
490ppd при двух потоках CPU vs ppd при двух потоках CPU
???ppd при потоках CPU+GPU vs 450+70=520ppd при потоках CPU+GPU
Но в итоге - совершенно непонятно, почему связка из 2х приносит столь мало очков. Особенно при условии, что одиночный запуск грузит проц только на 50%, а включив второй поток на еще +50% мы получаем не +50% ppd а какой-то жалкий довесок. И абсолютно непонятна ситуация, почему один CPU дает 36ppd, а стоит запустить в дополнение GPU, то CPU выдает 70ppd (в довесок к 450ppd от GPU).
Вопросы для обладателей близких по уровню систем -
Насколько адекватны показатели PPD для CPU & GPU? По средней статистике на форумах hd2600pro должна выдавать 950ppd, почему у меня так мало?
Статистика по PPD для CPU - вообще странная. Да, GPU шустрее, но не настолько же? Если ориентироваться на бенчмарк, то 830ppd для GPU еще сравнимо с общей статистикой для hd2600pro, а реальное 477PPD хоть и меньше, но терпимо. Но вот разница в бенчах для CPU ppd и реальное 68ppd это странно.
TOC F@H Bench v0.4.7.0
GPU ATI(+) *быстрый*, задача 4736, ядро GROUGPU2/ATI, 1 поток. PPD= 833ppd (727сек). CPU 50%
GPU ATI(+) *быстрый*, задача 4736, ядро GROUGPU2/ATI, 2 потока. PPD= 843ppd (1442сек). CPU 98%
СPU DGROMACS 1(+) *быстрый*, задача 3852, ядро DGROMACSB, 1 поток. PPD= 407ppd (1453сек). CPU 50%
СPU DGROMACS 1(+) *быстрый*, задача 3852, ядро DGROMACSB, 2 потока. PPD= 490ppd (2445сек). CPU 98%
вопрос: а как такое может быть, что для 2х потоков мы получили даже чуть больше PPD, если время исполнения стало в два раза дольше и в двое возросла загрузка CPU?
вопрос: на всех тестах CPU/GPU наблюдается одинаковое явление - стартует на очень приличной скорости, а потом чем дальше тем все меньше и меньше. Итоговая скорость приведена в строчках. Так и должно быть, а онлайновое изменение PPD в бенче это просто усредненное значение, а не реалтайм?
Дополнительные проблемы:
Не могу поставить ничего свежее каталиста 8.5, что лежит на сайте PowerColor. Все, что скачивается с АМД (9.2 в т.ч.) отваливается на первом этапе установки с сообщением, что "совместимого железа не найдено". Авторы на карту явно плюнули и ничего свежее выкладывать не собираются. А она AGP, от PCI-E дрова не встают.
Система полностью автопилотна 24ч/7д и стабильна, наличие в памяти клиента GPU ни в малейшей степени не влияет на просмотр видео и игры вроде Lineage/Diablo ни разу ничего не падало в процессе - ни игры, ни клиент. Причем, при паралельной игре+GPU нет тормозов абсолютно! А вот в режиме "простоя" идут постоянные косяки с UNSTABLE_MASHINE, расчетами начал заниматься 12.02, ровно две недели круглосуточной работы - всего 4 (ЧЕТЫРЕ) выполненных задания! Считаем-считаем, бывало до 99%, а потом хлоп - унстабле и клиент "радостно" начинает все рассчитывать заново. Кто виноват и что делать? Разгона = ноль. Перегрева = ноль. Все стабильно, кроме этого глюка. Типичные логи:
-------
Completed 99%
mdrun_gpu returned
NANs detected on GPU
Folding@home Core Shutdown: UNSTABLE_MACHINE
-------
Completed 1%
mdrun_gpu returned
NANs detected on GPU
Folding@home Core Shutdown: UNSTABLE_MACHINE
-------
Completed 4%
mdrun_gpu returned
NANs detected on GPU
Folding@home Core Shutdown: UNSTABLE_MACHINE
-------
[16:53:12] Folding@home Core Shutdown: UNSTABLE_MACHINE
[16:53:16] CoreStatus = 7A (122)
[16:53:16] Sending work to server
[16:53:16] Project: 5741 (Run 2, Clone 34, Gen 89)
[16:53:16] - Read packet limit of 540015616... Set to 524286976.
[16:53:16] - Error: Could not get length of results file work/wuresults_06.dat
[16:53:16] - Error: Could not read unit 06 file. Removing from queue.
[16:53:16] - Preparing to get new work unit...
-------
По статистике есть некоторое подозрение, что подобные падения всегда идут именно тогда, когда выключен монитор. Сначала подозревал, что при выключении видеокарта "засыпает", но проверил все опции энергосбережения - все включено и сон запрещен. Или, где-то еще есть хитрая галочка, что упрямо вводит карту в сон? Но просто по статистике - расчет при выключенном мониторе идет, падения PPD за ночь не замечено. Только описанная проблема не стабильности и не возможности прочесть файл. Самое обидное - расчеты в среднем идут сутки, включаешь утром монитор, а там в логе "обломс, считаем заново". Прямо хоть вообще бросай эту бодягу с расчетами или монитор не гаси... Прямо синдром мастера, смотришь на клиент: 98=99=100=ОК, а если выключил: 99=ERROR=1%
Еще непонятность: для CPU/GPU установленны чекпоинты на 3мин., CPU уверенно все пишет в лог и рапортует о сохранении чеков в нужном интервале. GPU в этом отношении не пишет в лог ничего! Но, если выгрузить клиенты и запустить заново - то расчет продолжается именно с последних % без обнуления.
Member
Статус: Не в сети Регистрация: 04.02.2005 Откуда: Россия\Москва Фото: 3
LAST_SKIF писал(а):
Насколько адекватны показатели PPD для CPU & GPU?
доктора дают бонус за бета-клиенты (а ГПУклиент - бета )
LAST_SKIF писал(а):
Не могу поставить ничего свежее каталиста 8.5, что лежит на сайте PowerColor. Все, что скачивается с АМД (9.2 в т.ч.) отваливается на первом этапе установки с сообщением, что "совместимого железа не найдено". Авторы на карту явно плюнули и ничего свежее выкладывать не собираются. А она AGP, от PCI-E дрова не встают.
вроде были и новее... или хотфиксы выкладывали для установки на АГП...
LAST_SKIF писал(а):
для CPU/GPU установленны чекпоинты на 3мин., CPU уверенно все пишет в лог и рапортует о сохранении чеков в нужном интервале. GPU в этом отношении не пишет в лог ничего! Но, если выгрузить клиенты и запустить заново - то расчет продолжается именно с последних % без обнуления.
Junior
Статус: Не в сети Регистрация: 20.01.2007 Откуда: Санкт-Петербург
underworlddemon писал(а):
доктора дают бонус за бета-клиенты (а ГПУклиент - бета )
Про это я вкурсе. Я имел ввиду - почему "в среднем по больнице" на таких конфигурациях PPD ощутимо выше, в т.ч. и по бенчмарку, а в реальном расчете почти на половину меньше скорость выходит.
Цитата:
А она AGP, от PCI-E дрова не встают.
вроде были и новее... или хотфиксы выкладывали для установки на АГП... У Поверколорцев - точно нет. Я там почти ежедневно бываю, в надежде на обновления
Цитата:
вроде на этом бета-клиенте чекпоинты игнорируются ибо скорость счёта много выше...
Фигово. Может потому и падает постоянно с рестартом задачи с нуля, что чеков нет. Дюже глючная она на моем конфиге - самое обидное, что считаешь задачу больше суток, а потом облом и заново. CPU ни разу еще так не упал.
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
LAST_SKIF Не нужно ставить чекпоинты через 3 минуты. Это только увеличивает вероятность слёта задания при глюке, поэтому либо оставлять 15 мин по умолчанию, либо увеличивать это значение.
_________________ Революционеров можно убить, идеи — никогда.
Junior
Статус: Не в сети Регистрация: 20.01.2007 Откуда: Санкт-Петербург
Behc писал(а):
LAST_SKIF Не нужно ставить чекпоинты через 3 минуты. Это только увеличивает вероятность слёта задания при глюке, поэтому либо оставлять 15 мин по умолчанию, либо увеличивать это значение.
Да я уже все варианты перепробовал... слетает вне зависимости от чеков. Загрузка/выгрузка софта - норма, продолжает с последнего шага. Перезагрузка винды - продолжает нормально. А вот вылеты - как были так и остались. Точнее, не вылеты а эти вечные "немогу прочесть файл, удаляю, начинаю заново". Я больше потерял так задач, чем выполнил
А сейчас еще и новые проблемы:
[11:53:12] Could not connect to Work Server (results)
[11:53:12] Could not transmit unit 02 to Collection server; keeping in queue.
И такая дребедень - третий день... причем, уже 3 задания так висят на 2х разных ПК. Старое отправить не может, но новое скачивает и считает!
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 9
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения