TSC! Russia member
Статус: Не в сети Регистрация: 20.03.2010 Откуда: Омск
DmGun писал(а):
у меня ничего не менялось, кроме ядра розетты... Разброс по времени счета – от двух до семи часов (установлено на дефолтные 3 часа)
Знаешь, у меня на профильном компе похожие симптомы, время счета стоит 2 часа, а считать пыталось сначала 7, потом 5, потом 3, но иногда задания прекращают счет существенно раньше. Грешил на то, что с этой же машины запускал портейбл версию (только закачивал задания, не считал), а ее настройки делал другими, с временем счета 8 часов, могло сбиться что-то на сервере, раздающем задания - один и тот же комп в настройках существует в двух ипостасях. Еще глюк: стоит буфер 0,8 суток, что при времени счета 2 часа дает довольно большой список заданий. Но вчера у меня было одновременно загружено 8-12 заданий (из которых 8 считалось сразу), сейчас - 15 (время счета комп прогнозирует 3 часа). Самое интересное было сегодня: запускаю клиент - 3 задания имеют отличное от 0 время счета. А тормозил вчера 8 заданий! Из них 3 подвисло в памяти до выгрузки клиента. Куда делись еще 5? Начали считаться заново? В числе сданных (предположительно - с небольшим временем счета) их нет.
п.с. еще не понимаю, почему на сайте я вижу для своей системы: Measured integer speed 10165.81 million ops/sec, сейчас при запущенном браузере получил результат теста производительности: 9963 million ops/sec (что очень близко), но в портейбл версии клиента получал результата порядка 6700, при этом проц больше ничем занят не был. Портейбл версия стара, и не может корректно оценить проц? Но не настолько же она старая...
economist2000 насчет портейбл версии ничего сказать не могу, не пользовался. Насчет снижения времени счета – это нормально только в самом начале счета (то есть, первый день), клиент приноравливается к твоей машине и дальше все должно быть ровно. Насчет завершения счета раньше времени или позже – такая особенность у заданий CASP9***. Уже писали, что они глючные (но полезные))). Вылет заданий после перезагрузки – тоже на мой взгляд, глюк новых заданий. У меня точно так же стал себя вести клиент с ними. (выключал правильно: приостановить, потом уже выключить). Но меня это мало волнует – комп (и клиент) очень редко выключаю. Хотя, малость раздражает. Но все в целом меня уже сегодня достало. На форуме докторов комментарии только про несовместимость новых заданий и седьмого (бета) клиента пишут. Грамотно по-английски написать отчет о глюках я им, к сожалению, не могу.
TSC! Russia member
Статус: Не в сети Регистрация: 20.03.2010 Откуда: Омск
DmGun писал(а):
Насчет снижения времени счета – это нормально только в самом начале счета (то есть, первый день)
Я считаю на профильном компе эпизодически, от 2 до 5 часов, не каждый день. Сейчас загрузил боинк - снова из 8 заданий только 3 ненулевые, и то, выполнено от 5% до 20%. Остальное считается с нуля. Может быть, результаты не сохраняются из-за большого промежутка автосохранения на диск? Но у меня стоит 600 секунд - не так уж и много. Навскидку, у меня разбег по степени выполненности заданий должен быть от 5% до 80%, а не то, что описал выше... Грубо, час-полтора работы процессора потерян. Если так и дальше будет продолжаться, придется вообще отказаться счета боинка на основном компе, даже такого эпизодического, зачем впустую воздух гонять. В фолдинге где вышел из клиента, с того места и возобновил счет. ни секунды процессорного времени не пропадает.
economist2000 я имел ввиду совсем другое – то, что боинк-клиент подстраивает время счета всех заданий под установленное тобой время, т.е. два часа. А то, что они вылетают при перезапуске клиента это ненормально. Так быть не должно.
TSC! Russia member
Статус: Не в сети Регистрация: 20.03.2010 Откуда: Омск
DmGun писал(а):
А то, что они вылетают при перезапуске клиента это ненормально. Так быть не должно.
Единственное, что поменялось в системе за последнее время - память разогнал с 1444 до 1800 МГц. С чуть меньшими таймингами ни фолдинг, ни розетта не работали. С текущими - (10-10-10-27) - фолдинг стабилен. По розетте - вопросы. Но в принципе считает и не вылетает.
Добавлено спустя 2 минуты 56 секунд:
noname2 писал(а):
Покажешь, где можно поставить чекпоинт "1 секунда"?
Имел ввиду следующее. Закачиваем жабу. Даем ей посчитаться несколько секунд. Выключаем счет. Снова запускем - а несколько очков (из миллионов) уже посчитано - счет возобновлен не от ноля.
Итак, появились посты на форуме Розетты с теми же проблемами, что у меня (ошибки, сильно заниженные результаты (granted credit)). Доктора пока не ответили, но уже ясно, что они напортачили с новым ядром (или заданиями?). Это проявляется на клиентах для Mac OS X Так что, эта хрень не только у меня...
Добавлено спустя 1 час 49 минут 51 секунду: А вот и доктора ответили, транслирую:
It looks like the performance of the Rosetta@home application dropped on Macs (we believe all Macs) with 3.24. We're aware of the issue and looking into ways of remedying it.
Note that the low performance is the direct cause of the variable runtimes. The R@h client will try to always produce at least decoy. If execution slows down enough that a job takes 7 hours to produce the first decoy, that workunit will run for 7 hours, even if your runtime setting is 3 hours. But once that first decoy is produced, the client will only start on subsequent decoys if the estimated runtime falls under the run-time limit. So if the first decoy takes 2 hours to complete and your runtime is set for 3 hours, the client will stop early, rather than run for 4 hours.
П.С. я что, один в команде на макоси считаю?
Кстати, написал про обнуление заданий и на винде, может и на это ответят.
TSC! Russia member
Статус: Не в сети Регистрация: 20.03.2010 Откуда: Омск
...что-то посыпались задания пачками... 6 штук почти подряд... пока писал эти строки, еще одно вылетело... может, разгон стал нестабильным? перегрева нет.
Куратор темы Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Новый пост в блоге Девида Бейкера.
Цитата:
In the last two months we believe we have made quite a breakthrough in structure prediction, and are excited to test the new method in CASP10. We need your help though--we are now testing many aspects of the new approach and are seriously limited by available CPU cycles. There are now so many flu inhibitor design and structure prediction jobs queued up on Rosetta@Home that there is an eight day wait before they are getting sent out to you. This would be a great time to temporarily increase Rosetta@Home's share on your computers and/or recruit new users--we need all the help we can get! thanks! David
В общем просит прибавить скорости. Чего давненько небыло (наоборот последние ~полгода когда задавали докторам вопрос врямую, они говорили что дополнительные выч. мощности им не нужны, текущих вполне хватает - узкое место было в обработке и проверке получаемых результатов людьми). А сейчас понадобились в связи с началом CASP10 и тестированием нового подхода по предсказанию структуры. (Как я понял добились заметного прогресса в использовании информации о стуктуре белков-гомологов, последние 2 версии минирозетты были как раз в связи с новой реализацией этих алгоритмов). Очередь заданий (3.7 млн. жаб) тоже соответствует.
Похоже требования к памяти для последних заданий несколько изменились. Е8400, 2Gb - стал тупить, пришлось понизить объём используемой памяти при работе до 50 %. Вроде помогло.
Member
Статус: Не в сети Регистрация: 24.04.2011 Откуда: Москва
Mad'Max писал(а):
Очередь заданий (3.7 млн. жаб) тоже соответствует.
А когда писался пост, в очереди было больше 13 лимонов заданий. Аж целых 10 миллионов ВУшек отложили на потом. Тех самых, связанных с гриппом и предсказаниями структуры.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 84
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения