Member
Статус: Не в сети Регистрация: 11.12.2004 Откуда: Тамбов
Vit222 все нормально. Просто стоит сортировка по проценту выполнения задания. Нет абсолютно идентичных заданий, нормальная ситуация, если какие-то задания считаются быстрее или медленнее. Одни задания укладываются в 3 часа ровно, дургие в 2 ч 48 мин, могут и чуть больше считаться.
Member
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Питер
DayWalker Фух, спасибо) Щас все наоборот, 4ое задание считается быстрее)) Просто тут маленький разгон делал и в прайме 4ое ядро считало медленнее, а потом и в розетте такое совпадение, думал мало ли что не так
TSC! Russia member
Статус: Не в сети Регистрация: 19.07.2010 Откуда: Казань
Vit222 писал(а):
Господа, такое может быть? Производительность падает сверху вниз Изначальное время просчета у всех одинаковое ( которое пишется до того как задание начало считаться)
Также это может быть от того, что винда сама по себе может периодически "подгружать" одно ядро. То у не "свопнется" что-то, то "взгруснется". То антивирус обновлялку затеит, то Windows Update и т.п. и т.д. В этом случае один (а то и более) из расчетных потоков начинает отставатью
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
Vit222 К сказанному выше ToEst хочу добавить, что одновременно считаются задания разных проектов. Соответственно даже при выставлении счета на 3 часа (по-умолчанию) какая-то задача может считаться 2:58, а потом решить, что с неё достаточно, а какая-то 3:05.
_________________ Революционеров можно убить, идеи — никогда.
Куратор темы Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
hvvt писал(а):
Уважаемые коллеги. Есть небольшая проблема. При работе боинка моего главного счетовода стал отчётливо слышен треск винта, что делает невозможной его работу по ночам. Настройки: Write to disk at most every - 600 seconds / локально Tasks checkpoint to disk at most every - 1800 секунд. On multiprocessors, use at most - 24 processors Use at most - 100 percent of CPU time Use at most - 75% of page file (swap space) (но сам swap равен 0) На диске боинком занято 4,46Гб, свободно для него 5,54. Считает не в полную силу. Оперативной свободно 960Мб.
Чего поделать можно?
Если при таких настройках (писать чекпоинты раз в 1800 сек) то похоже это своп. Малое кол-во памяти говорит тоже в пользу этого. Раз говоришь что в ОСи своп вообще отключен, значит возможно свопится сама Розетта. Она похоже это тоже умеет. Про это нигде не написано, но я наблюдал такое на практике - когда начинаешь занимать оперативку чем-то другим при работающих процессах минирозетты(запускаешь что-то ресурсоемкое паралельно BOINC) то в диспетчере задач видно что объем занимаемой ими памяти начинает уменьшаться при этом активно работает диск. Бывает неплохо ужимается, типа с 450 Мб до 250 Мб Правда не уверен на 100% что это сама Розетта делает, может быть и ОС в своп выгружает (а в Розетте только отмечены области, которые разрешено временно выгружать).
Как пробовать бороться - освободить больше памяти снизив кол-во потоков. Если 1-2 потока хватит, чтобы диск успокоился то на этом и остановиться, если не хватит тогда отлючить HT (это должно быть "выгодней" всмысле потери скорости чем отключение большоего кол-ва потоков). Еще общая рекомендация - провести дефрагментацию дискового раздела где BOINC стоит. Под ним фрагментация файловой системы быстро растет (из-за постоянной запаковки/распаковки кучи разных файлы, скачивания/удаления заданий, на каждую жабу там до сотни файлов создается а потом удаляется либо модифицируется/дописывается, а при 24 потоках и 12 target time это и счете 24/7 это по 50-70 раз в сутки происходит). У меня сейчас когда очередное ядро розетты запускается винт трещит секунд 30-50 прежде чем процесс начнет ядро на 100% грузить.
Добавлено спустя 30 минут 58 секунд: 2 ALL Насчет времени счета. Я же уже вроде подробно расписывал из-за чего все вариации. Небольшие отклонения от целевого времени (в обе стороны) - это норма. Т.к. расчет останавливается ТОЛЬКО по окончании счета очередной "модели". Оценка "уже пора заканчивать или продолжаем считать следующую?" производится только между моделями. Так что идельное попадание 1в1 это наоборот исключение, а норма это небольшие отклонения в обе стороны. Если жаба заканчивает считаться намного раньше положенного срока, но при этом без ошибок (в основном это встречается если целевое время намного больше дефолтных 3 часов ставить или на очень быстрых машинах, точнее очень быстрых процессорных ядрах, т.к. значение имеет скорость отдельного ядра, а не их кол-во) - это скорее всего сработал лимит на кол-во моделей (100 или 10 000 шт) после которого идет принудительная сдача результатов. Если жаба считается намного больше целевого времени - скорее всего вам попалась глючная жаба. Если это именно глюк с бесконечным зацикливанием (а не просто сложная модель считается, на которую нужно больше ресурсов), то она должна самоликвидироваться через 4 часа после превышения целевого времени. Т.е. 3+4=7 часов счета при настройках по умолчанию, или 12+4=16 часов счета (при целевом времени 12ч). Если через +4 часа жаба не самоликвидировась - поздравляю, вам попалась очень глючная жаба. И ее нужно прибить вручную, чтоб не мучалась.
P.S. Все указанные значения времени относятся к чистому процессорному времени (CPU time), а не к календарному (определяемому по часам, Elapsed time в BOINC). Elapsed time может еще больше гулять (в сторону увеличения) если у розетки во время счета кто-то ресурсы отбирал (ОС что-то делала или другой софт работающий паралельно с BOINC)
Добавлено спустя 9 минут 53 секунды: К вопросу от фрагментации. Запустил анализ диска, больше половины списка наиболее фрагментированных файлов на диски заняли файлы Розетты (большую часть остальных это файлы почтовой программы, что тоже понятно, я их из списка удалил).
Это всего 2 ядра(потока) за неск. месяцев такое безобразие устроили. Особо см. 1е 2 файла - это основная база данных розетты, обращения к ним идет в любой(каждой) жабе.
TSC! Russia member
Статус: Не в сети Регистрация: 20.03.2010 Откуда: Омск
Mad'Max писал(а):
когда начинаешь занимать оперативку чем-то другим при работающих процессах минирозетты(запускаешь что-то ресурсоемкое паралельно BOINC) то в диспетчере задач видно что объем занимаемой ими памяти начинает уменьшаться при этом активно работает диск. Бывает неплохо ужимается, типа с 450 Мб до 250 Мб
У меня подобная картина на Атоме (профильная интернет-качалка №2). Считаю в 4 потока при 2 гб оперативки. Если закачиваю из инета что-то медленно, 50-200 кБ/с, то все нормально. Если начинаю качать с шустрого обменника, и скорость измеряется мегабайтами в секунду, то розетта вылетает вообще, расчетные ядра сворачиваются, нагрузка на проц падает до 0-5% (сколько качалка потребляет), диск ужасно трещит - видимо, розетта пытается заново загрузиться, но у нее это не получается. Скорость закачки падает из-за тормозов диска (он у меня какой-то тормозной, хотя одноблинный, и в PIO не упал). При этом память качалка не ест - после вылета розетты остается свободным больше 1 гига. Аналогичное наблюдаю, когда скачиваю с этого компа что-либо на скоростях уже в десятки МБ/с. Поставил для пробы дополнительные 2 гига памяти (из машинки №3) - всё! Розетта не вылетает и стабильно считает параллельно с шустрой закачкой или сливом. Так что, либо буду делать одновременно что-то одно - качать или считать, или найду еще одну планку низкопрофильной памяти (другая туда не лезет). Жаба конечно душит тратить деньги на такой комп ради розетты, но хочется, чтобы все работало параллельно.
Что-то после обновления минирозетты до 3.22 все задания CASP9_... (уже 6 штук) завершаются с ошибкой Compute Error на разных процентах выполнения. Одно из них кто-то нормально сдал, по остальным пока инфы нет. Другие задания вроде нормально считаются.
TSC! Russia member
Статус: Не в сети Регистрация: 20.03.2010 Откуда: Омск
Поставил портейбл клиент на профильный комп, предварительно выгрузив из памяти все, что касается стационарного клиента. Он загрузил CASP9_ae_benchmark_hybridization_run06_T0526_SAVE_ALL_OUT_IGNORE_THE_REST_39439_1069_0 - всего одно задание и начал считать его на одном ядре. Что за ерунда? Я хотел, чтобы он накачал заданий, а не тест прогонял на одном ядре. У меня проц должен 3 часа бездействовать? В свойствах на сайте боинка - и7. почему загружен 1 поток?
Member
Статус: Не в сети Регистрация: 06.10.2008 Откуда: НВ/ХМАО
economist2000 писал(а):
Он загрузил CASP9_ae_benchmark_hybridization_run06_T0526_SAVE_ALL_OUT_IGNORE_THE_REST_39439_1069_0 - всего одно задание и начал считать его на одном ядре. Что за ерунда? Я хотел, чтобы он накачал заданий, а не тест прогонял на одном ядре.
Это не тест, а задания такие, у меня их треть в очереди на расчет висит. (: Посмотри в настройках, может там надо указать число CPU и процент их использования?
_________________ Я стою, как перед вечною загадкою, Пред великою да сказочной страною
TSC! Russia member
Статус: Не в сети Регистрация: 19.07.2010 Откуда: Казань
economist2000 писал(а):
Поставил портейбл клиент на профильный комп, предварительно выгрузив из памяти все, что касается стационарного клиента. Он загрузил CASP9_ae_benchmark_hybridization_run06_T0526_SAVE_ALL_OUT_IGNORE_THE_REST_39439_1069_0 - всего одно задание и начал считать его на одном ядре. Что за ерунда?
Обычно попозже подгружаются остальные задания (~5..20 минут). Такое ощущение, что boinc "пробует на зуб" железку, на которую его установили, и только после некоторого успешного времени работы - начинает скачивать остальные задания. Я по началу тоже удивлялся такому.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 3
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения