В этом посте я хочу представить новый вычисляемый на GPU алгоритм кластеризации, который мы недавно разработали для анализа большого объёма данных молекулярной динамики, генерируемых проектом Folding@home. FAH может выдавать огромный набор белковых структур. Важным шагом в анализе этих больших объёмов данных является в той или иной форме их сокращение, обычно в форме кластеризации. Недавно мы разработали работающий на GPU алгоритм кластеризации, использующий внутренние свойства мерического пространства, для быстрого ускорения кластеризации. В целом, наш алгоритм на 2 порядка (до 100 раз) быстрее по сравнению с выполнением тех же задач на CPU, и с ростом производительности видеокарт станет еще более перспективным.
Этот алгоритм может найти многочисленные применения. Например, одна из систем, на которой мы тестировали наш код, это белок human islet amyloid polypeptide (hIAPP), чья аггрегация влечет за собой диабет второго типа. Мы надеемся, что последующий анализ этих данных позволит разобраться в сути вопроса, что будет учтено при разработке препаратов для лечения сахарного диабета.
Мы уже упоминали, что значительное количество высокоприоритетных проектов отстают от существующих. Новые проекты имеют целью интерпретацию и руководство для экспериментов, для которых полная мощь проекта Folding@home очень важна для продолжения расширения границ научных и медицинских открытий.
Основная причина этого отставания - это версия ядра, необходимого для запуска моделирования. Многие из наших новых SMP-проектов используют ядро A4, которое имеет некоторые научные улучшения, в то время как существующие проекты используют все еще актуальное ядро А3. Ядро А4 не совместимо с клиентами версии ниже 6.34, но многие кранчеры все еще используют эти старые версии клиентов.
Сейчас мы представляем возможность поощрить людей перевести свои машины на эти жизненно важные проекты (А4). Чтобы подчеркнуть научную важность этих жаб (WU's), мы повышаем базовые очки всех заданий на ядре А4 на 10% с момента их отправки (Внимание: этот бонус не будет показан клиентом V7 или другими программами мониторинга PPD клиентов, но очки появятся в статистике). Всё это начнется с 23 июля 2012 и мы сохраним этот 10%-ный бонус в действии по меньшей мере в течение 3 месяцев (в качестве пробного периода), но если потребуется планируем сохранить его и дальше.
Для участия, кранчеры должны запустить последнюю версию клиента. Мы настоятельно рекомендуем пользователям Windows обновиться до наиболее продвинутого клиента V7. Несмотря на это, клиент 6.34 или более новый является достаточным для участия на любой поддерживаемой операционной системе. Пожалуйста обратите внимание, что клиенты V7 для Linux и OSX пока еще в стадии разработки и обратная связь c тестерами приветствуется.
В большинстве разумных попыток создания лекарств предполагается, что целевой белок (мишень) существует в виде единственной структуры и что структура одной области белка - активного центра - позволяет ему выполнять некоторые функции. Сделав такое допущение, единственным способом управления активностью белка остаются ингибиторы, которые связывают активный центр достаточно прочно, чтобы заблокировать его от выполнения предназначенных функций. К сожалению, эта стратегия работает только для ~15% белков, сильно ограничивая число белков, которыми мы можем управлять в терапевтических целях.
В недавней статье, опубликованной в журнале Proceedings of the National Academy of Sciences, я показал, что запуск моделирования на Folding@home может открыть новые пути управления активностью белков. В частности, я начал с признания того, что белки в действительности гибкие и затем использовал Folding@home для перебора различных конформаций, принимаемых белком. Дальше я использовал статистический анализ для нахождения таких частей белка, которые могут сообщаться с активным центром при помощи процесса аллостерии. Эти регионы, называемые аллостерическими центрами, привлекательны с точки зрения разработки мишеней для лекарств, поскольку связанные с ними маленькие молекулы могут быть доставлены к активному центру, в итоге влияя на активность.
В доказательство работоспособности предложенного принципа, я показал, что мой подход может распознать известный аллостерический центр в бета-лактамазе (см. картинку ниже). Этот белок является важной мишенью при разработке лекарств, потому что он может давать бактерии устойчивость к антибиотикам за счет разрушения таких антибиотиков как пенициллин. Также я использовал свой подход для предсказания новых аллостерических центров в бета-лактамазе и двух других белках, играющих важную роль в иммунодефицитах и ВИЧ. Сейчас я провожу эксперименты для проверки своих предсказаний. Это потребует вычисления намного большего количества жаб (WU’s), но я надеюсь, что такой подход в конечном итоге может привести к созданию новых лекарственных препаратов. #77 Слева – структура бета-лактамазы, которую большинство людей считали бы единственной структурой этого белка. Однако, картинка справа показывает другую структуру, с лекарством (показано голубым цветом), связанным в карман, которого нет на структуре слева. Связывание лекарства как-то влияет на структуру рядом с активным центром (показан зеленым цветом). Используя мой подход, я способен начать со структуры слева и затем предсказать существование структуры справа и аллостерический центр, с которым свяжется лекарство.
Примечание. По поводу того, что такое аллостерия
нашел в Сети: Аллостерия является механизмом, при помощи которого различные свойства большой белковой молекулы могут изменяться при ее соединении с малой молекулой. Взято отсюда.
Allosteric (adj)- понятие включает изменение формы и активности ферментов, которое происходит вследствие молекулярного связывания с регулирующим веществом по центру, отличному от активного центра фермента.
От себя: идея интересная. Можно искать лекарства, которые напрямую связываются с активным центром фермента (так делается сейчас). А можно пойти другим путём – поиск в молекуле белка аллостерических центров, с которыми может связываться некое лекарство. В итоге после такого связывания меняется структура активного центра и активность фермента. При этом лекарству вовсе необязательно быть связанным с активным центром фермента. Это позволит расширить круг мишеней и влияющих на фермент «химикатов».
Гостевой пост от профессоров Кассона, Шортса (Университет штата Вирджиния) и мистера Коффланда
Идет разработка новой версии Gromacs (4.6), и сейчас мы работаем над тем, чтобы включить его в Folding@home. Новый код содержит некоторые улучшения (их больше, чем вы могли бы ожидать, судя по номеру версии!), время от времени мы будем писать о некоторых из особенностей. Не все из них будут сразу же доступны в F@H, так как им потребуется значительная доработка в течение нескольких месяцев. Из основных черт можно отметить новые методики свободной энергии от одного из членов команды профессора Майкла Шортса, новый, немного ускоренный код внутреннего цикла и кое-какие важные настройки распараллеливания. Вычисления свободной энергии позволят нам обсчитывать, среди прочего, насколько плотно лекарства связываются с белками и силу притяжения между составляющими белков, если их разъединить. Вы, конечно же, знаете, что значат ускоренный код внутреннего цикла и улучшенное распараллеливание!
Gromacs – это интересный образец программного симулятора так как он отлично оптимизирован как для работы на одиночном компьютере (отчасти поэтому мы и выбрали его для F@H), так и для параллельного масштабирования (?). Многие системы кодирования ориентированы либо на одно, либо на другое. Но Gromacs старается работать и там и там. Это обеспечит интересные и полезные применения для F@H особенно на фоне все большего количества ядер в процессорах участников (а также интеграции с GPU). Это все пока; ждите новых постов по ходу работы.
Спасибо! Команда Ядра 4.6 (Профессора Кассон, Шортс и неутомимый мистер Коффланд)
Junior
Статус: Не в сети Регистрация: 13.09.2012 Откуда: Иркутск
http://folding.typepad.com/news/2012/09/new-methods-for-analyzing-fah-data.html SEPTEMBER 10, 2012 New methods for analyzing FAH data Новые методы анализа данных FAH Гостевой пост доктора Грегори Боумана (Dr. Gregory Bowman), Калифорнийский Университет, Беркли Проект Folding@home имеет две главных цели: (1) объяснение молекулярных начал существующих экспериментальных данных и (2) обеспечение понимания процессов, необходимого для нового этапа передовых исследований. Мы достигли огромного прогресса в обеих сферах, особенно в первой. Выработка понимания это, в значительной мере, искусство, и поэтому меньше поддается автоматизации. Чтобы помочь выработке понимания, я недавно разработал байесовский алгоритм для крупноблочной обработки наших моделей. Объясню. Когда мы изучаем какой-либо процесс – например сворачивание конкретного белка – мы обычно начинаем с использования предоставляемых вами вычислительных мощностей чтобы провести подробное моделирование процесса. Далее, на основе этих данных мы строим модель Маркова. Как я объяснял ранее, эти модели напоминают карты конформационного пространства белка. Конкретнее, они перечисляют конформации, которые может принять белок, насколько вероятно, что белок примет каждую из этих структур, и сколько уйдет времени на переход из одной структуры в другую. Обычно, наши начальные модели имеют десятки тысяч параметров и способны учесть мельчайшие детали исследуемого процесса. Подобные модели отлично подходят для установления связи с экспериментами, так как мы можем фиксировать все подробности необходимые для конкретных экспериментальных наблюдений. Однако, эти модели очень сложны для понимания. Вот почему так оправдано проводить крупноблочное моделирование. Иначе говоря, мы стараемся выстроить модель с ограниченным набором параметров, которая близка к первоначальной, сложной модели настолько, насколько это возможно. Если всё сделано правильно, новая модель может ухватить суть явления так, чтобы его было легче осмыслить и понять. На основе понимания, обеспеченного этой новой моделью, мы можем начать выработку новых гипотез, которые мы будем тестировать с помощью более сложных моделей и, в конце концов, экспериментально. Статистическая неопределенность представляет самое большое препятствие для проведения крупноблочного моделирования такого рода. Например, если мы наблюдаем 100 переходов между двумя конформациями, и каждый из этих переходов медленный, мы можем быть уверены, что этот переход точно медленный. Но если мы наблюдаем какой-нибудь другой переход только один раз, и в этот раз он проходил медленно, то кто знает? Переход может, в самом деле, быть слабым. С другой стороны, может и не быть, просто нам не повезло. В существующих методах крупноблочной обработки моделей Маркова предполагается, что у нас есть достаточно данных, чтобы описать каждый переход. Поэтому они часто отбирают эти недостаточно описанные переходы и присваивают им статус важных (рассматривая сворачивание белков, нас обычно больше интересуют медленные шаги, так что «медленный» и «важный» в данном случае синонимы). Разработанная мною методика (описание здесь) специально учитывает сколько раз наблюдался переход. При этом выделяются именно те переходы, которые мы наблюдали достаточное число раз, чтобы считать проверенными, в то время как непроверенные переходы игнорируются. Чтобы достичь этого, я использую байесовскую статистику. Здесь нет возможности воздать ей должное, но если вам когда-либо придется работать с данными, рознящимися по степени надежности, я настоятельно рекомендую ознакомиться с байесовской статистикой.
Junior
Статус: Не в сети Регистрация: 13.09.2012 Откуда: Иркутск
http://folding.typepad.com/news/2012/10/unified-gpusmp-benchmarking-scheme-equal-points-for-equal-work.html Объединенная схема начисления очков: одинаковые очки за одинаковую работу Поскольку изначально ядра SMP не могли проводить расчеты, доступные для GPU, и наоборот (GPU использовались только для расчетов с неявно заданным растворителем, а SMP – с явно заданным растворителем), сейчас расчет очков для проектов SMP и проектов GPU ведется разными машинами. Учитывая последние усовершенствования обоих ядер и успех тестирования на совместимость, мы с уверенностью заявляем, что можем считать любое задание на любом из ядер. Поэтому, мы считаем, что для упрощения и большей справедливости начисления очков по GPU и SMP, пришло время унифицировать их схемы начисления очков. Для того чтобы закончить переход к принципу «одинаковые очки за одинаковую работу», очки для новых проектов GPU будут рассчитываться по существующей схеме для SMP. Наши внутренние тесты показывают, что, с введением этой новой схемы начисления, очки для проектов GPU вырастут, это касается базовых очков, а также за счет введения бонусов за ускорение в клиентах GPU. Для проверки новой схемы, мы создали проект GPU3 (8057) и запустили его бета тестирование. По завершении тестирования данной схемы начисления очков, очки по всем текущим проектам GPU будут откорректированы в соответствии с новой схемой.
Куратор темы Статус: Не в сети Регистрация: 21.09.2005 Откуда: Иркутск Фото: 1
Пост бета-тестера toTOW из блога fah-addict.net от 17.02.2013
Src
Computation errors and GPU temperature : some numbers
This is something we knew, but without being able to define the real impact. Our GPUs are more likely to produce computation errors than our CPUs. However, temperature seems to be a decisive variable in the growth of error probability. This news (in French) shows a small panel of nVidia cards from various architecture and the testing conditions.
Of course, the cards in desktop cases are the main focus, but the laptop or high performance computing rack cards are more likely to be subject to these issues because they run in a much more confined environment. The good news is that most modern GPUs (Fermi or Kepler) are kept away from erroring by efficient thermal protections.
This experiment consolidates our usual advice : avoid folding on laptop GPUs, and make sure that your sensitive components are correctly cooled.
Мы знали об этом, но не могли определить реальное воздействие. Наши GPU, похоже, могут вызывать ошибки в вычислениях, по сравнению с процессорами. По-видимому, температура является решающей переменной в росте вероятности ошибок. Эта новость(1) (на французском) показывает небольшую группу карт NVIDIA с различной архитектурой и условиями тестирования.
Конечно, в центре внимания были десктопные карты, но ноутбуки или высокопроизводительные решения, скорее всего, также подвержены этим ошибкам, поскольку они работают в гораздо более ограниченном пространстве. Хорошей новостью является то, что большинство современных графических процессоров (Fermi и Kepler) далеки от этого благодаря эффективной тепловой защите.
Этот эксперимент подтверждает наши обычные советы: избегайте фолдинга на ноутбучных GPU, и убедитесь, что чувствительные компоненты вашей системы хорошо охлаждаются.
(1) Краткое резюме по содержанию статьи (во французском не силен, воспользовался машинным переводом): народ тестировал карточки разных поколений (9800GX2, GTX480, GTX560, GTX670 и разные теслы) в OpenCL в убийственных условиях - температурах до 170С.
Вывод1: чем новее поколение карт тем ниже пороговая температура отключения чипа термозащитой. Каким-то образом им удалось заставить работать эти карты при температурах превышающих температуру срабатывания термозащиты.
Вывод2: при температуре GPU 160С карты дохнут через 11 дней тестирования.
Вывод3: при температурах GPU 160-170С карты очень часто выдают ошибки расчетов.
Таким образом, если найдутся извращенцы, которые смогут довести свой GPU до такого состояния, у них посыпятся ошибки расчетов. При этом, по-видимому, не исключается, что при более низких температурах ошибки тоже могут возникать, но гораздо реже (иначе бы из-за чего весь кипишь).
Добавлено спустя 8 часов 58 минут 2 секунды: upd: вставил ссылку на исходный материал
TSC! Russia member
Статус: Не в сети Регистрация: 01.02.2014 Откуда: регион 64 Фото: 31
куда постить переводы описаний проектов? перенесите если надо Проект 9841оригинал
Болезнь: не указано
Стать большим..., став маленьким! Мы хотим изучать реально большие протеины и комплексы протеинов, может быть, такие большие, как рибосомы или ионные каналы в нейронах. Один возможный путь достичь этой цели — запуск обсчетов каждой части большого комплекса отдельно, а затем, соединение результирующих моделей вместе. Мы думаем, что знаем, как это сделать, но для начала нам нужно протестировать наш подход на системах попроще.
Инсулин это небольшой протеин, используемый поджелудочной железой для сигнала всему организму, в какой момент утилизировать больше глюкозы, а в какой - нет. Сбои в процессах секретирования и рецепторного считывания ведут к различным заболеваниям, включая диабет, метаболический синдром и синдром поликистоза яичников. Инсулин может формировать димеры (комплексы, состоящие из двух молекул инсулина), гексамеры (комплексы, состоящие из шести молекул инсулина) и, даже, более масштабные совокупности, похожие на те, что формируются при болезни Альцгеймера, но только мономер физиологически активен. В этом проекте мы хотим запускать симуляции инсулиновых мономеров и димеров и посмотрим, какая методология по изучению больших систем работает здесь.
Предыдущие проекты 9810-9836 были про мономеры, а этот про димеры.
Этот проект находится под руководством доктора Антона Синицкого в Стенфорде
Антон Синицкий защитил докторскую диссертацию и работает в составе Pande Group над расчетными исследованиями больших молекулярных комплексов.
_________________ "...Никем не ставший, зачем ты жил?!..."
TSC! Russia Captain
Статус: Не в сети Регистрация: 16.08.2007 Откуда: Красноярск
Duce H_K_ Спасибо за перевод! Если интересно, то можете размещать переводы в эту ветку [F@H] Мониторинг клиентов, новые задания и их описание, которую веду как раз по новым добавляемым проектам или можно создать новую ветку для перевода вновь добавляемых заданий или начать потихоньку выкладывать туда переводы всех заданий Права куратора предоставлю
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения