Junior
Статус: Не в сети Регистрация: 25.09.2007 Откуда: Moscow
Renegade1979 писал(а):
Будет вам Фортран, подумал Wang http://on-demand.gputechconf.com/gtc/2013/presentations/S3448-CUDA-Fortran-2013.pdf (I've lost a bomb, do you have it?) также Нвидиа в пику Интел встраивает в Максфейл свои ARM процессоры, наверняка для той же благой цели "самостоятельно запускать приложения и ядро операционной системы", а после перехода на новый техпроцесс будут те же 3 терафлопс, унифицированный доступ к системной памяти уже разрабатывается, может и зафейлят во всём, но не сказать что топчутся на месте.
"возможность запукать ОС на ускорителе" и "возможность запускать отдельную ОС на каждом вычислительном блоке ускорителя" это немного разные вещи. Технически, например, даже сейчас на Phi можно запускать автономные вычисления (когда управляющая программа работает на одном из вычислительных блоков), однако такая схема на практике как правило неприменима, поскольку управляющей программе зачастую нужно много памяти. Кроме того, поддержка нужного языка хороша, но недостаточна для запуска программы, написанной на нём (кроме, разве что, "hello,world", если реализация языка соответствует стандарту, а то и с ним могут быть проблемы). Так что переделывать всё равно придётся, просто новый язык учить не надо (почти). У интела архитектура "гетерогенных" вычислений гораздо более гомогенна, чем у видюх. Для пользователя это просто куча мелких компов, соединённых в очень быструю сеть. А терафлопсы - это гигагерцы нашего времени. При разной архитектуре имеет нетривиальное отношение ко времени счёта какой-либо конкретной задачи конкрктным софтом. Другой вопрос, если не вычислять на ускорителях ничего самому, а пользоваться библиотекой, оптимизированной для конкретных архитектур. Тогда есть шансы, что всё-таки достигнешь хотя бы сходной доли от максимальной производительности на разных системах. Но это только для типовых задач, для которых оные библиотеки существуют
Member
Статус: Не в сети Регистрация: 01.09.2007 Откуда: Питер
Как это, в итоге, работает? Из новости ничего не понятно. Нужен особый софт, адаптация текущего или воткнул ускоритель, поставил драйвер и получил распараллелевание на него много-поточных приложений на х86?
Junior
Статус: Не в сети Регистрация: 25.09.2007 Откуда: Moscow
devl547 писал(а):
Скорее SMP. Сеть там снаружи не видна, она только для общения внутри устройства.
Я описал с точки зрения хоста (он же управляющий узел получается). А так да, снаружи не видна. Тем не менее не SMP привычный, в котором предполагается, что адресуемая память - общая
Junior
Статус: Не в сети Регистрация: 25.09.2007 Откуда: Moscow
devl547 писал(а):
Да нет, обычный вполне. Много ядер с L1/L2, соединенные interconnect mesh. На всю сеть вроде 4 контроллера памяти.
Посмотрел документацию. SMP там типа есть, почти, наверное. Примерно так там и написано. Когерентности кешей не хватает, причём отслеживаются ещё состояния когерентности строк в различных блоках. Непонятно, как обмен данными по-нормальному между ядрами происходит, мучать контроллер памяти как-то несолидно в таких случаях (типичный пример - синхронизация потоков на разных ядрах), мало их, на всех не хватит
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения