Титан при включении полноценной двойной точности сбрасывает частоты, Нвидиа объясняет - во избежание перегрева...
Точно могу сказать, что К10 при DP едва тёплая. В то время, как в SP штатного охлаждения SuperMicro 7047 уже категорически не хватает. Что, впрочем, не отменяет Ваших слов про Титан - тут я просто не знаю, пробовал его только в SP - греется нарядно. Но уверен, что снижение частот никак не связано с нагревом - просто подрезают производительность, чтобы в одиночных Теслах был смысл на фоне Титана.
edal писал(а):
В АМД нет выделенных FP64 шейдеров, такой режим получается спаренной работой 32-битных ALU.
Пусть так. Но по простым математическим выкладкам (флопсы) нетрудно предположить, что работа будет совершаться меньшая, с меньшим количеством выделяемого тепла. Соответственно, более низкий нагрев, предположу, будет характерен и для GCN. Хотя, тут просто мои предположения на логических выводах - ни с какой практикой DP на AMD я не знаком.
Member
Статус: Не в сети Регистрация: 20.05.2007 Откуда: Россия
ShadowTM писал(а):
Пусть так. Но по простым математическим выкладкам (флопсы) нетрудно предположить, что работа будет совершаться меньшая, с меньшим количеством выделяемого тепла. Соответственно, более низкий нагрев, предположу, будет характерен и для GCN. Хотя, тут просто мои предположения на логических выводах - ни с какой практикой DP на AMD я не знаком.
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
ShadowTM писал(а):
Речь шла о работе при DP и SP, выполняемой одним и тем же GPU.
Именно
yorka писал(а):
К тому что DP=1/2 от SP. По FLOPS-ам аналогичная ситуация.
Чтоб понятнее, Over 2 TFLOPS(точнее >2.5)DP = Over 5 TFLOPS (SP)
ShadowTM писал(а):
Точно могу сказать, что К10 при DP едва тёплая
А вы её характеристики посмотреть не пробовали?
Цитата:
Tesla K10 Number and Type of GPU - 2 Kepler GK104s Peak double precision floating point performance - 0.19 Tflops Peak single precision floating point performance 4.58 Tflops CUDA cores 2 x 1536 - See more at: http://www.nvidia.com/object/tesla-serv ... tEXLq.dpuf
Чего ей греться в даблах с её 1/24 от сингла?
Добавлено спустя 3 минуты 55 секунд:
ShadowTM писал(а):
Пусть так. Но по простым математическим выкладкам (флопсы) нетрудно предположить, что работа будет совершаться меньшая, с меньшим количеством выделяемого тепла.
ShadowTM писал(а):
К10 при DP едва тёплая
Для неё это справедливо на все 100% (1/24 от SP)
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Согласен. Не учёл очевидного. Спасибо за разъяснения. Кстати, расчёты в DP при 2хK10 (4хGK104), как утверждают люди, использующие сервер, крайне незначительно превосходят возможности при процессорном просчёте (16 ядер Xeon). И тут мы передаём привет CUDA, которая не умеет при распараллеленых расчётах на GPU эффективно утилизировать мощности CPU. Фактически, при использовании ускорителей вычислений nVidia приходится выбирать между GPGPU и CPU. Не знаю, как с этим обстоят дела у AMD именно в DP, но точно могу сказать по своей практике, что OpenCL несравнимо лучше загружает CPU. В частности, при рендере видео все 4 потока моего i5 загружены от 70-80%. При использовании же GPU nVidia в режиме CUDA под завязку загружено лишь одно ядро, а остальные на более, чем на 20-30%. Но стоит переключить рендер в режим OpenCL - ситуация нормализуется и так же начинают грузиться все ядра и 2 Титана выполняют рендер за то же время, что и 2х7970 (тут, правда, всё уже упирается в производительность дисковой подсистемы). Это к вопросу о мифе, что, мол с OpenCL у nVidia сложности - это давно не так.
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
ShadowTM писал(а):
Кстати, расчёты в DP при 2хK10 (4хGK104), как утверждают люди, использующие сервер, крайне незначительно превосходят возможности при процессорном просчёте (16 ядер Xeon). И тут мы передаём привет CUDA, которая не умеет при распараллеленых расчётах на GPU эффективно утилизировать мощности CPU.
Производительность даже такой связки (при 2хK10 (4хGK104)) в DP даже теоретически не намного превосходит возможности 16 ядер Xeon, а к этому ещё добавляются накладные расходы на пересылку данных, в результате "имеем то что имеем". По поводу утилизации процессора: если в SP 2хK10 показывают хорошую производительность с загрузкой только одного ядра процессора, то вряд ли это является бутылочным горлышком в DP. Да и вообще, Нвидиа, не имея своего процессора(высокопроизводительного) старается максимально перенести рассчеты на GPU, чтоб в будущем нескольких ядер ARM (которые она собирается встроить в GPU) с головой хватало чтоб рулить многотерафлопсным хозяйством...
Добавлено спустя 3 минуты 10 секунд:
yorka писал(а):
ShadowTM Все так. Поддержки OpenCL 2.0 у Nvidia нет и хз появится ли она вообще...
Появится, только сначала там где её не ждут - в Теграх, так как они по своему строению являются тем, что АМД называет гордым именем APU
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 17
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения