Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 28 • Страница 2 из 2<  1  2
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 25.03.2012
edal писал(а):
Титан при включении полноценной двойной точности сбрасывает частоты, Нвидиа объясняет - во избежание перегрева...


Точно могу сказать, что К10 при DP едва тёплая. В то время, как в SP штатного охлаждения SuperMicro 7047 уже категорически не хватает.
Что, впрочем, не отменяет Ваших слов про Титан - тут я просто не знаю, пробовал его только в SP - греется нарядно. Но уверен, что снижение частот никак не связано с нагревом - просто подрезают производительность, чтобы в одиночных Теслах был смысл на фоне Титана.

edal писал(а):
В АМД нет выделенных FP64 шейдеров, такой режим получается спаренной работой 32-битных ALU.


Пусть так. Но по простым математическим выкладкам (флопсы) нетрудно предположить, что работа будет совершаться меньшая, с меньшим количеством выделяемого тепла. Соответственно, более низкий нагрев, предположу, будет характерен и для GCN. Хотя, тут просто мои предположения на логических выводах - ни с какой практикой DP на AMD я не знаком.



Партнер
 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
ShadowTM писал(а):
Пусть так. Но по простым математическим выкладкам (флопсы) нетрудно предположить, что работа будет совершаться меньшая, с меньшим количеством выделяемого тепла. Соответственно, более низкий нагрев, предположу, будет характерен и для GCN. Хотя, тут просто мои предположения на логических выводах - ни с какой практикой DP на AMD я не знаком.

http://www.3dnews.ru/814076
На слайде написано "Over 2 TFLOPS and Over 5 TFLOPS". Переводить думаю не надо.


 

Member
Статус: Не в сети
Регистрация: 25.03.2012
yorka писал(а):
На слайде написано "Over 2 TFLOPS and Over 5 TFLOPS".


Речь шла о работе при DP и SP, выполняемой одним и тем же GPU.
Хотя, не уверен, что понял, к чему Вы это написали.


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
ShadowTM писал(а):
Хотя, не уверен, что понял, к чему Вы это написали.

К тому что DP=1/2 от SP. По FLOPS-ам аналогичная ситуация. TDP тут никак на это не влияет!


 

Member
Статус: Не в сети
Регистрация: 16.12.2008
Откуда: Воронеж
ShadowTM писал(а):
Речь шла о работе при DP и SP, выполняемой одним и тем же GPU.

Именно
yorka писал(а):
К тому что DP=1/2 от SP. По FLOPS-ам аналогичная ситуация.

Чтоб понятнее, Over 2 TFLOPS(точнее >2.5)DP = Over 5 TFLOPS (SP)
ShadowTM писал(а):
Точно могу сказать, что К10 при DP едва тёплая
А вы её характеристики посмотреть не пробовали?
Цитата:
Tesla K10 Number and Type of GPU - 2 Kepler GK104s
Peak double precision floating point performance - 0.19 Tflops
Peak single precision floating point performance 4.58 Tflops
CUDA cores 2 x 1536
- See more at: http://www.nvidia.com/object/tesla-serv ... tEXLq.dpuf

Чего ей греться в даблах с её 1/24 от сингла?

Добавлено спустя 3 минуты 55 секунд:
ShadowTM писал(а):
Пусть так. Но по простым математическим выкладкам (флопсы) нетрудно предположить, что работа будет совершаться меньшая, с меньшим количеством выделяемого тепла.

ShadowTM писал(а):
К10 при DP едва тёплая
Для неё это справедливо на все 100% (1/24 от SP)

_________________
AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB


 

Member
Статус: Не в сети
Регистрация: 25.03.2012
edal писал(а):
Чего ей греться в даблах с её 1/24 от сингла?


Согласен. Не учёл очевидного. Спасибо за разъяснения.
Кстати, расчёты в DP при 2хK10 (4хGK104), как утверждают люди, использующие сервер, крайне незначительно превосходят возможности при процессорном просчёте (16 ядер Xeon). И тут мы передаём привет CUDA, которая не умеет при распараллеленых расчётах на GPU эффективно утилизировать мощности CPU.
Фактически, при использовании ускорителей вычислений nVidia приходится выбирать между GPGPU и CPU. Не знаю, как с этим обстоят дела у AMD именно в DP, но точно могу сказать по своей практике, что OpenCL несравнимо лучше загружает CPU. В частности, при рендере видео все 4 потока моего i5 загружены от 70-80%. При использовании же GPU nVidia в режиме CUDA под завязку загружено лишь одно ядро, а остальные на более, чем на 20-30%. Но стоит переключить рендер в режим OpenCL - ситуация нормализуется и так же начинают грузиться все ядра и 2 Титана выполняют рендер за то же время, что и 2х7970 (тут, правда, всё уже упирается в производительность дисковой подсистемы). Это к вопросу о мифе, что, мол с OpenCL у nVidia сложности - это давно не так.


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
ShadowTM
Все так. Поддержки OpenCL 2.0 у Nvidia нет и хз появится ли она вообще...


 

Member
Статус: Не в сети
Регистрация: 16.12.2008
Откуда: Воронеж
ShadowTM писал(а):
Кстати, расчёты в DP при 2хK10 (4хGK104), как утверждают люди, использующие сервер, крайне незначительно превосходят возможности при процессорном просчёте (16 ядер Xeon). И тут мы передаём привет CUDA, которая не умеет при распараллеленых расчётах на GPU эффективно утилизировать мощности CPU.
Производительность даже такой связки (при 2хK10 (4хGK104)) в DP даже теоретически не намного превосходит возможности 16 ядер Xeon, а к этому ещё добавляются накладные расходы на пересылку данных, в результате "имеем то что имеем". По поводу утилизации процессора: если в SP 2хK10 показывают хорошую производительность с загрузкой только одного ядра процессора, то вряд ли это является бутылочным горлышком в DP. Да и вообще, Нвидиа, не имея своего процессора(высокопроизводительного) старается максимально перенести рассчеты на GPU, чтоб в будущем нескольких ядер ARM (которые она собирается встроить в GPU) с головой хватало чтоб рулить многотерафлопсным хозяйством...

Добавлено спустя 3 минуты 10 секунд:
yorka писал(а):
ShadowTM
Все так. Поддержки OpenCL 2.0 у Nvidia нет и хз появится ли она вообще...
Появится, только сначала там где её не ждут - в Теграх, так как они по своему строению являются тем, что АМД называет гордым именем APU

_________________
AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 28 • Страница 2 из 2<  1  2
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 17


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan