Приложения под NVIDIA CUDA можно адаптировать для работы с ускорителями AMD

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 25.04.2024 9:35

Сообщения без ответов | Активные темы

Список форумов » Сайт и конференция » Материалы сайта » Обсуждение новостей

Часовой пояс: UTC + 3 часа

Модератор: Sonic-Chainik

Новая тема /

Закрыто

Сообщений: 19

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Overclockers.ru

Добавлено: 16.04.2018 9:38

[профиль]

роБОТяга
Статус: Не в сети
Регистрация: 05.07.2005

Ждём Ваших отзывов о материале.

Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
За статью можно проголосовать на странице материала.

Напоминаем о том, что на сообщения новых участников распространяется действие системы премодерации сообщений.

О нарушениях можно сообщить модератору, нажав синюю кнопку #77 справа над спорным сообщением.

Реклама
Партнер

1usmus

Добавлено: 16.04.2018 9:55

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 07.06.2017
Откуда: Persey omicron

Неплохо

_________________
Twitter -> @1usmus

matocob

Добавлено: 16.04.2018 10:17

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 85

При этом о падении производительности за счёт трансляции враппером ничего не сообщается.
Так же не понятно, HIPfy - это программная или аппаратная виртуальная машинка

Zio

Добавлено: 16.04.2018 10:51

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 29.10.2003
Откуда: 埼玉、日本
Фото: 9

https://github.com/ROCm-Developer-Tools ... pify-clang : HIPify = clang + <CUDA->HIP map>
HIP FAQ: https://github.com/ROCm-Developer-Tools ... hip_faq.md

matocob программная, не виртуальная машинка, a транслятор кода.

Добавлено спустя 4 минуты 31 секунду:

matocob писал(а):

падении производительности за счёт трансляции

падение производительности если и будет, то от различий архитектур ГПУ, только они всегда есть и в ОпенГЛ тоже проявляются. утилита, описанная в статье не предназначена для оптимизации кода.

1usmus

Добавлено: 16.04.2018 10:57

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 07.06.2017
Откуда: Persey omicron

matocob
HIP позволяет кодировать в одном языке программирования C++ с одним источником, включая такие функции, как шаблоны, C ++ 11 lambdas, классы, пространства имен и т.д.
На платформе NVIDIA CUDA HIP предоставляет заголовочный файл, который кодируется с HIP runtime APIs в CUDA runtime APIs. Файл заголовка содержит в основном встроенные функции и, следовательно, имеет очень низкие накладные расходы - разработчики, кодирующие в HIP, должны ожидать такую же производительность, как и кодирование в CUDA. Затем код компилируется с помощью nvcc, стандартного компилятора C ++, поставляемого с CUDA SDK. Как-то так

_________________
Twitter -> @1usmus

Zio

Добавлено: 16.04.2018 10:58

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 29.10.2003
Откуда: 埼玉、日本
Фото: 9

FAQ: "HIP code provides the same performance as native CUDA code, plus the benefits of running on AMD platforms."

1usmus

Добавлено: 16.04.2018 11:28

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 07.06.2017
Откуда: Persey omicron

Zio
вот прикол если на ATI приложения будут куда лучше работать чем на самой NV

_________________
Twitter -> @1usmus

mag_ai

Добавлено: 16.04.2018 12:31

[профиль]

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел

я уже было подумал что они в драйвер замутили перехватчик вызовов суды в опенсл... а так любой код можно оптимизировать с любого равноценного апи на любое равноценное апи было бы желание.

_________________
Мертвый киберпанк с улыбкой мутанта... (:

linux4ever

Добавлено: 16.04.2018 17:13

[профиль]

Member
Статус: Не в сети
Регистрация: 13.06.2008

HIP C++ не работает под Windows.

_________________
Ryzen 5800X3D, Asus Crosshair VI Hero, KHX3600C18D4/32GX x 2, RX 6900 XT, Samsung 970 Pro 1Tb + 3 x 2 Tb SATA SSD.

TNT

Добавлено: 16.04.2018 18:10

[профиль]

Member
Статус: Не в сети
Регистрация: 10.09.2015
Откуда: Санкт-Петербург

Те, кто этим будет заниматься - тоже.

matocob

Добавлено: 16.04.2018 18:20

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 31.07.2006
Откуда: Академгородок П
Фото: 85

mag_ai примерно те же мысли, только ещё и с возможностью реализации в прошивке железа :lol:

Размечтался.

AlarmZone13

Добавлено: 16.04.2018 18:21

[профиль]

Member
Статус: Не в сети
Регистрация: 03.02.2009
Откуда: Баку

matocob писал(а):

При этом о падении производительности за счёт трансляции враппером ничего не сообщается.

Не думаю, что будет падение в производительности, если и будет, то незначительно. CUDA ядра, это обычные потоковые процессоры, просто nVidia решила дать им имя. AMD тоже пытались дать им имя, например Stream ядра.

mag_ai

Добавлено: 16.04.2018 19:02

[профиль]

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел

AlarmZone13 ну вообще нв давала название "стреам" (как и амд) не самим ядрам, а кластерам кеплер смх, максвелл смм (загуглил SMM англ. Streaming Maxwell Multiprocessor). амд же называет свои "суда ядра" правильно - алушками, а кластеры "cu" (Compute Units)... если же они где то и использовали "стреам" то было это до выхода гсн, но тогда было много чего интересного например "ати стреам".

_________________
Мертвый киберпанк с улыбкой мутанта... (:

TNT

Добавлено: 17.04.2018 6:53

[профиль]

Member
Статус: Не в сети
Регистрация: 10.09.2015
Откуда: Санкт-Петербург

AlarmZone13 писал(а):

обычные потоковые процессоры

могут настолько сильно отличаться от других не менее обычных, что разница запросто будет. Так же, как если вы скомпилируете программу для какого-нибудь Интела, она никогда не заработает быстрее от этого на АМД.

mag_ai

Добавлено: 17.04.2018 10:07

[профиль]

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел

TNT нет на видеокартах разницы в алушках / фпушках как и нет разницы в алушках / фпу в цпу... сами числодробилки одинаковые обвязка может отличаться те кеши объем, скорость, разные уровни, количество циклов на определенные операции тоже самое можно написать и про декодер, планировщик и тд но сути математических юнитов это не меняет поэтому написанный код раз и на всегда запуститься на аналогичном оборудовании в том числе если бы апи суды не было закрытым то любой код прекрасно работал на амдшных картах... собственно "оптимизацию кода под цпу" это учет архитектурных хаков х86 определенных производителей дабы код работал быстрей.

_________________
Мертвый киберпанк с улыбкой мутанта... (:

fedx

Добавлено: 17.04.2018 10:28

[профиль] [Фотоальбом]

Moderator
Статус: Не в сети
Регистрация: 09.01.2007
Откуда: Москва
Фото: 151

Оптимизировать можно, но не нужно. Как и всегда, решат деньги.

_________________
Acer XF253QXbmiiprx 24.5" 1080p@240hz / Ryzen 7800X3D / B650M Mortar / DDR5 6200 @ 32-39-39-54 @ 1.35v / Palit GeForce RTX™ 4070 JetStream

TNT

Добавлено: 18.04.2018 6:13

[профиль]

Member
Статус: Не в сети
Регистрация: 10.09.2015
Откуда: Санкт-Петербург

mag_ai писал(а):

TNT нет на видеокартах разницы в алушках / фпушках как и нет разницы в алушках / фпу в цпу... сами числодробилки одинаковые обвязка может отличаться те кеши объем, скорость, разные уровни, количество циклов на определенные операции тоже самое можно написать и про декодер, планировщик и тд но сути математических юнитов это не меняет поэтому написанный код раз и на всегда запуститься на аналогичном оборудовании в том числе если бы апи суды не было закрытым то любой код прекрасно работал на амдшных картах... собственно "оптимизацию кода под цпу" это учет архитектурных хаков х86 определенных производителей дабы код работал быстрей.

Суть процессора - процессор, это понятно

Но как раз в тех деталях, что вы перечисляете, и есть вся разница. Если спуститься на самый низкий уровень ее, поятно, уже не будет, но вот пока оно туда будет спускаться, пройдет немало времени и каждый этап на каждом процессоре будет разный. API OpenGL и DirectX известны всем, но одним только AMD и NVIDIA известно то, как его правильно позвать, чтобы оно работало побыстрее именно на их картах. И то, что "оптимизировано" под одно, скорее всего, будет менее выигрышно смотреться на другом. Хотя, в принципе, и то, и то - видеокарты

mag_ai

Добавлено: 18.04.2018 12:58

[профиль]

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел

TNT писал(а):

API OpenGL и DirectX известны всем

это неправда. у арма своя графика у квалкома своя... у аппла своя... у повервр тоже графика и тоже своя, интел своя графика и есть еще много мелких поставщиков графики. и все эти компании знаю если не про деректх то про опенгл точно.

TNT писал(а):

И то, что "оптимизировано" под одно

нет такого как оптимизация апи - либо работает либо нет и еще один вариант "эмулируется на цпу" и на этом все.
конкретно графическую сцену можно оптимизировать под конкретные особенности гпу, но не само апи (например амд слаба в геометрии а нв наоборот - добавить кучу избыточной тесселяции и карты амд начнут захлебываться). апи же просто инструмент который позволяет реализовывать ту самую "тесселяцию" и другие обращения в карте (или конкретным юнитам карты).

_________________
Мертвый киберпанк с улыбкой мутанта... (:

TNT

Добавлено: 19.04.2018 20:22

[профиль]

Member
Статус: Не в сети
Регистрация: 10.09.2015
Откуда: Санкт-Петербург

mag_ai писал(а):

Я не имел в виду, что все их на 100% поддерживают. Я имел в виду, что API можно пользоваться.

mag_ai писал(а):

нет такого как оптимизация апи

Конечно, нет. Есть оптимизация сцены под реализацию API (то, что называется implementation).

mag_ai писал(а):

конкретно графическую сцену можно оптимизировать под конкретные особенности гпу

Да, про это я и говорил: вы знаете, какие вызовы и по какой причине с какими значениями лучше или хуже работают. Вы можете чего-то избегать или, наоборот, пихать везде и побольше. Вы даже в некоторых случаях вольны сделать одно и то же разными вызовами.

Новая тема /

Закрыто

Сообщений: 19

Список форумов » Сайт и конференция » Материалы сайта » Обсуждение новостей

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: Bing [Bot] и гости: 47

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:

Приложения под NVIDIA CUDA можно адаптировать для работы с ускорителями AMD

Кто сейчас на конференции

Лаборатория

Ретроклокинг: влияние поколений интерфейсов SSD на производительность

Обзор ноутбука ASUS Zenbook DUO (UX8406)

Обзор и тестирование модульного блока питания MSI MAG A850GL PCIE5

Обзор и тестирование процессорного кулера APNX AP1-V

Обзор и тестирование материнской платы MSI Z790 Gaming Plus WIFI

Новости