Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 243 • Страница 11 из 13<  1 ... 8  9  10  11  12  13  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
mo3ulla писал(а):
вкратце напрямую несовместим.. только через костыли. потому что стилистически написаное под Nvidia OpenCL до боли в одном месте напоминает Cuda . под это и затачивалось . а никак не ради поритабельности

OpenCL работает поверх CUDA... :lol: Даже если это и изменилось, то пилить SDK не будут, ибо есть CUDA.
mo3ulla писал(а):
как итог мир разделился на
- Intel OpenCL compiler for Intel CPUs
- Nvidia OpenCL compiler for Nvidia GPUs
- AMD OpenCL compiler for AMD CPUs
- AMD OpenCL compiler for ATI GPUs

не особо совместимыми друг с дружкой

Иди учи что такое стандарт. Компилятор может быть какой угодно - все компилится из одного кода.

Добавлено спустя 2 минуты 30 секунд:
mo3ulla писал(а):
где то рядом ходит дженсен и ржет . Cuda write once - use many

:lol:
Спасибо поржал. В рамках одного поколения GPU код одинаковый, а вот под какое-нибудь старье тебе придется код переписывать, равно как и под новую архитектуру (Maxwell).



Партнер
 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
mo3ulla писал(а):
не особо совместимыми друг с дружкой


Есть стандарт. Конкретные реализации - проблемы реализаторов.

mo3ulla писал(а):
как итог мир разделился на
- Intel OpenCL compiler for Intel CPUs
- Nvidia OpenCL compiler for Nvidia GPUs
- AMD OpenCL compiler for AMD CPUs
- AMD OpenCL compiler for ATI GPUs


Это как писать, что мир разделился на CPU и GPU.
Есть код на opencl. Он - один. Просто один. Есть компилятор, оптимизатор и прочее в одном флаконе. И есть железка.
Юзера вообще не волнует, что делается под капотом. Если рантайм работает хреново, то это его личные проблемы.

mo3ulla писал(а):
затачивается под векторизацию ( которая по понятным причинам в гпу невозможна ) .


Стояяяять. GPU и есть SIMD-юнит, ты чего?


 

Member
Статус: Не в сети
Регистрация: 20.02.2007
Откуда: Москва
yorka писал(а):
Оно в реале так работает и без всяких костылей...


:D так почему светлое будущее все никак не наступает .. раз везде мир дружба упячка :haha:
почему тот же биткойн . лучше работает на [автоцензор3.14] .а не на NV ? раз CL такой портабельный.?

yorka писал(а):
Потому что OpenCL на Nvidia работает через жопу - медленно и глючно. Поэтому и используют CUDA. Почему оно так у Nvidia работает думаю объяснять не нужно.


раз все так глючно что же сподвигло лабораторию в оак ридж использовать Nvidia CUDA и TESLA и не пачки fire pro ? :haha: или они любят погорячее ?

yorka писал(а):
Контроллер памяти общий - программа выполняется как на CPU, так и на GPU (параллельно) безо всякого копирования данных из одной памяти в другую. Читай что такое HSA...

так цель снять нагрузку с цпу ВОВСЕ .или минимизировать ..
1. контроллер памяти тоже имеет % загрузки.
2. ну ето пожалуй единственный плюс костыля HSA. что не нада копировать между разными устройствами хранения . только слабо применимый в условиях кластера и дискреток . что и является проблемой

yorka писал(а):
HSA гораздо лучше. Там где нужна мощь в однопотоке твой Phi сольется,

в однопотоке ? phi ? u mad bro ? архитектура ета была создана в рассчете на паралелизм . и кластеризацию . какой в дупло однопоток ? ты еще с Xeon E5 сравни . как у этих малышей будет с однопотоком


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
mo3ulla писал(а):
что же сподвигло лабораторию в оак ридж использовать Nvidia CUDA и TESLA и не пачки fire pro ?


95%, что уже имеют какой-то код и переписывать не хотят.

mo3ulla писал(а):
почему тот же биткойн . лучше работает на [автоцензор3.14] .а не на NV ? раз CL такой портабельный.?


Потому что гладиолус, портабельность не имеет ничего общего со скоростью.
Почему программа работает быстрее на 4770k, чем на FX8350?

Биткоин имеет алгоритмы, которые хорошо ложатся на архитектуру AMD.
Были бы другие - фиг знает, может бы nvidia раскупали для майнинга.


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
mo3ulla писал(а):
раз все так глючно что же сподвигло лабораторию в оак ридж использовать Nvidia CUDA и TESLA и не пачки fire pro ? или они любят погорячее ?

На CUDA легче писать + жирафы в DP побыстрее будут. AMD догнала kepler лишь в hawaii.
mo3ulla писал(а):
так цель снять нагрузку с цпу ВОВСЕ .или минимизировать ..

Зачем это делать, если программа одна и изначально запускается в ОС, которая крутится на CPU?
mo3ulla писал(а):
1. контроллер памяти тоже имеет % загрузки.

Конечно имеет
mo3ulla писал(а):
2. ну ето пожалуй единственный плюс костыля HSA.

Какого костыля? Костыль был до этого, когда ты данные из одного места системной памяти копировал в другое место, тупо по причине того, что чисто физически GPU не имел доступа ко всей системной памяти.
mo3ulla писал(а):
в однопотоке ? phi ? u mad bro ?

Есть программа, которая использует одновременно и CPU, и GPU. Phi в таком случае будет посасывать, гоняя данные через PCI-E шину и контроллер памяти центрального CPU. Нужно например перелопатить блок данных в 20Gb (куча таблиц и матриц с данными). Что ты там со своим Phi делать будешь - в память то все не поместится, а еще же нужно промежуточные расчеты где-то хранить. В таком случае Phi будет посасывать. В то время как APU с HSA будет чувствовать себя довольно комфортно.
mo3ulla писал(а):
только слабо применимый в условиях кластера и дискреток . что и является проблемой

А речь о кластере и не шло. Таких систем (на APU c HSA) в природе пока еще не существует.


 

Member
Статус: Не в сети
Регистрация: 20.02.2007
Откуда: Москва
devl547 писал(а):
Стояяяять. GPU и есть SIMD-юнит, ты чего?


не путай SIMD ( INTEL ) - SIMT - и SMT
разные вещи .также как и разные по принципам паралелизации :) последние 2 как раз про гпу .

yorka писал(а):

Иди учи что такое стандарт. Компилятор может быть какой угодно - все компилится из одного кода.


да тока результат получается разный . в силу учитывания или не учитывания целевой платформы .или напомнить как интелевский с++ компилятор обожает процессоры AMD ? :)

yorka писал(а):
В рамках одного поколения GPU код одинаковый, а вот под какое-нибудь старье тебе придется код переписывать, равно как и под новую архитектуру (Maxwell).


не совсем . одно дело сделать изменения внутри обработчика Cuda . другое дело капитально перепиливать и структуру тоже . изменения того же максвела не несут ультимативный характер . программа может. а может и не использовать unified memory .

Цитата:
Биткоин имеет алгоритмы, которые хорошо ложатся на архитектуру AMD.
Были бы другие - фиг знает, может бы nvidia раскупали для майнинга.


таки согласись что стандарт не сильно помог унификации 3х разных вариаций одного и того же якобы :)

Цитата:
AMD догнала kepler лишь в hawaii.

все в нашем мире относительно
998.4 ( fire pro 9000 ) VS 1430 ( к40 )

Цитата:
CPU, и GPU. Phi в таком случае будет посасывать,


веселый документ за авторством интеля где сравнивались возможности GT200 и Core I7 . вкратце они пытались обяснить что далеко не каждая задача . пульнутая в гпу и еффективней будет быстрее аналогичной задачи на голом цпу.также затрагивается вариант что возможно и наоборот когда CPU будет быстрее GPU . желающим приобщиться .. пожалуйста http://pcl.intel-research.net/publicati ... 19-lee.pdf
Цитата:

Зачем это делать, если программа одна и изначально запускается в ОС, которая крутится на CPU?

вводится лиш понятие место выполнения ( облако ) . где сливаются возможности различных сред выполнения кода в единое пространство . когда программа может занять какой либо адаптер и не будет чинить препятствий соседнему адаптеру. не кушая на постоянные обращения к общесистемному цпу его время не занимая почем зря шину . и не занимая лишнюю общестстемную память . вести коммуникацию между ускорителями напрямую и в в обход хостовых CPU .. целый новый мир . облачных серверов . и эру начали......................без AMD :)) :lol:

Добавлено спустя 12 минут 58 секунд:
yorka писал(а):
Костыль был до этого, когда ты данные из одного места системной памяти копировал в другое место, тупо по причине того, что чисто физически GPU не имел доступа ко всей системной памяти.


вы слишком одномерно мыслите . для систем в которых используется та же тесла это не актульно фиг знает сколько времени . и называется сие Numa .а также в рамках инициативы унифицированной памяти . когда ос . запуская задачу может использовать память из разных пулов . без лишнего оверхеда ( накладных расходов ) . что и предполагает инициатива Intel и которую подхватили NV


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
mo3ulla писал(а):
и эру начали......................без AMD

Phi не видеокарта, а непонятно что. У Nvidia пока только на бумаге и непонятно что в итоге получится.
mo3ulla писал(а):
когда программа может занять какой либо адаптер и не будет чинить препятствий соседнему адаптеру. не кушая на постоянные обращения к общесистемному цпу его время не занимая почем зря шину

Если программа узкоспециализированная и полностью параллелится, то зачем ей CPU? - залил данные в видеопамять, обработал и выгрузил в оперативку результат. Есть программы, которые требуют работы тандема CPU+GPU и никакие дополнительные ARM ядра на видяхе это не исправят.
mo3ulla писал(а):
не будет чинить препятствий соседнему адаптеру. не кушая на постоянные обращения к общесистемному цпу его время не занимая почем зря шину

А как по твоему подгружаются данные в видеопамять? Или Intel научилась передавать данные по воздуху, минуя контроллер памяти CPU?
mo3ulla писал(а):
вы слишком одномерно мыслите . для систем в которых используется та же тесла это не актульно фиг знает сколько времени . и называется сие Numa .а также в рамках инициативы унифицированной памяти . когда ос . запуская задачу может использовать память из разных пулов . без лишнего оверхеда ( накладных расходов ) .

:lol:
Что по воздуху данные получает? Для того, чтобы не было оверхеда ты обязан иметь прямой (физически) доступ к памяти. А иначе ты будешь дергать КП другого процессора. В случае GPU-CPU это невозможно.
mo3ulla писал(а):
что и предполагает инициатива Intel и которую подхватили NV

NV предлагает виртуально единую память, где вся логика будет выполнятся софтово (т.е. программисту тупо упростят задачу написания программы) и оверхед никуда не денется. А в случае криворукого программиста, который слишком часто будет дергать память наоборот добавится.


 

Member
Статус: Не в сети
Регистрация: 25.03.2012
mo3ulla писал(а):
длиннее всех у Nvidia с их Cuvid способным ускорять абсолютно все .


Вы бы имели представление, о чём пишите.
Ускорять декодирование в реальном времени? Так это невероятно полезно - можно смотреть фильмы на бешеных скоростях. Стоп! Так ведь это же не нужно, для просмотра нужно декодирование в реальном времени, или я ошибаюсь? А при транскодировании технология оказывается столь же бессмысленной как и QuikSync, поскольку GPGPU всё равно выполняет эти задачи несоизмеримо быстрее даже на картах среднего уровня. Единственное применение обеих технологий - ноутбуки без дискретного видео, там они помогут пережать ролик со значительно меньшими затратами энергии. Хотя, в случае с nVidia это тоже не факт, поскольку при использовании GPGPU энергии, вероятно, затрачено будет меньше.

mo3ulla писал(а):
THG на шине доппитания ( которое идет исключительно на цпу . фазы PCH и памяти идут с 24 пиновика ) ГОЛОГО процессора получили результат в 32 вата


Что, ТЕПЛА??? :shock: Беру все свои слова обратно, поскольку не могу спорить с теми, кто определяет количество выделяемого тепла по шине питания ГОЛОГО процессора. Просто сдаюсь.

mo3ulla писал(а):
поделитесь с общественностью нагибательским видео . которое положит на лопатки I5 3339y


Я уже устал кидать ссылки, поищите сами любой интерлейсный VC-1 1080i. Или, например, AVC Level@5.1. MVC тоже очень нравится всем i5 до Хасвеллов. При том, что декларируется аппаратная поддержка формата - процессор греется нарядно.
Я не говорю, что с каким-то из этих форматов i5 не справится - нормальный i5 вытянет любой из них, пусть и с редкими подтормаживаниями в отдельных случаях. Речь о том, что UVD3.0 любой из этих форматов декодирует аппаратно, находясь в минимальном положении QnQ, а i5 будет греться в отдельных случаях во весь свой TDP. Про качество картинки говорить не буду - оно без енхансеров заметно не отличается, а вот енхансеров на Intel во многих влучаях Вам не положено, поскольку то недоступна постобработка, то не задействуются шейдеры, то нет полноценной поддержки OpenCL.


 

Member
Статус: Не в сети
Регистрация: 22.05.2012
Откуда: Москва
Кстати, сабж теперь много где в Москве продается.
A10-7850k в коробке идет вместе с BF4, кто знает? Стоит от ~7k.


 

Member
Статус: Не в сети
Регистрация: 20.02.2007
Откуда: Москва
yorka писал(а):
Phi не видеокарта, а непонятно что. У Nvidia пока только на бумаге и непонятно что в итоге получится.

технически Phi - массив упрощенных х86 ядер . со своей память и под управлением прошивки на основе Linux осуществляющей управление целевым девайсом . Phi изначально предполагал испоельзование унифицированной памяти . когда софт имеет возможность адресовать в едином пространстве и системную и память ускорителя . согласно модели DSM ( Distributed shared memory ) . Nvidia в максвеле будет предлагать полностью схожий фукнционал
yorka писал(а):
Если программа узкоспециализированная и полностью параллелится, то зачем ей CPU? - залил данные в видеопамять, обработал и выгрузил в оперативку результат. Есть программы, которые требуют работы тандема CPU+GPU и никакие дополнительные ARM ядра на видяхе это не исправят.


во первых далеко не все задачи паралелятся . да и дабы не повторятся рекомендую зачитать http://pcl.intel-research.net/publicati ... 19-lee.pdf . вопросы такого рода отпадут сами собой .. и мб откроются глаза
ARM ядра нужны лиш для запуска Cuda приложения Вне системного CPU . и снятия нагрузки как с цпу так и с шин . Phi по тем же принципам работает . хост программа там крутится на одном из ядер . которая и занимается управлением как ускорителем так и менеджментом ресурсов . так и коммуникацями с другими ускорителями или нодами кластера .

yorka писал(а):
А как по твоему подгружаются данные в видеопамять? Или Intel научилась передавать данные по воздуху, минуя контроллер памяти CPU?

yorka писал(а):
NV предлагает виртуально единую память, где вся логика будет выполнятся софтово (т.е. программисту тупо упростят задачу написания программы) и оверхед никуда не денется. А в случае криворукого программиста, который слишком часто будет дергать память наоборот добавится.


AS IS она не адресуется в едином пространстве . для етого и нужны переделки под DSM и DM архитектуры . да и обращение вида GPU -> UNCORE -> RAM всяко быстрее чем GPU -> CPU -> UNCORE - > ram . а уж если физических процессоров 2 . и памяти не 1 нод а несколько то придется еще искать какой нод и какой процессор держит искомый фрагмент

и опять же узко мыслиш ) для разрешения коллизий и чтобы лишний раз не дергать системную память на поле появляется еще один игрок - OS :) которая должна поддерживать модели Numa-DSM и DM. что нынешние ос и научились делать

ShadowTM писал(а):
Вы бы имели представление, о чём пишите.

ну прежде чем лезть в тему о таких вещах .вам бы следовало узнать по аспекты этих вещей http://ru.wikipedia.org/wiki/PureVideo :lol: который в MPC называется Cuvid

Наборы функций NVIDIA VDPAU

Наборы функций NVIDIA VDPAU[5] являются различными аппаратными поколениями с разными аппаратными возможностями декодирования. Для всех текущих наборов функций от NVIDIA максимальная ширина и высота видео — 2048 пикселей, минимальная ширина и высота — 48 пикселей, и все кодеки в настоящий момент ограничены максимумом 8192 макроблоками (8190 для VC-1/WMV9). Частичное ускорение означает, что VLD декодирование выполняется на ЦП, GPU же, выполняет только iDCT, компенсацию движения и деблокирование. Полное ускорение означает, что GPU выполняет всё — VLD, iDCT, компенсацию движения и деблокирование.

Набор функций A
Полное ускорение для H.264
Частичное ускорение для MPEG-1, MPEG-2, VC-1/WMV9
Набор функций B
Полное ускорение для MPEG-1, MPEG-2, VC-1/WMV9 и H.264.
Весь набор функций B не может аппаратно декодировать H.264 для следующих ширин: 769—784, 849—864, 929—944, 1009—1024, 1793—1808, 1873—1888, 1953—1968, 2033—2048 пикселей.
Набор функций C
Полное ускорение для MPEG-1, MPEG-2, MPEG-4 part 2 ASP, VC-1/WMV9 и H.264.
Глобальная компенсация движения и разделение данных не поддерживаются для MPEG-4 Part 2.
Набор функций D
Полное ускорение для MPEG-1, MPEG-2, MPEG-4 part 2 ASP, VC-1/WMV9 и H.264.
Глобальная компенсация движения и разделение данных не поддерживаются для MPEG-4 Part 2.
Декодирование 4k видео



ShadowTM писал(а):
Что, ТЕПЛА??? :shock: Беру все свои слова обратно, поскольку не могу спорить с теми, кто определяет количество выделяемого тепла по шине питания ГОЛОГО процессора. Просто сдаюсь

господа. я в шоке . КОГДА И КТО ОТМЕНИЛ ПЕРВЫЙ ЗАКОН ТЕРМОДИНАМИКИ !?? :lol: который применительно к процессорам говорит нам что количество использованного електричества в интегральных схемах расходуется на переключение транзиторов . которое и выделяется ВВИДЕ ТЕПЛА. которое и составляет TDP . ну это же елементарно ватсон . уроки физики . средняя школа .
или ради амд законы физики уже отменили ?

ShadowTM писал(а):
Я уже устал кидать ссылки, поищите сами любой интерлейсный VC-1 1080i. Или, например,

ну а смысл был воздух сотрясать . вот я . да я вам покажу . дам ссылку . и интель будет на задворках истории . такая пафосная бравада . и вся осталась лиш бравадой :roll:


 

Member
Статус: Не в сети
Регистрация: 25.03.2012
mo3ulla писал(а):
вам бы следовало узнать по аспекты этих вещей http://ru.wikipedia.org/wiki/PureVideo который в MPC называется Cuvid


Нет, в MPC он называется DXVA. А Cuvid - это аналог HAM под AMD от Cyberlink, когда конвейер VP4+ используется напрямую без DirectDraw или MF. В MPC использование метода возможно только с использованием стороннего LAV, насколько мне известно.
Cuvid имеет свой набор достоинств и недостатков, но ничего нового инструмент не предлагает. Разве что в теории на Кеплерах можно ускорять транскодирование видео, но на практике софта для этого я пока так и не увидел, да и я уже объяснял, что это не нужно, поскольку любой Кеплер сделает это значительно быстрее с помощью GPGPU.

mo3ulla писал(а):
господа. я в шоке . КОГДА И КТО ОТМЕНИЛ ПЕРВЫЙ ЗАКОН ТЕРМОДИНАМИКИ !?? который применительно к процессорам говорит нам что количество использованного електричества в интегральных схемах расходуется на переключение транзиторов . которое и выделяется ВВИДЕ ТЕПЛА. которое и составляет TDP .


Я Вам говорю о том, что APU, декодируя в программном режиме, выделяет в районе 10Вт тепла, Вы же мне: какие 10! Он 40 потребляет!
Вероятно, выделять он будет тоже 40 по Вашей логике. И, хотя при декодировании нагружен только UVD, а ядра и GPU функционируют в режиме минимальных частот и напряжения с загрузкой 3-5% т.е фактически состояние покоя, но ещё не CX.

mo3ulla писал(а):
ну а смысл был воздух сотрясать . вот я . да я вам покажу . дам ссылку . и интель будет на задворках истории . такая пафосная бравада . и вся осталась лиш бравадой


Вы не в состоянии сами найти видео по указанным параметрам?
Так я Вам помогу.
Например.
Или вот.
Дурное дело - нехитрое.


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
mo3ulla писал(а):
и чтобы лишний раз не дергать системную память на поле появляется еще один игрок - OS которая должна поддерживать модели Numa-DSM и DM. что нынешние ос и научились делать

Да откуда ОС знает что там высокоуровневая CUDA будет творить? Вся логика софтовая.
mo3ulla писал(а):
Phi изначально предполагал испоельзование унифицированной памяти . когда софт имеет возможность адресовать в едином пространстве и системную и память ускорителя .

Если в случае с Intel это одна компания (ускоритель-материнка-процессор) и есть возможность сделать это на аппаратном уровне, то
mo3ulla писал(а):
Nvidia в максвеле будет предлагать полностью схожий фукнционал

тут ничего подобного не будет.
mo3ulla писал(а):
во первых далеко не все задачи паралелятся .

Тем хуже для Phi и других ускорителей, которые в силу аппаратных ограничений вынуждены гонять данные через КП центрального процессора.
mo3ulla писал(а):
Nvidia в максвеле будет предлагать полностью схожий фукнционал

Виртуальная память с софтовой логикой сильно медленнее физически единого пула памяти. Особенно когда в программе активно используется CPU+GPU и часто дергается память.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
mo3ulla писал(а):
желающим приобщиться .. пожалуйста http://pcl.intel-research.net/publicati ... 19-lee.pdf


Почитал.
1. Код для gt280 в большинстве случаев быстрее кода для i7-920. Исключения - случаи с активными ветвлениями.
2. Тесты 2010 года. Напомнить тебе, в каком зачаточном состоянии было gpgpu тогда?
3. На кой-то фиг для тестов взяли nvidia, когда в это время уже Radeon 5xxx были.
4. Могу напомнить, что в тот момент вышли драйвера nvidia с поддержкой OpenCL 1.1, но которые были процентов на 30-40 старых.

ShadowTM писал(а):
APU, декодируя в программном режиме, выделяет в районе 10Вт тепла, Вы же мне: какие 10! Он 40 потребляет!


Профильный при проигрывании видео по первой ссылке таки жрал 40 ватт. Из розетки.
Процессор висел большую часто времени в простое, видео тоже.


 

Заблокирован
Заблокирован
Статус: Не в сети
Регистрация: 04.06.2011
Откуда: Самара
ShadowTM писал(а):
Уже к концу этой недели у многих 7850K будет по цене ниже 6т.р.
Ещё на прошлой неделе начали таможить партии, в которых себестоимость ниже 5т.р. (+ примерно 20% розничной наценки), а через 3-4 недели будет партия с инвойсной ценой на 10% ниже и там их значительно больше поштучно. Соответственно, итоговая себестоимость будет, по меньшей мере, на 20% ниже и легко можно прогнозировать цену в районе 5,5 т.р. при условии, что курс не будет расти и не образуется дефицит процессоров.

Он опять наврал
http://market.yandex.ru/model.xml?hid=9 ... 1&clid=502

_________________
Вы предавали Русь стократно, Чужому — вверившись — уму.
Вас Русь прощала, но обратно Тянули шею вы к ярму. (с)


 

Member
Статус: Не в сети
Регистрация: 20.02.2007
Откуда: Москва
ShadowTM писал(а):
Нет, в MPC он называется DXVA. А Cuvid - это аналог HAM под AMD от Cyberlink, когда конвейер VP4+ используется напрямую без DirectDraw или MF. В MPC использование метода возможно только с использованием стороннего LAV, насколько мне известно.


CUVID - https://developer.nvidia.com/nvidia-video-codec-sdk .это полностью ОТДЕЛЬНЫЙ продукт не на базе DXVA . Nvidiaевский декодер досутпен в 2 вариациях .
1.DXVA команд . неполный функционал . согласно стандарту и ничего более
2.как CUVID отдельная проприетарная библиотека . с гораздо большим колвом поддерживаемых стандартов . является частью LAV это так .

ShadowTM писал(а):
Вы не в состоянии сами найти видео по указанным параметрам?


Core I5 3339Y с TDP 10W передает привет . что он совершенно НЕ ВПЕЧАТЛЕН
Лига Чемпионов 2013-2014 / Группа F / 4-й тур / Боруссия Д (Дортмунд, Германия) - Арсенал (Лондон, Англия) по одной из ссылок . по второй . было качать

и так собственно привет от 10ти ватного процессора
#77

он даже частоту не поднимал

yorka писал(а):
Да откуда ОС знает что там высокоуровневая CUDA будет творить? Вся логика софтовая.

модерновые оси . уже имеют поддержку гибридных моделей распределению . достаточно лиш сделать Pass Through ( возможность прямой внешней адресации набортной памяти ) чтобы хостовая система могла исползовать собственный механизм адресации на новом адаптере и обявить етот адаптер нодом той же DSM или SM модели и все. все остальное уже в новых осях есть . что избавит програмистов от вызова драйверов. и упростит итоговое програмирование. а уж програмисты под кластера и вовсе памятник поставят :) за возможность кросс нодовой адресации

yorka писал(а):
Если в случае с Intel это одна компания (ускоритель-материнка-процессор) и есть возможность сделать это на аппаратном уровне, то

там нет ничего аппаратного :) PHI работает под своей прошивкой . которая получает команды от драйвера хоста. никаких черных приемов . или недокументированных возможностей :)

yorka писал(а):
тут ничего подобного не будет.

абсолютно таже модель . только не на базе X86 а на базе ARM процессора . можно хоть мипс влепить . гпу будет работать аналогично . под своей прошивкой ( внутри UEFI GPU модулей ) . которая будет получать директивы хоста. темболее никто не говорит о прямом програмировании денвера . отвечать он будет лиш на код и директивы CUDA от самого драйвера . то есть никто кодить под арм заставлять не будет

yorka писал(а):
Виртуальная память с софтовой логикой сильно медленнее физически единого пула памяти. Особенно когда в программе активно используется CPU+GPU и часто дергается память.

полностью аппаратно единый пул с гпу . хороший выход из положения . строго до момента пока процессор один . при 2 и более физ процессоров . речь начинает идти о тех же проблемах что и без апаратно общего контроллера.
но проблема в том что разница невелика :) PCIEX генерирует сам посебе очень маленькую латентность на DMA доступ . который дополнительно снижают ускорителями . навроде Nvidia GPU DIRECT (RDMA ) https://developer.nvidia.com/gpudirect . PHI предлагает похожее . только грязноватым аппаратным трюком :D

devl547 писал(а):
2. Тесты 2010 года. Напомнить тебе, в каком зачаточном состоянии было gpgpu тогда?

старая песня .вот мы вам покажем .. СКОРО .. :lol:


 

Member
Статус: Не в сети
Регистрация: 12.06.2009
Откуда: хз не помню
Цитата:
который применительно к процессорам говорит нам что количество использованного електричества в интегральных схемах расходуется на переключение транзиторов .

только ли на это? а как же токи утечки? а как же утечки вольтажа?
Цитата:
которое и составляет TDP
:facepalm:
вот ты мне скажи, у одного процессора максимальная температура 100 градусов, у другого 50, оба потребляют 100w у них будет одинаков тпд или все же разный?


 

Member
Статус: Не в сети
Регистрация: 25.03.2012
mo3ulla писал(а):
это полностью ОТДЕЛЬНЫЙ продукт не на базе DXVA .


Неправда. И DXVA и Cuvid работают с помощью блока VPx. Ничего отдельного там нет, просто программная фишка на манер существующей давно HAM. Да, в Cuvid ещё могут задействоваться шейдеры, так Cyberlink так же делал всё это ещё в 2008-м.

mo3ulla писал(а):
с гораздо большим колвом поддерживаемых стандартов


Правда? Какие же, например, он поддерживает стандарты из неподдерживаемых DXVA?
Ну, кроме возможности использования рендеров, отличных от EVR.

mo3ulla писал(а):
что он совершенно НЕ ВПЕЧАТЛЕН


Лукавите. Ссылка ошибочно дана на 720p, но даже это видео загружает 2500K на 40-60% при полноэкранном воспроизведении.
1080p с этими же параметрами забьёт на 100%.
И да, теперь Вы предпочитаете забыть о термодинамике и предпочитаете ватты мерить по TDP.
Сколько, однако, двойных стандартов.

mo3ulla писал(а):
по второй . было качать


О, думаю, Вы качали. Просто не хотите делиться результатом.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
mo3ulla писал(а):
старая песня .вот мы вам покажем .. СКОРО ..


Я уже натыкался на cuda->opencl транслятор с использованием llvm.
И знаешь, скорость opencl кода была на уровне или даже выше оригинального на cuda.


 

Member
Статус: Не в сети
Регистрация: 24.02.2013
Откуда: Galaxy500
MrSlon писал(а):
Он опять наврал
http://market.yandex.ru/model.xml?hid=9 ... 1&clid=502

Удивительно, что он вообще никак не реагирует, когда его ловят на очередном вранье, вместо этого еще и продолжает нести чушь. Глянь эту тему, там тоже набалаболил, но все равно продолжал кукарекать до последнего:
http://forums.overclockers.ru/viewtopic.php?p=11623272#p11623272

_________________
Быть воином AMD - это не значит просто желать им быть. Это, скорее, бесконечная битва, которая будет длиться до последнего момента.


 

Member
Статус: Не в сети
Регистрация: 08.05.2008
Откуда: Ленинград
Фото: 2
Цитата:
Удивительно, что он вообще никак не реагирует, когда его ловят на очередном вранье, вместо этого еще и продолжает нести чушь. Глянь эту тему, там тоже набалаболил, но все равно продолжал кукарекать до последнего:
http://forums.overclockers.ru/viewtopic.php?p=11623272#p11623272

Он единственный адекватный человек в теме среди вас, тупых фанатиков.

_________________
Не оттого пустует храм, что нет свечей и благовоний,
А оттого, что каждый там - лишь наблюдатель, посторонний.


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 243 • Страница 11 из 13<  1 ... 8  9  10  11  12  13  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 12


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan