Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
Arioch писал(а):
Интересно, что все так к GP прицепились ?Давайте вообще плавающую точку из процессора уберём, будем её имитировать на целочисленных инструкциях. Будет ещё одним фиксированным модулем меньше.
Человек ранее в теме спросил в чем разница, ему ответили что QuickSync не является GPGPU, поддержка которого также появится в Иви. То есть QuickSync и перекодирование видео с помощью CUDA/OpenCL в Нвидиа/АМД - это разные вещи, не считая ещё неработающего VCE в AMD HD7xxx-серии...Сам по себе QuickSync не плох -никто и не говорит...
Arioch писал(а):
QuickSync не плохой пример, что если не гордиться идеологической чистотой, то можно и полезно вставлять фиксированные модули.Наверное настроек у QS меньше, чем у софтового перекодировщика - но никто вроде не жалуется.
Интел и не говорила о "идеологической чистоте", а наоборот, гордо заявила что там встроенный модуль...
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Кроме того сейчас у AMD уже сплавленные пары ядeр, в которых отдельные блоки разделены - так что методика разделения отрабатывается.
Да, модули и уменьшили площадь старых MMX-SSE.
Arioch писал(а):
для OpenCL APU не нужно.
Странно отказываться от сильной число-дробилки.
Arioch писал(а):
Он действительно может задействовать любые вычислители - но только оптом, крупные блоки данных изолированные от CPU.
CPU только создает задачу (раскладывает данные в нужном порядке) и вызывает OpenCL через соответствующую DLL-библиотеку (аналогично, при работе со встроенным сопроцессором, все равно вызывается математическая библиотека ).
отказываться не надо, просто рекламировать нечего становится. В таком контексте APU/Fusion ничем по сути не отличается от старого чипсетного интегрированного видео. Ну да, кристаллы стали меньше и теперь можно чипсет в процессор запихнуть, ну и что тут особенного ?
на сопроцессоре можно эффективно посчитать один единственный синус, на OpenCL нельзя. Даже если убрать нативный x86 код вообще. Поэтому не во всeх задачаx OpenCL будет эффективен.
Там где можно / полезно разделять программу-вообще и отдельные крупные чисто-вычислительные блоки, там OpenCL эффективен уже вчера, до APU. Так же как и CELL c CUDA.
Но это несколько меньшая интеграция, чем AMD обещала раздувая брэнд Fusion.
Ели бы не работал, о нем бы не говорили. Что-же тогда на выставке показали? Кстати: VCE = UVD+AVC
Добавлено спустя 22 минуты 59 секунд:
Arioch писал(а):
В таком контексте APU/Fusion ничем по сути не отличается от старого чипсетного интегрированного видео.
Во времена 86...486 поколений, сопроцессор вообще мог устанавливаться или не устанавливаться или быть другого производителя(с другой системой команд и архитектурой) и вызов через мат. библиотеку все решал прозрачно, хотя время вычисления получалось разное. Ситуация та-же.
Arioch писал(а):
на сопроцессоре можно эффективно посчитать один единственный синус, на OpenCL нельзя. Даже если убрать нативный x86 код вообще. Поэтому не во всeх задачаx OpenCL будет эффективен.
А кто вас заставляет "из пушки по воробьям". Но убить то все равно можно, просто затраты раз 40... больше.
Arioch писал(а):
Там где можно / полезно разделять программу-вообще и отдельные крупные чисто-вычислительные блоки, там OpenCL эффективен уже вчера, до APU. Так же как и CELL c CUDA.
APU движется в сторону эффективности мат-вычислений а не графики. Видимо, в сторону CELL, где несколько ядер параллельных вычислений. Но там чей патент(несколько фирм). А с CUDA вы классно пошутили.
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
Genry писал(а):
Ели бы не работал, о нем бы не говорили. Что-же тогда на выставке показали? Кстати: VCE = UVD+AVC
- Програмная поддержка будет реализована позже, прочитайте свежие обзоры 7800-тых, здесь к примеру, там как раз жалуются что до сих пор не работает(на всей 7000-ной серии)
Arioch писал(а):
на сопроцессоре можно эффективно посчитать один единственный синус, на OpenCL нельзя.
На GPU есть(АPU в том же числе) нативный синус за такт вызываемый из OpenCL, так что не надо ла-ла...
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Заблокирован Статус: Не в сети Регистрация: 12.03.2009 Откуда: Мозырь-Минск
Arioch писал(а):
warprof_F2 писал(а):
У Тринити с графикой будет вообще общее адресное пространство
Вот и будет первый как-бы-Fusion. А пока это как дискретка или чипсетное видео, разницы нет.
Есть. TDP и меньшее расстояние для обмена информацией. Тем более, что GPGPU сейчас все активнее используется. Для малого ускорение вполне. В сервера -дробилки ведь Llano ставили - ставили.
Arioch писал(а):
Если Fusion по прежнему будет опираться на отдельные изолированные вычисления через OpenCL, то Интелу подойдёт любая считалка c OpenCL.
Не подойдет, Терафлопов не хватит.
Arioch писал(а):
скорее всего - Интел проигнорирует, как проигнорировал 3D Now! и Pacifica. И Fusion останется узконишевой фишкой.
Не проигнорирует. Много чего уйдет под GPGPU, даже у топовых процессоров Intel куда меньше мощности., а APU позволяет соблюдать приемлемый уровень цен.
Arioch писал(а):
если вдруг "выстрелит" - Интел скопирует, как скопировал AMD64 => EM64T, NX => XD, RVI => EPT
НЕ скопирует. GPU (GPGPU) куда сложнее, чем A64. В мульен раз, я бы сказал
Arioch писал(а):
При этом nVidia ему ничем не поможет, потому что копировать нужно будет низкоуровневые инструкции, которые у Радеонов и Жирафов разные.
И тут промахнулись. Сейчас у Радиона и nVidia общая архитектура похожие. Обработка инструкций может быть одна. Да и через OpenCL или другую библиотеку\драйвера повлечет офигеть провала производительности - можно пережить.
Arioch писал(а):
Но скорее всего Fusion реально возможен только как выполнение SSE5-инструкций на GPGPU вместо обычного SSE-блока. А поскольку SSE5 скорее всего у AMD и Intel будет несовместимым, то опять же Интелу будет наплевать на то, что и как сделает AD.
Не будет, т.к уже не наплевать. Но путного пока не придумали. Скорее-всего они будут повышать TDP за счет встройки, и как AMD будут мало нарасчиывать производительность ядра.
_________________ AMD: "I will be back" ATi: Пока живет Radeon - живет ATi! Борись с Эпохой Wintel! AMD+Linux!
Когда затраты на полтора порядка больше - ээто уже не та же ситуация. Когда нужно откомпилировать под исполнителя процедуру перед запуском - не та же ситуация. Когда нужно сформировать и передать большой блок на другое устройство (т.е. с большой вероятностью копировать, даже если и в Copy-on-write режиме) - не та же ситуация.
Genry писал(а):
Видимо, в сторону CELL, где несколько ядер параллельных вычислений
И на обычном массовом компьютере будет нужен столь же часто.
warprof_F2 писал(а):
TDP и меньшее расстояние для обмена информацией
1) Количественное изменение, не качественное. 2) только если данные целиком в кэш влезают и другие ядра не вытесняют. Иначе до оперативки дорога - один хрен от проца или дискретки.
warprof_F2 писал(а):
Терафлопов не хватит.
В массовом компьютере они нужны, да. Сколько Интел скажет - столько и достаточно.
warprof_F2 писал(а):
Много чего уйдет под GPGPU
Уже пять лет уходит.
warprof_F2 писал(а):
GPU (GPGPU) куда сложнее, чем A64
Угу, взяли один unified shader и повторили его 160 (или 420) раз. А сколько *разнообразных* блоков у A64 ? Под GPGPU если проникнется Интел будет Larrabee подгонять, а не GMA
warprof_F2 писал(а):
повлечет офигеть провала производительности - можно пережить.
Ну да, плевать на провал проихводительности, главное рекламный шильдик нацепить.
edal писал(а):
сколько синусов за такт сможет сделать ваш проц и сколько встройка в АPU...
Это интересно только в массивно-расчётной задаче. Такое на дискретках уже 5 лет делают и ничего нового тут не будет. А вот что делать, когда синус нужен один, но мгновенно ? Какие будут затраты у OpenCL до расчёта и после на возвращение результата ?
1) компилирование программы "вызвать функцию синус" под железо 2) переключение контекста приложение -> ядро (для вызова драйвера OpenCL и его согласования с графическим драйвером) 3) сами коды драйверов OpenCL и графического (им надо как минимум договориться, какие ресурсы на видеокарте кому достунутся) 4) переключение контекста ядро -> приложение (возврат посчитанного результата)
Да, где-то между всеми этими бегемотами приютится сверх-быстрый синус. Ну и что ? Да быстрее будет синус посчитать на целочисленной эмуляции x87
Заблокирован Статус: Не в сети Регистрация: 12.03.2009 Откуда: Мозырь-Минск
Arioch писал(а):
1) Количественное изменение, не качественное.
Вы инженер AMD или Intel? Кстати, тут именно качественное, т.к другой уровень.
Arioch писал(а):
2) только если данные целиком в кэш влезают и другие ядра не вытесняют. Иначе до оперативки дорога - один хрен от проца или дискретки.
Такая чушь. НЕ слышали, про слой памяти на том же кристалле? А он будет.
Arioch писал(а):
В массовом компьютере они нужны, да.
Тогда зачем Вам i7 или i5, или даже Ivy Bridge? Для игр хватит и 4ядерного Атлона 2, ну или фенома x4.. Терафлопов и мощности мало не бывает, пора бы запомнить прописные истины.
Arioch писал(а):
Сколько Интел скажет - столько и достаточно.
На лицо не фанат Интела.
Arioch писал(а):
Уже пять лет уходит.
А A64 с 2003 года. 9 Лет уже. И как, успешно?
Arioch писал(а):
Угу, взяли один unified shader и повторили его 160 (или 420) раз. А сколько *разнообразных* блоков у A64 ? Под GPGPU если проникнется Интел будет Larrabee подгонять, а не GMA
Что одно, а что второе - оба убожествы. Или малая производительность от хорошей жизни Интел? Ок.
Arioch писал(а):
Ну да, плевать на провал проихводительности, главное рекламный шильдик нацепить.
Плевать, потому что она в любом случае будет выше Интеловской.
P.S. Купи себе Сумпрон и не парь людям мозги
_________________ AMD: "I will be back" ATi: Пока живет Radeon - живет ATi! Борись с Эпохой Wintel! AMD+Linux!
Даже одного порядка разницы нет ни в ту, ни в другую сторону.
warprof_F2 писал(а):
НЕ слышали, про слой памяти на том же кристалле? А он будет.
Вот когда будет - тогда и разговор может быть будет
warprof_F2 писал(а):
На лицо не фанат Интела.
Не там ищете. AMD перестала поддерживать 3d Now! Вот где интелолюбы то собрались!
warprof_F2 писал(а):
Купи себе Сумпрон
Phenom2 X3 710 Пока хватает.
warprof_F2 писал(а):
Тогда зачем Вам i7 или i5, или даже Ivy Bridge?
Под них программы есть. Массовые.
warprof_F2 писал(а):
Терафлопов и мощности мало не бывает, пора бы запомнить прописные истины.
Так сколько там на массовом рынке компьютеров на Cell'e ? На Альфе ? На Итаниуме ?
warprof_F2 писал(а):
А A64 с 2003 года. 9 Лет уже. И как, успешно?
Угу. У меня 4 гига оперативки, так что поставил себе x64. Впрочем, если вы считаете, что APU нужен только на серверах, как и x64 и его надо ждать ещё 4 года - то я спорить не стану.
warprof_F2 писал(а):
что второе - оба убожествы. Или малая производительность от хорошей жизни Интел?
GMA в играх вроде вдвое-втрое ниже, чем Fusion. Отставание заметное, но не катастрофическое. Примерно как GF8800 vs R2900 - всего через несколько лет Радеоны были сталисильнее. Larrabee пока не выстрелил, пытались из него видеокарту делать... Ну - ещё не вечер. Если всё-таки сделают и получать GPGPU на x86 без тяжёлых прослоек типа драйвер-компилятор, вот тогда это действительно будет настоящий Fusion.
warprof_F2 писал(а):
она в любом случае будет выше Интеловской
В чём ? Транскодирование видео - QS решает. А что ещё массовый пользователь в GPGPU засунет ? Игрушки не предлагать.
Даже одного порядка разницы нет ни в ту, ни в другую сторону.
Абы ляпнуть. Что показывает ваш делинтантизм, кстати. 1. в Llano стоят далеко не HD7k, так что сравнивать не корректно. 2. Разные тех.процессы. 3. Карта без CPU работать не будет. Она считает, а не исполняет код. Пора бы знать уже. Так что концепция APU себя оправдывает на 250%
Arioch писал(а):
Вот когда будет - тогда и разговор может быть будет
У меня уже не хватает фейспалмов, не делайте так больше и не будете выглядеть глупым. От PCI-E 3.0 тоже толку чуть, однако Вы же этим так хвалитесь
Arioch писал(а):
Не там ищете.
Меня и тут один интелофап прекрасно развлекает.
Arioch писал(а):
Вот где интелолюбы то собрались!
Они везде собрались. И тут, и там, и фанатских ветках AMD-ATi, что совсем немыслимо, ибо их там в 10 раз больше, чем собственно самих фанатов AMD-ATi
Arioch писал(а):
Пока хватает.
Тогда Ваше нытье о новых технологиях совсем неуместно и бесполезно.
Arioch писал(а):
Под них программы есть. Массовые.
Это что, шутка такая, что ли? Под AMD какие-то программы не запускаются? Или от массовости программ встройки Интел работают корявее моих самопальных дарйверов под линь?
Arioch писал(а):
Так сколько там на массовом рынке компьютеров на Cell'e ? На Альфе ? На Итаниуме ?
Определяется стоимостью. Стоимость APU ниже. Она позволяет совместить преимущества двух разных архитектур в одной, а не зацикливаться. Это дает больше профита, чем Cell или x86
Arioch писал(а):
Угу. У меня 4 гига оперативки, так что поставил себе x64. Впрочем, если вы считаете, что APU нужен только на серверах, как и x64 и его надо ждать ещё 4 года - то я спорить не стану.
На 4 гигах между x64 и x32 разницы нет Ну и PAE никто не отменял. А Вы тут вообще никак не котируетесь. Гляньте на статистику используемых систем, ога
Arioch писал(а):
GMA в играх вроде вдвое-втрое ниже, чем Fusion. Отставание заметное, но не катастрофическое.
Забыл, что в 2013 уже выйдут Caveri, а Хасвелл только в 2014. Так что катастрофическое.
Arioch писал(а):
Larrabee пока не выстрелил, пытались из него видеокарту делать... Ну - ещё не вечер. Если всё-таки сделают и получать GPGPU на x86 без тяжёлых прослоек типа драйвер-компилятор, вот тогда это действительно будет настоящий Fusion.
Вам перевести с английского, что означает Fusion? Эффективность x86 все-равно НИЖЕ для числодробилки.
Arioch писал(а):
В чём ? Транскодирование видео - QS решает. А что ещё массовый пользователь в GPGPU засунет ? Игрушки не предлагать.
А у Вас все технологии на массово-пользователя ориентированы? Тога мне Вас жаль P.S. ПО скорость QS - да.. по качеству...
_________________ AMD: "I will be back" ATi: Пока живет Radeon - живет ATi! Борись с Эпохой Wintel! AMD+Linux!
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
Arioch писал(а):
А вот что делать, когда синус нужен один, но мгновенно ?Какие будут затраты у OpenCL до расчёта и после на возвращение результата ?1) компилирование программы "вызвать функцию синус" под железо2) переключение контекста приложение -> ядро (для вызова драйвера OpenCL и его согласования с графическим драйвером)3) сами коды драйверов OpenCL и графического (им надо как минимум договориться, какие ресурсы на видеокарте кому достунутся)4) переключение контекста ядро -> приложение (возврат посчитанного результата)Да, где-то между всеми этими бегемотами приютится сверх-быстрый синус. Ну и что ?Да быстрее будет синус посчитать на целочисленной эмуляции x87
Не подскажете программу состоящую из одного мгновенного синуса, и от которой зависит при этом жизнь? И не забывайте что в АПУ есть ещё и обычные ядра и только дурак будет отправлять одиночный синус на ГПУ, а если он в контексте то и предварительные данные уже там, и он не является конечным результатом...
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Не подскажете программу состоящую из одного мгновенного синуса, и от которой зависит при этом жизнь?
не подскажете вообще массовую программу, от которой зависит жизнь ?
edal писал(а):
И не забывайте что в АПУ есть ещё и обычные ядра и только дурак будет отправлять одиночный синус на ГПУ
Т.е. программа, в которой целочисленный код, управляющий код и FP-код перемешаны от APU не получит ни-че-го. Т.е. APU практически ничем не отличается от дискретки, разве что мощность поменьше как электрическая, так и вычислительная. Т.е. весь многолетний шум про Fusion чисто-рекламное загонялово без технического смысла. Ч.т.д.
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
Arioch писал(а):
edal писал(а):
Не подскажете программу состоящую из одного мгновенного синуса, и от которой зависит при этом жизнь?
не подскажете вообще массовую программу, от которой зависит жизнь ?
Вы ведь написали что Вам срочно, мгновенно понадобился синус - значит он очень для Вас важен был(что важнее жизни?)
Arioch писал(а):
edal писал(а):
И не забывайте что в АПУ есть ещё и обычные ядра и только дурак будет отправлять одиночный синус на ГПУ
Т.е. программа, в которой целочисленный код, управляющий код и FP-код перемешаны от APU не получит ни-че-го. Т.е. APU практически ничем не отличается от дискретки, разве что мощность поменьше как электрическая, так и вычислительная.
1)Целочисленные операции также в наличии, не перегибайте... 2)Вовсе нет, в APU на CPU и GPU общая память и при исполнении данные не копируются/перемещаются туда-сюда а только передаются адреса в памяти(Fusion APU zero copy) и в определенных сценариях(интенсивный обмен данными между CPU и GPU) APU может обойти по производительности даже систему с 6-8 ми ядрами и Теслой на борту...
Arioch писал(а):
Т.е. весь многолетний шум про Fusion чисто-рекламное загонялово без технического смысла. Ч.т.д.
из-за отсутствия программ (для массового пользователя) - да, почему собственно и радует поддержка GPGPU в Иви...так как пойдет влияние на индустрию и со стороны Интел, а это во много раз весомее, чем тоже самое, только от АМД. Так сказать " авторитетнее"...
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Вееерно. Хотя казалось бы - какая разница то, главное что в наличие есть, а не на бумаге.
Тогда надо сделать льготу видеокартам, они из-за 40нм греются больше, чем процессоры на 32нм да ещё с SOI
Athlon LLano: TDP max или 65W, или 100W Radeon HD 7xxx и 6ххх: TDP max от 18W, до 66W (сопоставимые по количеству шейдеров) И последние цифры надо ещё и уменьшить - скидку на менее эффективный тех-процесс - ну например ватт на десять.
warprof_F2 писал(а):
3. Карта без CPU работать не будет.
Оки-доки, добавим Athlon TDP min (min - потому что GPGPU должен разгружать процессор, а не нагружать) ...упс, не пишет AMD минимальное тепловыделение.
Но учитывая, что у 45-нм Athlon2 X2 максимальный TDP был 25W, то минимальный у 35-нм будет где-нибудь 10W. Как раз в вами указанную разницу техпроцессов и впишется.
Итак - где революционная разница между 65/100W APU и 18-66W сравнимой дискретки? Где обещанный "другой уровень" TDP ?
warprof_F2 писал(а):
Так что концепция APU себя оправдывает на 250%
Что на что делите ? тоннаж рекламной бумаги ?
warprof_F2 писал(а):
От PCI-E 3.0 тоже толку чуть, однако Вы же этим так хвалитесь
Это вы выдумали. Фантазировать - приятно, но когда вслух и на форуме - это уже по-другому называется!
warprof_F2 писал(а):
Они везде собрались.
Ну если руководство AMD у вас интелофаны, то и мне уж как-нибудь можно.
warprof_F2 писал(а):
Тогда Ваше нытье о новых технологиях
Новых технологиях ? где они ??? Взяли те же кубики, сложили по другому. Чипсет с процессором склеили. Как и Интел. Как Cyrix много лет назад. Как почти все ARMы. Ой новости-то какие!.. Рррреволюция!
warprof_F2 писал(а):
Это что, шутка такая, что ли? Под AMD какие-то программы не запускаются?
Не с тем сравниваете. Тут CELL в пример подавался, как свежее будущее Fusion'a.
warprof_F2 писал(а):
Стоимость APU ниже. Она позволяет совместить преимущества двух разных архитектур в одной
Ню-ню, посмотрим как она совместит Bulldozer для начала. Или Piledriver. Или что там будет у AMD для действительно высокопроизводительной архитектуры.
warprof_F2 писал(а):
На 4 гигах между x64 и x32 разницы нет
Нет тaкого слова "x32". Ну я-то ладно, в миркроархитектурах не разбираюсь. А вы оказывается вообще не знаете какие процессоры бывают, а какие нет!
А разница увы есть, процентов 20.
warprof_F2 писал(а):
Ну и PAE никто не отменял.
Microsoft отменил. ЕМНИП в XP SP1 включил - и тут же в SP2 выключил, глянув как реальные драйвера с ней работают. Нет, конечно серверное железо с серверными драйверами и операционками с PAE работает - да только у меня железо обычное, десктопное.
warprof_F2 писал(а):
А Вы тут вообще никак не котируетесь.
Т.е. вы по прежнему хотите доказать, что AMD64, которое вы привели против Fusion, технология бесполезная? Так я повторюсь, я согласен. AMD64 по вашим словам 9 лет была не нужна, и APU столько же будет бесполезной.
warprof_F2 писал(а):
Вам перевести с английского, что означает Fusion?
Вы мне с рекламного переведите, где это самое соединение ? пока что это как было отдельной видеокартой - так и осталось. Толстенная прокладка из видео-драйвера, Open-CL-драйвера-компилятора и ядра ОС - ну никак на объединение не тянет, это наоборот изоляция.
warprof_F2 писал(а):
ПО скорость QS - да.. по качеству...
Технологии пока только год от рождения, другие методы вылизывались в несколько раз дольше, тем не менее уже сейчас:
Заблокирован Статус: Не в сети Регистрация: 12.03.2009 Откуда: Мозырь-Минск
Цитата:
В быту - есть, но правильное х86(32-бит) и х86_64(64-бит)...
Никаких в "быту" нет. X86 - это процессорная АРХИТЕКТУРА. А 32-бит и 64-бит - это РАЗРЯДНОСТЬ, как же вы заканали... А x86-64 Это расширение архитектуры x86, для исполнения 64-разрядных команд процессорами, разработана компанией AMD. Учите мат.часть. x86 не тожественна x32, x64 не тождественна x86... сколько можно!! x64 Всего-лишь РАЗРЯДНОСТЬ и РАСШИРЕНИЕ, ЭТО НЕ АРХИТЕКТУРА
_________________ AMD: "I will be back" ATi: Пока живет Radeon - живет ATi! Борись с Эпохой Wintel! AMD+Linux!
AMD Fusion whitepaper: For small data arrays, the overhead associated with setting up vector operations can outweigh the time saved through parallel execution.
Во-как. Даже для небольших массивов и то использовать Fusion не рекомендуется, не то что для отдельных синусов
edal писал(а):
даже систему с 6-8 ми ядрами и Теслой на борту...
А Тесла не может работать напрямую с системной памятью ? PCI позволяет и результат был бы примерно такой же.
Работа Теслы/Радеона с системной памятью была бы на 25% медленнеев PCI-Ex 2, но тут уже упоминали PCI-Ex 3 Впрочем, тут может виртуализация помешать.
Запись GPU -> cacheable всего 5.5 GB/s Чтение CPU <- local меньше 1 GB/s Не айс.
И при этом куча костылей, вокруг сложившейся инфраструктуры ОС, драйверов и устройств. Страницу пригвозди, получи её линейный адрес, скорректируй таблицы в GPU и теперь только начинай считать Нехилый такой оверхед.
edal писал(а):
из-за отсутствия программ (для массового пользователя) - да, почему собственно и радует поддержка GPGPU в Иви
Думаю, не потому. А прочто кроме транскодирования видео (на смартфончик сжать посмотреть) в массовом применении нету сильно параллельно-расчётных задач. Если на что и надеяться, то скорее на Windows 8/9/... и ARM SoC. Может действительно появится возможность просто послать пойнтер безперенастройки таблиц и обращения к ring 0.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 24
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения