Member
Статус: Не в сети Регистрация: 20.05.2007 Откуда: Россия
fobos40 писал(а):
yorka Тут не давно тестили oracle T5 64 ядра. 5000 сессий активных, IBM Power 7 на 32 ядрах уделал этот поделье SUN очень просто
А забыл- быдлокодеры виноваты только они
Супер, а у встройки Kaveri 8 блоков по 64 ядра и каждый блок со своей очередью. Так что если есть задача, которая хорошо параллелится, то очень удобно использовать встроенный GPU. Тем более доступ к памяти общий, поэтому накладные расходы считай отсутствуют вовсе.
Member
Статус: Не в сети Регистрация: 10.03.2005 Фото: 93
yorka писал(а):
Не решается... Если мы про внешнюю видеокарту, то проще копировать блоки в локальную память, чем гонять все это через CPU. А для встроек Intel придется опять же копировать данные в локальную память или использовать виртуальную, но опять же все данные будут бегать через CPU, ибо чисто физически дискретка не имеет доступа к системной памяти.
http://www.ixbt.com/news/hard/index.shtml?17/28/98 "одной из главных особенностей Maxwell станет «унифицированная виртуальная память» — механизм, который позволит CPU напрямую обращаться к памяти графических ускорителей, а GPU — к системной памяти, а появления данного поколения можно ожидать в первой половине 2014 года". Вот и ответ на мой вопрос - т.е. начиная от Максвелла у меня на 4770 будет HSA.
Добавлено спустя 2 минуты 30 секунд:
fobos40 писал(а):
Что-то мне уже страшно становится про ваши рассуждения об оракуле. А отсутствие оптимизации субд для Куда- это просто феерично.
Пример - есть карта Тесла, которая с помощью cuda может и с СУБД работать, например, кластер Tesla K40. Но я не слышал про оптимизации оракла под теслу. Знаю про их попытки с ARM.
Member
Статус: Не в сети Регистрация: 20.05.2007 Откуда: Россия
Inqizitor писал(а):
т.е. начиная от Максвелла у меня на 4770 будет HSA.
Не будет... HSA предполагает физический доступ к памяти, а это единый контроллер памяти для CPU и GPU. У тебя же будет виртуальный доступ, а это опять накладные расходы и перегонка данных через CPU. Да это упростит жизнь программистам, но не уберет накладные расходы. Вроде очевидно...
Member
Статус: Не в сети Регистрация: 10.03.2005 Фото: 93
yorka писал(а):
Не будет... HSA предполагает физический доступ к памяти, а это единый контроллер памяти для CPU и GPU. У тебя же будет виртуальный доступ, а это опять накладные расходы и перегонка данных через CPU. Да это упростит жизнь программистам, но не уберет накладные расходы. Вроде очевидно...
Ну почему же, есть же 4 ядра ARM у Максвелла встроенных. Вот они и будут ЦП у которых единый контроллер памяти для CPU и GPU. Т.е. все что должно считаться для видяхи просто перенаправляется на нее и про это забывается. Например, на видяхе 16 гиг видео ОЗУ, 4 ядра ARM - туда кидается пакет рассчетов для уровня игрушки и потом с основным цп сверяется по чексуммам, а все расчеты ведут ядра arm и графические. И где будет АМД APU по скорости - мне даже интересно, учитывая быструю память видяхи... А обычный ЦП занимается менее распараллеливанными делами. С обычным цп - виртуальный доступ, с АРМ - прямой.
Member
Статус: Не в сети Регистрация: 20.05.2007 Откуда: Россия
Inqizitor писал(а):
Ну почему же, есть же 4 ядра ARM у Максвелла встроенных.
На бумаге есть, в реальности может в конце этого года появятся...
Inqizitor писал(а):
от они и будут ЦП у которых единый контроллер памяти для CPU и GPU.
Там речь про единый пул виртуальной памяти. Про единый контроллер памяти Nvidia ни слова не говорила. Накладные расходы при этом никуда не денутся - это лишь сильно упрощает жизнь программистам.
Inqizitor писал(а):
Например, на видяхе 16 гиг видео ОЗУ, 4 ядра ARM
И стоить эта видяха будет минимум 5k$... Готов спорить, что у топового максвелла будет 512bit и 4Gb/8Gb памяти в игровом сегменте и 8/16Gb памяти в серверном. Да и ARM ядра в сегменте для игр скорее всего будут только в топовых конфигурациях (500$+) и уж никак не 4 штуки, а 1-2 ядра...
Inqizitor писал(а):
И где будет АМД APU по скорости - мне даже интересно, учитывая быструю память видяхи...
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Bak$ писал(а):
Память: 2 x 8Гб DDR3 1333, Samsung M378B1G73BH0-CH9; интел Память: 2 x 8Гб DDR3 2400, G.Skill F3-2400C10Q-32GTX; амд
нормальный выбор для тестов с 4770к
..[StyX]... писал(а):
Тоже внимание обратил на это, автор укурился? Сравнивать так в одинаковых условиях. Хотя тогда от амд совсем уныло смотреться будет.
А межушный ганглий включить? В тестах без разгона (в номинале/из коробки) в этом обзоре память на AMD работала на тех же самых 1333 мгц как и у Intel!
Цитата:
AMD A10-6800K (4100 МГц), память 1333 МГц, тайминги 9-9-9-24-1Т, Radeon HD 8670D, версия драйвера Catalyst 13.2; AMD A10-7850K (3700 МГц), память 1333 МГц, тайминги 9-9-9-24-1Т, Radeon R7, версия драйвера Catalyst 13.30 Beta; Intel Core i7 4770K (3500 МГц), память 1333 МГц, тайминги 9-9-9-24-1Т, Intel 4600;
Одинаковые условия тестирования соблюдены. А 2400 мгц использовалась только при тестировании разгона.
Добавлено спустя 14 минут:
vitalikGT писал(а):
статья отличная ! но АМД топчется на месте ,похоже у них в процессорной части с каждым годом хуже и хуже PS не жалею что смотался на интел
Хорошо так топчется на месте, где-то +25% по скорости CPU части на одной частоте относительно предыдущего поколения (порядка 15% прибавка, при том что частота у конкретного протестированного камня на 10% ниже - 3,7 Ггц против 4.1 Ггц). Intel такие прибавки не снились со времен выхода архитектуры core после P4. Как впрочем у AMD самый существенный прирост со времен выхода 2х феномов, что тоже было уже много лет назад.
Member
Статус: Не в сети Регистрация: 20.04.2012 Фото: 15
Inqizitor писал(а):
http://www.ixbt.com/news/hard/index.shtml?17/28/98"одной из главных особенностей Maxwell станет «унифицированная виртуальная память» — механизм, который позволит CPU напрямую обращаться к памяти графических ускорителей, а GPU — к системной памяти, а появления данного поколения можно ожидать в первой половине 2014 года".Вот и ответ на мой вопрос - т.е. начиная от Максвелла у меня на 4770 будет HSA.
ниже написано:
Собственно данные ядра будут заниматься исполнением графического драйвера, таким образом, разгружая CPU, что, по мнению Nvidia, даст эффект, аналогичный использованию API AMD Mantle, но непосредственно без необходимости использования нового API.
А что только ARM? Nvidia может сразу в свои максвелы x86 ядра ставить. И можно кластера собирать, ведь всеравно pci-e разрабатывалась на замену InfiniBand.
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
melentiy писал(а):
Не нужно всех равнять по себе. Для дискретной графики есть процессоры без встроенного видео. А мне в мой личный компьютер домашний (у ребенка и процессор другой и карта дискретная см. профиль), для серфинга по инету, просмотра фильмов и иногда погонять в Crysis, этот процессор в самый раз.
В том то и печаль, что нету и в обозримых планах на будущее не будет аналогичного процессора без встроенного видео. Точнее потом наверно атлоны под фм2 все же выйдут (по аналогии с тринити) но это будут кастраты - видеоядро им отрежут, а вот еще 1-2 модуля и L3 кэш на освободившееся место НЕ поставят. Т.е. будет просто максимально дешевые low-end процессоры. Даже аналога текущих FX 63xx/83xx (просто на обновленном стимроллер ядре без прочих доработок) не ожидается.
Добавлено спустя 14 минут 26 секунд:
Inqizitor писал(а):
Что тут аппаратного? Вон видеоконверторыы сейчас используют ЦПУ+ видяху для кодирования одновременно. В чем вообще инновация, революция и тд? Может объяснишь?
"Революция" в том, что это "общение" будет не на программном уровне через драйверы и ОС идти, а на аппаратном напрямую между x86 ядрами и GCN ядрами. И без пересылки/копирования данных с которыми они работают друг другу по шине (типа PCI-E / гипертраспорта), а просто с общими данными в общей памяти будут работать не гоняя их туда-сюда по шинам межу CPU и GPU частями. С соответствующим сокращением сопутствующих задержек на порядки. А так впринципе сами вычисления те же самые. Если идет последовательная обработка - сначала что-то CPU посчитал свою часть закончил, отдал в GPU которым потом свою долго считает - разницы особой и не будет (прибавка будет но незначительная) А вот если приложение (алгоритм) требует по своей природе как массово-параллельной обработки данных так и быстрой последовательной (не все же части эффективно расспараллелить можно) то выигрыш по скорости может быть в разы (по сравнению с CPU + CPGPU реализацией, про чистый CPU обсчет не говорю даже)
Последний раз редактировалось Mad'Max 19.01.2014 10:23, всего редактировалось 1 раз.
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Inqizitor писал(а):
http://www.ixbt.com/news/hard/index.shtml?17/28/98 "одной из главных особенностей Maxwell станет «унифицированная виртуальная память» — механизм, который позволит CPU напрямую обращаться к памяти графических ускорителей, а GPU — к системной памяти, а появления данного поколения можно ожидать в первой половине 2014 года". Вот и ответ на мой вопрос - т.е. начиная от Максвелла у меня на 4770 будет HSA.
Это виртуалка (эмуляция) будет. С точки зрения написания софта - да вроде тоже самое, что сильно облегчит создание подобного софта. Но железо принципиально разное - те будут через тормозную(по сравнению со скоростями работы ядер) PCI-E шину общаться (в моменты когда будут залезать в память друг друга). Еще небось и через прерывания такие обращения будут реализованы. А в APU x86 и графические ядра не с витуально единой, а с физически одной и той же памятью будут работать. А в случае небольших объемов "ядра данных" у алогоритма и вообще не с памятью, а фактически в общем скоростном набортном кэше внутри кристалла APU общая работа идти будет.
Еще бы научить x86 ядра автоматически(без необходимости реализации этого отдельно в софте в явном виде) перебрасывать плавающую точку x87 и векторные плавающие SSEx/AVX в GCN на обработку если собственный FP модуль уже полностью занят... Но это наверно слишком сложная логика для полностью аппаратной реализации
Добавлено спустя 3 минуты 53 секунды:
Forbrak писал(а):
А что только ARM? Nvidia может сразу в свои максвелы x86 ядра ставить. И можно кластера собирать, ведь всеравно pci-e разрабатывалась на замену InfiniBand.
Так у них нет лицензии и права какие либо х86 выпускать. Потому и ARM. Так бы давно гибридов аналогичных APU от AMD наклепали бы. А так остается продолжать делать убогие low-end дискретки (чтобы закрыть тот сегмент где AMD APU использует) и ругать весь подход APU в принципе как "кислый виноград" (с)
Member
Статус: Не в сети Регистрация: 16.08.2012 Откуда: СССР
на самом деле удачный камень получился. Понятно, что самый дешевый i5+7750 его дергают,но по цене как-то разница уж очень большая получается. тему не читал, но в mini-itx можно запилить будет нормальную тему в стиле steam machines. Да, на высокой детализации в 1080p ты не поиграешь с нормальным фпс в крайзис3, ну и что?
Member
Статус: Не в сети Регистрация: 01.08.2012 Откуда: взялась AMD?
Ну что, убедились, что процессор уг? Я ведь говорил: +10%к ipc -10% к частоте. 0% прироста. Только видяшка чуть получше, но все равно упирается в память. И ЭТО АМД теперь считает Топом в своей линейке, видимо, выше fx8350
_________________ NFS-Racer писал(а): "AMD FX быстрее, чем core i7 везде, даже в World of tanks" (c) Human_82: "Radeon r9-280x быстрее, чем 780ti"
Я не фанат разных фирм, в частности использую видео карты АМД, с некоторых пор, хотя пользовался и нвидией. Но задумался насчет заличия АРМов в будущих видеокартах нвидии, если их можно будет полноценно использовать, все мечтал о дешовом многосокетном модульном компьютере. Но в данном случае производительность системы можно масштабировать от количества pci-e слотов. Т.е. получится что-то типо миникластера, а в роли межпроцессорной шины будет pci-e. Притом если внешняя память будет общей. Хотя для связи подобных узлов не обязательно использовать только системную память, ведь по последним новостям, платы установленые в pci-e слот, могут общаться между собой по pci-e. Ну или пробросить SLI мостик между ними.
Соглашусь, данная схема не нужна для обывателя, но мне интересно ) Т.е. теоретически можно на pci-e слот установить плату любого типа с дополнительными процессорными ядрами разных архитектур, не только видеокарту. Например читал на кикстартере о сопроцессорах parallella, которые тоже используется вместе с армом. По заверению разработчиков платки потребляют 5-10ватт и выдают 30-90Gflops. И у них есть свой межпроцессорный интерфейс, т.е. можно соединять мостиками.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 26
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения