Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 507 • Страница 20 из 26<  1 ... 17  18  19  20  21  22  23 ... 26  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 20.04.2012
Фото: 15
Inqizitor писал(а):
16 потоков

вот именно 16 потоков и цена более 40т., а сколько кавери выйдет?
Inqizitor писал(а):
чтобы халявщики как ты не смогли строить сервера с APU

это только интел с нвидией могут блочить.

а еще можно алгоритмическую оптимизацию как 2*n.
Но нет, кодеры в большинстве случаев будут в лоб складывать.


это если 2 будут в операции, если нет?

для расширение кругозора почитайте метафорический компьютер, который сейчас изобретает DARPA


Последний раз редактировалось lexx1191 18.01.2014 23:34, всего редактировалось 1 раз.


Партнер
 

Member
Статус: Не в сети
Регистрация: 22.09.2011
Откуда: Estland
Inqizitor писал(а):
Сколько стоит 6800К и насколько он быстр в ЦПУ части - я промолчу. Т.е. если полгода пересидеть на встройке Интела и накопить на 660-760 Жираф - это будет намного лучше, чем сидеть годы на 6800К.

Твой вариант хорош - для игровых задротов-онанистов, коих здесь большинство. А я попробовал на ллано НММ, Skyrim, Oblivion, Fallout3 FNW - играть можно и не на самых низких настройках, так нахрен тогда нужен интел с его убогой встройкой и через полгода ожидания еще и нвидиевское поделие. Фотографии обрабатываются, кино в 3Д смотрится, музыка слушается и пережимается. Понятно что быдлофилды-кукурузисы и прочая унылая метро особо не погоняешь, так меня этот жанр для двуклеточных вообще не интересует, так что амдешный апу очень даже к месту.


 

Member
Статус: Не в сети
Регистрация: 22.06.2010
lexx1191 писал(а):
2+2 это одна операция, 2+2+2+2+2+2+2+2+2+2+2+2+2+2+2+2+2+2 то можно представить 2+2 2+2 2+2 2+2 2+2 2+2 2+2 2+2 2+2 на поток, и т.д. и т.п.

Именно так и делают. Но для того чтобы так сделать, нужно написать кусок кода, который будет делить это нечто на части. А выполнение лишнего кода ясен перец не увеличивает производительность. Потом 4 + 4 + 4 + 4 надо опять сложить. При этом для начала собрав все результаты с разных потоков, которые в общем случае выполняются разное время. Для этого надо предусмотреть синхронизацию чтобы подождать пока последний поток выполнит свою работу. И вот только тогда надо 4 + 4 + 4 + 4 складывать. Будем опять на потоки разбивать???


 

Member
Статус: Не в сети
Регистрация: 10.03.2005
Фото: 93
devl547 писал(а):
HSA позволяет сильно упростить написание кода, на чем спотыкались кодеры в OpenCL.

http://www.ferra.ru/ru/system/review/AM ... hitecture/ вот тут интересно написано,
"Именно по этой причине архитектура HSA физически будет представлена в виде системы-на-кристалле (SoC)".
Это я вообще-то не понял. Память же не расположена на кристалле, а она системная. Видеокарта внешняя тоже к системной памяти может обращаться при желании. Это либо наглый маркетинг, либо я дурак :bandhead: ...
После этого много бла-бла-бла в статье и в конце ремарка про участие Интел и Нвидии в консорциуме типа - если захотят - милости просим.


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
Inqizitor писал(а):
идеокарта внешняя тоже к системной памяти может обращаться при желании. Это либо наглый маркетинг, либо я дурак ...

:lol:
Второе... Ну если не дурак покажи мне код, который позволяет дискретной видяхе или встройке от Intel залезать напрямую в системную память по указателю на данные и без копирования этих данных в свою локальную память с ними удаленно работать...


 

Member
Статус: Не в сети
Регистрация: 10.03.2005
Фото: 93
yorka писал(а):
Память для CPU и GPU общая... И не виртуально общая, как предлагает сделать Nvidia, а физически общая. Доступ к данным CPU или GPU получают путем передачи указателя на эти данные, а не путем их копирования из одной памяти в другую.
Почитай что такое huma и HSA Queuing...
А что тут аппаратного?!!!!

Добавлено спустя 1 минуту 18 секунд:
yorka писал(а):
Второе... Ну если не дурак покажи мне код, который позволяет дискретной видяхе или встройке от Intel залезать напрямую в системную память по указателю на данные и без копирования этих данных в свою локальную память с ними удаленно работать...
Ну это на уровне драйвера решается, т.е. если есть определенный вызов, то залезает в системную память.
Но в чем смысл, если на видяхе уже по 6 гиг быстрой памяти имеются, вот скажи мне!
Или ты имеешь в виду, что на APU АМД будет сразу Озу паяться гиг эдак 4-8? И оно будет считаться общей памятью.


 

Member
Статус: Не в сети
Регистрация: 20.04.2012
Фото: 15
drus писал(а):
Но для того чтобы так сделать, нужно написать кусок кода
по этому никто и не пишет, за чем? мне за это не платят.


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
Inqizitor писал(а):
А что тут аппаратного?!!!!

:lol:
Ты еще не понял? Ты не сможешь получить доступ к системной памяти по указателю, потому что чисто физически у тебя нет к ней доступа. Тебе придется через костыли копировать весь блок данных в локальную память, проводить над этими данными работу, копировать результаты и сами измененные блоки данных (если это нужно) обратно в системную память. Это колоссальные задержки и тонны лишних операций. А в новых APU AMD вся системная память доступна как GPU, так и CPU. Нужно провести операции над данными - передал указатель на эти данные, провел нужные операции и вернул указатель на результат обратно.


 

Member
Статус: Не в сети
Регистрация: 10.03.2005
Фото: 93
yorka писал(а):
Ты еще не понял? Ты не сможешь получить доступ к системной памяти по указателю, потому что чисто физически у тебя нет к ней доступа. А в новых APU AMD вся системная память доступна как GPU, так и CPU. Нужно провести операции над данными - передал указатель на эти данные, провел нужные операции и вернул указатель на результат обратно.
Т.е. фишка только для APU. Если видеокарта внешняя - тогда эта штука недоступна никак? Но я опять не понял, в чем проблема организовать на уровне дров для видяхи, т.е. как я в своем предыдущем посте написал?


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
Inqizitor писал(а):
Ну это на уровне драйвера решается, т.е. если есть определенный вызов, то залезает в системную память.

Не решается... Если мы про внешнюю видеокарту, то проще копировать блоки в локальную память, чем гонять все это через CPU. А для встроек Intel придется опять же копировать данные в локальную память или использовать виртуальную, но опять же все данные будут бегать через CPU, ибо чисто физически дискретка не имеет доступа к системной памяти.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Inqizitor писал(а):
Это либо наглый маркетинг, либо я дурак ...


Это бред маркетологов или переводчика.

Inqizitor писал(а):
А что тут аппаратного?!!!!


IOMMU.

Inqizitor писал(а):
Но в чем смысл, если на видяхе уже по 6 гиг быстрой памяти имеются, вот скажи мне!


Видяха не умеет во вложенные указатели + не умеет лезть в системную память + имеет оверхед на копирование данных в свою память.

Inqizitor писал(а):
в чем проблема организовать на уровне дров для видяхи


Есть такое. Используется и amd и intel в своих встройках. Минусы - первые два выше.

А, еще забыл - "прозрачное" использование видяхи. То есть ты из задачи для gpu можешь вызывать подпрограмму для cpu. Сейчас этого нельзя.


Последний раз редактировалось devl547 18.01.2014 23:47, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
Inqizitor писал(а):
Т.е. фишка только для APU. Если видеокарта внешняя - тогда эта штука недоступна никак?

Естественно... Если ты не заметил, то в HSA входят такие компании как Qualcomm, Mediatek, Imagination, ARM. А там как раз CPU и GPU тоже расположены на одном кристалле и используют кусок системной памяти, только работают они пока точно так же как и настольные APU (до Kaveri), а SoC с поддержкой HSA выйдут только в 2014 году.
Inqizitor писал(а):
Но я опять не понял, в чем проблема организовать на уровне дров для видяхи, т.е. как я в своем предыдущем посте написал?

Т.е гонять все данные через CPU?


 

Member
Статус: Не в сети
Регистрация: 28.04.2004
Inqizitor
Что-то мне уже страшно становится про ваши рассуждения об оракуле. А отсутствие оптимизации субд для Куда- это просто феерично.

Про оптимизацию кода и бульдозер взлетит- надеюсь, вы не в отделе сопровождения/администрирования работаете? Я не про бульдозер, а про вообще.
Типа если задача хорошо параллелится- амд взлетит???? Куда?


 

Member
Статус: Не в сети
Регистрация: 20.05.2007
Откуда: Россия
fobos40 писал(а):
если задача хорошо параллелится

Логично использовать GPU. А если у GPU есть прямой физический доступ к системной памяти, то это очень эффективно и проще паренной репы.


 

Member
Статус: Не в сети
Регистрация: 28.04.2004
yorka
Тут не давно тестили oracle T5 64 ядра. 5000 сессий активных, IBM Power 7 на 32 ядрах уделал этот поделье SUN очень просто :)

А забыл- быдлокодеры виноваты :) только они :haha:


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
fobos40 писал(а):
oracle T5 64 ядра. 5000 сессий активных, IBM Power 7 на 32 ядрах уделал этот поделье SUN очень просто


Ядра или потоки? Вроде у power 4 потока на ядро, а у T5 - 8
Полные характеристики дай, плз.


 

Member
Статус: Не в сети
Регистрация: 28.04.2004
devl547
Ядра физические. Оракл 11. Каждая сессия генерит рандом+ вычисляет хэш+делит умножает и тд.

Даже сами почитайте в инете- народ немного огорчён :))
Рулят Ксеоны и Power 7


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
fobos40 писал(а):
Ядра физические.


256 потоков у T5 vs 128 у Power.
Неплохо. В принципе сановская студия должна нормальный код выдать по скорости.


 

Member
Статус: Не в сети
Регистрация: 28.04.2004
Нет и нет. Без шуток. Как процессора они слабоваты, но маркетологи Оракла- нужно дать им должное :)
Хар-ки хороши, но вот реальная скорость. Да сами множите почитать в инете полно блогов независимых тестеров. Так что не все ядра одинаково полезны.

Кстати под САНы лицензии Оракла намного дешевле. А это десятки тысяч баксов.
Под Power коэффициент 1 на ядро, под x86 0.5 или тоже 1. Под родной сан чуть ли не 0.25 сейчас- подсадить заказчика на своё хоть и не быстрое железо.
Это правильно- мелкософт со своей СУБД поджимает ;)

Кстати под АМД лицензии MS SQL 2012 Ent дешевле. 0.75 против интеля.


Последний раз редактировалось fobos40 19.01.2014 0:48, всего редактировалось 1 раз.

 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
fobos40 писал(а):
мелкософт со своей СУБД поджимает


Она до сих пор тормозная донельзя и очень много однопотока.
А вот MySQL они просрали (форкнули в mariadb)

fobos40 писал(а):
Как процессора они слабоваты,


В целом да. Но они изначально делались под "впихать много потоков"


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 507 • Страница 20 из 26<  1 ... 17  18  19  20  21  22  23 ... 26  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 18


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan