Ускоритель Intel Knights Corner оказался быстрее NVIDIA Tesla M2090

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 09.03.2026 17:16

Сообщения без ответов | Активные темы

Список форумов » Сайт и конференция » Материалы сайта » Обсуждение новостей

Часовой пояс: UTC + 3 часа

Модератор: Sonic-Chainik

Новая тема /

Закрыто

Сообщений: 59 • Страница 3 из 3 • < 1 2 3

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Romarik77

Добавлено: 17.11.2011 11:31

[профиль]

Member
Статус: Не в сети
Регистрация: 16.03.2011

Если верить товарищу serj (http://testmem.tz.ru/index.htm), то оптимально работающий контроллер памяти у Intel последний раз видели примерно на Pentium Pro, а потом контора на него как-бы положила. На самом деле он оптимизирован не под те задачи, которые решает обычное ПО. Если просуммировать все источники, прочитанные в разное время и по разным поводам, то тенденция выглядит так:
- есть некоторые алгоритмы, которые нужны для производства некоторых вычислений (обычные люди с ними не наверное столкнутся никогда) и процессора оптимизируются для максимально быстрого выполнения именно этих алгоритмов;
- потом все эти технологии выходят "по конверсии" на обычный рынок, под видом мега новинок для масс, на этом отбивается R&D;
- самый простой пример из недавнего - внедрение AES в процы Intel и VIA.

Добавлено спустя 22 минуты 12 секунд:
fingoldo, если это будет спецускоритель, то вы его не купите, не понадобится.
Тут прикол в чём, если внимательно поковыряться в том, что продвигает Nvidia, то Вы увидите следующее:
- для разработки на CUDA у Nvidia нужно кое-какой софтик лицензионный прикупить;
- вычислительные возможности GeForce, Quadro и Tesla, выполненных на одном и том же процессоре сильно отличаются, они специально разграничены, чтобы за 300 баксов вы получили примерно кукиш, но с надписью CUDA;
- на разных поколениях процессоров, возможности ядер разные.
CUDA, доступна уже несколько лет, много Вы видите/используете реальных приложений с ее поддержкой? Я вот только Adobe Premier, остальное или не нужно или не юзабельно (ибо реально! работает только на топ Quadro за 3-5 килобаксов, и никак не похачить, это ограничение зашито в чип).

Intel поступит также,а значит порог вхождения для разработчиков будет далеко не 300 баксов.

Реклама
Партнер

maxuser

Добавлено: 17.11.2011 12:00

[профиль]

Member
Статус: Не в сети
Регистрация: 12.12.2005
Откуда: Москва

Romarik77 писал(а):

вычислительные возможности GeForce, Quadro и Tesla, выполненных на одном и том же процессоре сильно отличаются, они специально разграничены, чтобы за 300 баксов вы получили примерно кукиш, но с надписью CUDA;

Как раз тесты показывают, что в чистой производительности CUDA-вычислений игровые топы в разы выгоднее квадр. По крайней мере в том софте, где нет ограничений на тип.

Romarik77 писал(а):

много Вы видите/используете реальных приложений с ее поддержкой?

Визуализация работает на ура (Octane Render), масштабирование производительности тоже на высоте. Вроде бы есть еще всякая поверхностная поддержка CUDA в разных мультимедиа-конвертерах. В любом случае, я сейчас и не вижу задач у рядового пользователя, для которых ему нужна CUDA.

_________________
"Хорошо, здесь я расскажу вам всё так, что вы сможете обсуждать такие вещи как BRDF и BSSRDF с Вашими коллегами."

Последний раз редактировалось maxuser 17.11.2011 12:05, всего редактировалось 4 раз(а).

Romarik77

Добавлено: 17.11.2011 12:00

[профиль]

Member
Статус: Не в сети
Регистрация: 16.03.2011

fingoldo писал(а):

Это более реально, ведь для прилинковки по QPI нужно будет разработать новые чипсеты/материнские платы...

Вторая стрелочка на третьем слайде как-бы намекает именно на это. QPI стандартная шина, нужна будет только правка БИОС и наверное другой VRM на матери. Таким образом, чуть переработанные 2-х или 4-х процессорные матери Xeon + Чудо и будут с этим работать.
Жаль, я бы тоже хотел платку баксов за 300, даже за 500 (но лучше "стандартный" проц для 2-х процевой мамки). Но только при условии, что она пропишется как 100500 процессоров, а не как спецмодуль.

Добавлено спустя 40 секунд:
maxuser, пожалуйста озвучьте софт. Я слеп, я нигде не вижу этого софта.

maxuser

Добавлено: 17.11.2011 12:06

[профиль]

Member
Статус: Не в сети
Регистрация: 12.12.2005
Откуда: Москва

Romarik77
http://www.refractivesoftware.com/gallery.html

_________________
"Хорошо, здесь я расскажу вам всё так, что вы сможете обсуждать такие вещи как BRDF и BSSRDF с Вашими коллегами."

Romarik77

Добавлено: 17.11.2011 12:10

[профиль]

Member
Статус: Не в сети
Регистрация: 16.03.2011

Ну вот мы и нашли две штуки: для меня Премьер, для Вас плагин к Мая. Всё? Кажется была еще ломалка паролей от Элкома. Где охренительное разнообразие?

maxuser

Добавлено: 17.11.2011 12:14

[профиль]

Member
Статус: Не в сети
Регистрация: 12.12.2005
Откуда: Москва

Romarik77
Это не плагин к майя, а отдельная программа без привязки к пакету моделирования. У нее есть конкуренты, но я не углублялся в сравнения и уровень поддержки CUDA у них.

Romarik77 писал(а):

Где охренительное разнообразие?

А для каких задач? Excel с поддержкой CUDA? Тетрис с реальной физикой? Под специализированные задачи (где, например, есть энтузиасты, поддержка нвидии или просто коммерческий интерес) софт постепенно делается. Наверняка в скором времени появятся (если еще не появились) присадки для инженерного ПО, расчетов на прочность и т.п. Обычному юзеру пока ждать нечего.

Romarik77

Добавлено: 17.11.2011 12:20

[профиль]

Member
Статус: Не в сети
Регистрация: 16.03.2011

CUDA до сих пор очень специфична и заточена на математику. Они даже OpenCL не хотят адаптировать, только своё продавливают. А вот на 50 ядер х86 можно повесить и Excel и Тетрис, и тестовый WEB сервер, и что угодно еще, хоть тот же рендеринг 3D. Это же по сути кластер в пачке сигарет.

maxuser

Добавлено: 17.11.2011 12:27

[профиль]

Member
Статус: Не в сети
Регистрация: 12.12.2005
Откуда: Москва

Romarik77 писал(а):

CUDA до сих пор очень специфична и заточена на математику.

Архитектура, эффективная только при распараллеливании на сотни потоков не может не быть "заточенной под математику".

Romarik77 писал(а):

А вот на 50 ядер х86 можно повесить и Excel и Тетрис, и тестовый WEB сервер, и что угодно еще, хоть тот же рендеринг 3D.

А с какой эффективностью? Кому нужен такой эксель, жрущий 0,25 кВт/ч? Подозреваю, что не хотят адаптировать ядра CUDA под OpenCL в том числе из-за эффективности исполнения кода.

Toad

Добавлено: 17.11.2011 12:36

[профиль]

Member
Статус: Не в сети
Регистрация: 28.02.2005
Откуда: Брянск

Зато паролеломалка/хешесчиталка/линпакомонстр за разумные деньги порадует 99,9% местной публики, разве нет?

Romarik77

Добавлено: 17.11.2011 12:46

[профиль]

Member
Статус: Не в сети
Регистрация: 16.03.2011

Мы с Вами говорим о разном. CUDA чисто математическая архитектура, OpenCL попытка отойти чуть в сторону "и другого" софта, х86 универсальное полное ядро общего назначения. На 50 ядер можно (наверное, посмотрим как будет на самом деле) навешать любой существующий софт, или параллельный алгоритм расчета чего угодно. И писать его будет не в пример легче, из-за отсутствия формальных ограничений, обусловленных аппаратной платформой, прежде всего количеством доступной памяти для каждого CUDA процессора. А OpenCL они не берут, чтобы не помогать конкуренту. Конечно там будут проблемы с эффективностью кода, AMD ведь свои GPU точит под OpenCL (там внутри совершенно другой конвейер). Каждый пытается двинуть свой стандарт.

Добавлено спустя 5 минут 24 секунды:

Toad писал(а):

Зато паролеломалка/хешесчиталка/линпакомонстр за разумные деньги порадует 99,9% местной публики, разве нет?

corsi

Добавлено: 17.11.2011 15:08

[профиль]

Member
Статус: Не в сети
Регистрация: 06.10.2008
Откуда: НВ/ХМАО

Romarik77 писал(а):

А OpenCL они не берут, чтобы не помогать конкуренту. Конечно там будут проблемы с эффективностью кода, AMD ведь свои GPU точит под OpenCL (там внутри совершенно другой конвейер).

Чем же они помогут? Код, написанный для nV будет не оптимален для AMD.

_________________
Я стою, как перед вечною загадкою,
Пред великою да сказочной страною

fingoldo

Добавлено: 17.11.2011 16:19

[профиль]

Junior
Статус: Не в сети
Регистрация: 17.11.2011

Romarik, давайте проясним некоторые вещи :-)

Цитата:

- для разработки на CUDA у Nvidia нужно кое-какой софтик лицензионный прикупить;

Это какой софт платный? Я пишу на Cuda финансовые приложения, все инструменты разработки от Nvidia (т.н. Cuda Toolkit) бесплатны под Win, nix, и Mac. Раньше платным был крутой отладчик Parallel Nsight, http://www.nvidia.com/object/parallel-nsight-license.html но что сейчас:

Цитата:

NVIDIA® Parallel Nsight™ Professional is available to all Visual Studio developers, free of charge. The growth of GPU computing has been fantastic and NVIDIA is continuing to invest in this market by making all Windows development tools free of charge to developers;

Цитата:

- вычислительные возможности GeForce, Quadro и Tesla, выполненных на одном и том же процессоре сильно отличаются, они специально разграничены, чтобы за 300 баксов вы получили примерно кукиш, но с надписью CUDA;

Тоже не совсем так. То, о чём Вы говорите, насколько я понимаю, применимо к ситуации с особыми драйверами на Quadro, которые давали значительное ускорение в OpenGL задачах при той же элементной базе но разнице по цене на килобаксы :-)

У Cuda есть понятие Compute Capability, и драйверу пофигу из какого сегмента Ваша карта, например, есть Quadro с CC 1.3, как и GF 285, и Tesla. Единственное отличие Tesla от Quadro и GF в плане CUDA – аппартное, а именно – больше набортной памяти (до 6 Гб) и её регистровость (ECC). Всё! Программных ограничений искусственных нет!

Цитата:

- на разных поколениях процессоров, возможности ядер разные;

Правильно, а на x86 разве не так? :-)

AES, например, SSE4? CUDA – карты нового поколения будут спокойно выполнять старый код, а если Вы его правильно в своё время написали, то он спокойно отмасштабируется на новые мощности  (тут как и на CPU).

Цитата:

CUDA, доступна уже несколько лет, много Вы видите/используете реальных приложений с ее поддержкой? Я вот только Adobe Premier, остальное или не нужно или не юзабельно (ибо реально! работает только на топ Quadro за 3-5 килобаксов, и никак не похачить, это ограничение зашито в чип).

Зайдите сюда :-)

http://www.nvidia.com/object/cuda-apps-flash-new.html#
На сегодня 1 278 (более ТЫСЯЧИ) успешных примеров использования технологии.

В списке Computational Structural Mechanics, Bio-Informatics and Life Sciences, Medical Imaging, Weather and Space, Data Mining and Analytics, Imaging and Computer Vision, Computational Finance, Computational Fluid Dynamics,Electromagnetics and Electrodynamics, Molecular Dynamics.

Большинство, тут не поспоришь, научного направления, согласен с MaxUser.
На десктопах у массы пользователей эта технология, само собой, используется в прогах кодирования видео http://www.greatrussia.com/tag/cuda/ – куча кодеров, и взлома паролей http://www.thg.ru/network/bezopasnost_wifi/index.html - Безопасность Wi-Fi: взлом WPA с помощью процессора, видеокарты и через "облако".
Современные игрушки некоторые используют Cuda, там есть отличное средство Graphics Interop.

Romarik, я вижу, Вам будет чем занять множество вычислительных ядер, если у Вас видяха от чёрно-зелёных, качните http://developer.nvidia.com/cuda-toolkit-40 и посмотрите в SDK Browser примеры прямо у себя на рабочем столе… Knight Corner вам даст (может быть) 50 вычислительных потоков, а GTX 440 – реальных 50 000 потоков :-)

Ваш вариант с QPI был бы хорош, но куда Интел денут обычные процы? С 4-мя ядрами :-)

Хотя платку с 2-мя 50-ядерными я б в 2012 взял, и поставил туда пару Kepler-ов, вот вам и домашний кластер!
Основные потребители, конечно, не частные лица - незачем, а мелкие-средние компании, научные центры при универах, технопарки и т.п.

Добавлено спустя 44 минуты 32 секунды:
А, ну и PhotoShop CS5 поддерживает ускорение CUDA, у них даже презенташка про это есть. В общем, это перспектива, и, учитывая инвестиции Нвидиа, очень реальная...

maxuser

Добавлено: 17.11.2011 18:14

[профиль]

Member
Статус: Не в сети
Регистрация: 12.12.2005
Откуда: Москва

Romarik77 писал(а):

или параллельный алгоритм расчета чего угодно.

Во-первых, далеко не все задачи вообще параллелятся. Во-вторых, между распараллеливанием на 50 и на 500 (а потоков там еще больше) ядер разница не так уж велика, и эти задачи куда сложнее распараллеливания на 2 или 4 ядра, эксель не будет работать на 50 ядрах одновременно только из-за того, что они - х86, его придется писать почти с нуля.

Romarik77 писал(а):

из-за отсутствия формальных ограничений, обусловленных аппаратной платформой, прежде всего количеством доступной памяти для каждого CUDA процессора.

Ну и какая будет эффективность у такого кода, написанного без оглядки на аппаратные ограничения? А клепать ядра без таких ограничений нвидии ни к чему, т.к. это прежде всего видеокарты, а не компактные системы отопления.

Char88

Добавлено: 17.11.2011 19:26

[профиль]

Member
Статус: Не в сети
Регистрация: 08.07.2006
Откуда: СПБ

alex_matveev писал(а):

Вся советская электроника отставала лет на 10 от западной

#77

Добавлено спустя 6 минут 25 секунд:

Romarik77 писал(а):

На 50 ядер можно (наверное, посмотрим как будет на самом деле) навешать любой существующий софт

Разница в ядре CUDA и x86 в производительности на одно ядро (да и то, учитывая что там ядра уровня п3, не думаю что большая). Вопрос ведь не в архитектуре ядра (это дело техники). а в том, что некоторые задачи вообще не могут быть распаралелены, другие никто и не пытается распараллеливать. В заточке программ под 2-х 4-х 8-ми ядерные процессоры настоящего распараллеливания нет, тупо несколько разных задачь раскидываются на разные ядра.

Toad

Добавлено: 17.11.2011 21:39

[профиль]

Member
Статус: Не в сети
Регистрация: 28.02.2005
Откуда: Брянск

CUDA конечно хорошо дешево весло и сердито, но беда в том что судя по новости мы имеем: "Intel GPGPU killer" 50c 1-1.2Ghz > NVIDIA Tesla M2090 512c 0.65GHz. Что не может не напрягать при такой огромной разнице в количестве "c" и не такой же большой в GHz. Так что или Интел растили этот цветок в тепличных условиях либо решили показать что "не все ведра одинаково полсезны(с)"

Prestein

Добавлено: 17.11.2011 22:53

[профиль]

Member
Статус: Не в сети
Регистрация: 22.10.2011

Char88+100
Если бы советское отставание в электроннике было большим, не было бы возможно доминирование в космической сфере и современном на тот момент вооружении. Думаю всем понятно, что на истребителях, ракетах и прочем США и НАТО стояли и стоят чипы собранные по всему капмиру (часто разработанные в Азии), а на нашей технике собственные (!) не уступающие ничем, а очень часто лучшей производительности электронные схемы.
Информационные вбросы о 10 летнем отставании электронники советского периода (не путать с российской реальностью тотального развала) не соответсвуют мощи и прогрессивности ВПК и его продукции того времени.

fingoldo

Добавлено: 18.11.2011 2:14

[профиль]

Junior
Статус: Не в сети
Регистрация: 17.11.2011

Prestein, я, как и Вы, конечно, горжусь достижениями советского союза, очевидно, без продвинутой информатики и технической базы мы бы в космос первыми не полетели. Но что с нашей электроникой сейчас? С прикладной инженерией, мехатроникой? С российскими фундаментальными исследованиями? С тем же космосом?
Неужели нельзя пустить часть выручки от продажи нефти и газа на дотации в этих областях? Или всё бабло обязан распилить рыжий через РОснано? В чём вообще заключается функция президента и премьера, расставить верных людей на ключевые посты в ведомствах и банках? Или, может, всё-таки способствовать процветанию своего государства? От Сколково и Роснано пока нет реальной пользы. А денег туда уже давно ушли миллиарды. А кто мне назовёт модели хотя бы спецускорителей для, скажем,аппаратных нейровычислений, выпуск которых проспонсировало правительство? Но зато мы покупаем у запада планшеты для московских школьников и называем это нанотехнологиями. Слушайте, а может, нам переименовать электронику в позитронику? Метод-то беспроигрышный...
Да о чём тут говорить...

great coder

Добавлено: 18.11.2011 12:15

[профиль]

Member
Статус: Не в сети
Регистрация: 01.12.2003
Откуда: msk.ru

fingoldo писал(а):

Но что с нашей электроникой сейчас?

А она просто уже не советская. И все остальное. И вообще это оффтоп.

Cognitron

Добавлено: 04.12.2011 19:34

Toad писал(а):

Сравнивать ядро MIC и GF - не корректно.
У них совершенно разные возможности.
Как минимум АЛУ GF те которых 512 штук - вообще не могут выполнять вычисления двойной точности и Tesla выполняет вычисления dp на других АЛУ, в то время как MIC выполняет их векторно на каждом ядре и при переходе от fp к dp - в идеале даст двойной прирос в скорости.

А если учесть удобство модификации кода под MIC, то Tesla действительно плохо смотрится на его фоне.

Новая тема /

Закрыто

Сообщений: 59 • Страница 3 из 3 • < 1 2 3

Список форумов » Сайт и конференция » Материалы сайта » Обсуждение новостей

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 22

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти: