Если верить товарищу serj (http://testmem.tz.ru/index.htm), то оптимально работающий контроллер памяти у Intel последний раз видели примерно на Pentium Pro, а потом контора на него как-бы положила. На самом деле он оптимизирован не под те задачи, которые решает обычное ПО. Если просуммировать все источники, прочитанные в разное время и по разным поводам, то тенденция выглядит так: - есть некоторые алгоритмы, которые нужны для производства некоторых вычислений (обычные люди с ними не наверное столкнутся никогда) и процессора оптимизируются для максимально быстрого выполнения именно этих алгоритмов; - потом все эти технологии выходят "по конверсии" на обычный рынок, под видом мега новинок для масс, на этом отбивается R&D; - самый простой пример из недавнего - внедрение AES в процы Intel и VIA.
Добавлено спустя 22 минуты 12 секунд: fingoldo, если это будет спецускоритель, то вы его не купите, не понадобится. Тут прикол в чём, если внимательно поковыряться в том, что продвигает Nvidia, то Вы увидите следующее: - для разработки на CUDA у Nvidia нужно кое-какой софтик лицензионный прикупить; - вычислительные возможности GeForce, Quadro и Tesla, выполненных на одном и том же процессоре сильно отличаются, они специально разграничены, чтобы за 300 баксов вы получили примерно кукиш, но с надписью CUDA; - на разных поколениях процессоров, возможности ядер разные. CUDA, доступна уже несколько лет, много Вы видите/используете реальных приложений с ее поддержкой? Я вот только Adobe Premier, остальное или не нужно или не юзабельно (ибо реально! работает только на топ Quadro за 3-5 килобаксов, и никак не похачить, это ограничение зашито в чип).
Intel поступит также,а значит порог вхождения для разработчиков будет далеко не 300 баксов.
Member
Статус: Не в сети Регистрация: 12.12.2005 Откуда: Москва
Romarik77 писал(а):
вычислительные возможности GeForce, Quadro и Tesla, выполненных на одном и том же процессоре сильно отличаются, они специально разграничены, чтобы за 300 баксов вы получили примерно кукиш, но с надписью CUDA;
Как раз тесты показывают, что в чистой производительности CUDA-вычислений игровые топы в разы выгоднее квадр. По крайней мере в том софте, где нет ограничений на тип.
Romarik77 писал(а):
много Вы видите/используете реальных приложений с ее поддержкой?
Визуализация работает на ура (Octane Render), масштабирование производительности тоже на высоте. Вроде бы есть еще всякая поверхностная поддержка CUDA в разных мультимедиа-конвертерах. В любом случае, я сейчас и не вижу задач у рядового пользователя, для которых ему нужна CUDA.
_________________ "Хорошо, здесь я расскажу вам всё так, что вы сможете обсуждать такие вещи как BRDF и BSSRDF с Вашими коллегами."
Последний раз редактировалось maxuser 17.11.2011 12:05, всего редактировалось 4 раз(а).
Это более реально, ведь для прилинковки по QPI нужно будет разработать новые чипсеты/материнские платы...
Вторая стрелочка на третьем слайде как-бы намекает именно на это. QPI стандартная шина, нужна будет только правка БИОС и наверное другой VRM на матери. Таким образом, чуть переработанные 2-х или 4-х процессорные матери Xeon + Чудо и будут с этим работать. Жаль, я бы тоже хотел платку баксов за 300, даже за 500 (но лучше "стандартный" проц для 2-х процевой мамки). Но только при условии, что она пропишется как 100500 процессоров, а не как спецмодуль.
Добавлено спустя 40 секунд: maxuser, пожалуйста озвучьте софт. Я слеп, я нигде не вижу этого софта.
Member
Статус: Не в сети Регистрация: 12.12.2005 Откуда: Москва
Romarik77 Это не плагин к майя, а отдельная программа без привязки к пакету моделирования. У нее есть конкуренты, но я не углублялся в сравнения и уровень поддержки CUDA у них.
Romarik77 писал(а):
Где охренительное разнообразие?
А для каких задач? Excel с поддержкой CUDA? Тетрис с реальной физикой? Под специализированные задачи (где, например, есть энтузиасты, поддержка нвидии или просто коммерческий интерес) софт постепенно делается. Наверняка в скором времени появятся (если еще не появились) присадки для инженерного ПО, расчетов на прочность и т.п. Обычному юзеру пока ждать нечего.
_________________ "Хорошо, здесь я расскажу вам всё так, что вы сможете обсуждать такие вещи как BRDF и BSSRDF с Вашими коллегами."
CUDA до сих пор очень специфична и заточена на математику. Они даже OpenCL не хотят адаптировать, только своё продавливают. А вот на 50 ядер х86 можно повесить и Excel и Тетрис, и тестовый WEB сервер, и что угодно еще, хоть тот же рендеринг 3D. Это же по сути кластер в пачке сигарет.
Member
Статус: Не в сети Регистрация: 12.12.2005 Откуда: Москва
Romarik77 писал(а):
CUDA до сих пор очень специфична и заточена на математику.
Архитектура, эффективная только при распараллеливании на сотни потоков не может не быть "заточенной под математику".
Romarik77 писал(а):
А вот на 50 ядер х86 можно повесить и Excel и Тетрис, и тестовый WEB сервер, и что угодно еще, хоть тот же рендеринг 3D.
А с какой эффективностью? Кому нужен такой эксель, жрущий 0,25 кВт/ч? Подозреваю, что не хотят адаптировать ядра CUDA под OpenCL в том числе из-за эффективности исполнения кода.
_________________ "Хорошо, здесь я расскажу вам всё так, что вы сможете обсуждать такие вещи как BRDF и BSSRDF с Вашими коллегами."
Мы с Вами говорим о разном. CUDA чисто математическая архитектура, OpenCL попытка отойти чуть в сторону "и другого" софта, х86 универсальное полное ядро общего назначения. На 50 ядер можно (наверное, посмотрим как будет на самом деле) навешать любой существующий софт, или параллельный алгоритм расчета чего угодно. И писать его будет не в пример легче, из-за отсутствия формальных ограничений, обусловленных аппаратной платформой, прежде всего количеством доступной памяти для каждого CUDA процессора. А OpenCL они не берут, чтобы не помогать конкуренту. Конечно там будут проблемы с эффективностью кода, AMD ведь свои GPU точит под OpenCL (там внутри совершенно другой конвейер). Каждый пытается двинуть свой стандарт.
Добавлено спустя 5 минут 24 секунды:
Toad писал(а):
Зато паролеломалка/хешесчиталка/линпакомонстр за разумные деньги порадует 99,9% местной публики, разве нет?
Member
Статус: Не в сети Регистрация: 06.10.2008 Откуда: НВ/ХМАО
Romarik77 писал(а):
А OpenCL они не берут, чтобы не помогать конкуренту. Конечно там будут проблемы с эффективностью кода, AMD ведь свои GPU точит под OpenCL (там внутри совершенно другой конвейер).
Чем же они помогут? Код, написанный для nV будет не оптимален для AMD.
_________________ Я стою, как перед вечною загадкою, Пред великою да сказочной страною
- для разработки на CUDA у Nvidia нужно кое-какой софтик лицензионный прикупить;
Это какой софт платный? Я пишу на Cuda финансовые приложения, все инструменты разработки от Nvidia (т.н. Cuda Toolkit) бесплатны под Win, nix, и Mac. Раньше платным был крутой отладчик Parallel Nsight, http://www.nvidia.com/object/parallel-nsight-license.html но что сейчас:
Цитата:
NVIDIA® Parallel Nsight™ Professional is available to all Visual Studio developers, free of charge. The growth of GPU computing has been fantastic and NVIDIA is continuing to invest in this market by making all Windows development tools free of charge to developers;
Цитата:
- вычислительные возможности GeForce, Quadro и Tesla, выполненных на одном и том же процессоре сильно отличаются, они специально разграничены, чтобы за 300 баксов вы получили примерно кукиш, но с надписью CUDA;
Тоже не совсем так. То, о чём Вы говорите, насколько я понимаю, применимо к ситуации с особыми драйверами на Quadro, которые давали значительное ускорение в OpenGL задачах при той же элементной базе но разнице по цене на килобаксы
У Cuda есть понятие Compute Capability, и драйверу пофигу из какого сегмента Ваша карта, например, есть Quadro с CC 1.3, как и GF 285, и Tesla. Единственное отличие Tesla от Quadro и GF в плане CUDA – аппартное, а именно – больше набортной памяти (до 6 Гб) и её регистровость (ECC). Всё! Программных ограничений искусственных нет!
Цитата:
- на разных поколениях процессоров, возможности ядер разные;
Правильно, а на x86 разве не так? AES, например, SSE4? CUDA – карты нового поколения будут спокойно выполнять старый код, а если Вы его правильно в своё время написали, то он спокойно отмасштабируется на новые мощности (тут как и на CPU).
Цитата:
CUDA, доступна уже несколько лет, много Вы видите/используете реальных приложений с ее поддержкой? Я вот только Adobe Premier, остальное или не нужно или не юзабельно (ибо реально! работает только на топ Quadro за 3-5 килобаксов, и никак не похачить, это ограничение зашито в чип).
В списке Computational Structural Mechanics, Bio-Informatics and Life Sciences, Medical Imaging, Weather and Space, Data Mining and Analytics, Imaging and Computer Vision, Computational Finance, Computational Fluid Dynamics,Electromagnetics and Electrodynamics, Molecular Dynamics.
Большинство, тут не поспоришь, научного направления, согласен с MaxUser. На десктопах у массы пользователей эта технология, само собой, используется в прогах кодирования видео http://www.greatrussia.com/tag/cuda/ – куча кодеров, и взлома паролей http://www.thg.ru/network/bezopasnost_wifi/index.html - Безопасность Wi-Fi: взлом WPA с помощью процессора, видеокарты и через "облако". Современные игрушки некоторые используют Cuda, там есть отличное средство Graphics Interop.
Romarik, я вижу, Вам будет чем занять множество вычислительных ядер, если у Вас видяха от чёрно-зелёных, качните http://developer.nvidia.com/cuda-toolkit-40 и посмотрите в SDK Browser примеры прямо у себя на рабочем столе… Knight Corner вам даст (может быть) 50 вычислительных потоков, а GTX 440 – реальных 50 000 потоков
Ваш вариант с QPI был бы хорош, но куда Интел денут обычные процы? С 4-мя ядрами Хотя платку с 2-мя 50-ядерными я б в 2012 взял, и поставил туда пару Kepler-ов, вот вам и домашний кластер! Основные потребители, конечно, не частные лица - незачем, а мелкие-средние компании, научные центры при универах, технопарки и т.п.
Добавлено спустя 44 минуты 32 секунды: А, ну и PhotoShop CS5 поддерживает ускорение CUDA, у них даже презенташка про это есть. В общем, это перспектива, и, учитывая инвестиции Нвидиа, очень реальная...
Member
Статус: Не в сети Регистрация: 12.12.2005 Откуда: Москва
Romarik77 писал(а):
или параллельный алгоритм расчета чего угодно.
Во-первых, далеко не все задачи вообще параллелятся. Во-вторых, между распараллеливанием на 50 и на 500 (а потоков там еще больше) ядер разница не так уж велика, и эти задачи куда сложнее распараллеливания на 2 или 4 ядра, эксель не будет работать на 50 ядрах одновременно только из-за того, что они - х86, его придется писать почти с нуля.
Romarik77 писал(а):
из-за отсутствия формальных ограничений, обусловленных аппаратной платформой, прежде всего количеством доступной памяти для каждого CUDA процессора.
Ну и какая будет эффективность у такого кода, написанного без оглядки на аппаратные ограничения? А клепать ядра без таких ограничений нвидии ни к чему, т.к. это прежде всего видеокарты, а не компактные системы отопления.
_________________ "Хорошо, здесь я расскажу вам всё так, что вы сможете обсуждать такие вещи как BRDF и BSSRDF с Вашими коллегами."
Member
Статус: Не в сети Регистрация: 08.07.2006 Откуда: СПБ
alex_matveev писал(а):
Вся советская электроника отставала лет на 10 от западной
#77
Добавлено спустя 6 минут 25 секунд:
Romarik77 писал(а):
На 50 ядер можно (наверное, посмотрим как будет на самом деле) навешать любой существующий софт
Разница в ядре CUDA и x86 в производительности на одно ядро (да и то, учитывая что там ядра уровня п3, не думаю что большая). Вопрос ведь не в архитектуре ядра (это дело техники). а в том, что некоторые задачи вообще не могут быть распаралелены, другие никто и не пытается распараллеливать. В заточке программ под 2-х 4-х 8-ми ядерные процессоры настоящего распараллеливания нет, тупо несколько разных задачь раскидываются на разные ядра.
Member
Статус: Не в сети Регистрация: 28.02.2005 Откуда: Брянск
CUDA конечно хорошо дешево весло и сердито, но беда в том что судя по новости мы имеем: "Intel GPGPU killer" 50c 1-1.2Ghz > NVIDIA Tesla M2090 512c 0.65GHz. Что не может не напрягать при такой огромной разнице в количестве "c" и не такой же большой в GHz. Так что или Интел растили этот цветок в тепличных условиях либо решили показать что "не все ведра одинаково полсезны(с)"
Char88+100 Если бы советское отставание в электроннике было большим, не было бы возможно доминирование в космической сфере и современном на тот момент вооружении. Думаю всем понятно, что на истребителях, ракетах и прочем США и НАТО стояли и стоят чипы собранные по всему капмиру (часто разработанные в Азии), а на нашей технике собственные (!) не уступающие ничем, а очень часто лучшей производительности электронные схемы. Информационные вбросы о 10 летнем отставании электронники советского периода (не путать с российской реальностью тотального развала) не соответсвуют мощи и прогрессивности ВПК и его продукции того времени.
Prestein, я, как и Вы, конечно, горжусь достижениями советского союза, очевидно, без продвинутой информатики и технической базы мы бы в космос первыми не полетели. Но что с нашей электроникой сейчас? С прикладной инженерией, мехатроникой? С российскими фундаментальными исследованиями? С тем же космосом? Неужели нельзя пустить часть выручки от продажи нефти и газа на дотации в этих областях? Или всё бабло обязан распилить рыжий через РОснано? В чём вообще заключается функция президента и премьера, расставить верных людей на ключевые посты в ведомствах и банках? Или, может, всё-таки способствовать процветанию своего государства? От Сколково и Роснано пока нет реальной пользы. А денег туда уже давно ушли миллиарды. А кто мне назовёт модели хотя бы спецускорителей для, скажем,аппаратных нейровычислений, выпуск которых проспонсировало правительство? Но зато мы покупаем у запада планшеты для московских школьников и называем это нанотехнологиями. Слушайте, а может, нам переименовать электронику в позитронику? Метод-то беспроигрышный... Да о чём тут говорить...
CUDA конечно хорошо дешево весло и сердито, но беда в том что судя по новости мы имеем: "Intel GPGPU killer" 50c 1-1.2Ghz > NVIDIA Tesla M2090 512c 0.65GHz. Что не может не напрягать при такой огромной разнице в количестве "c" и не такой же большой в GHz
Сравнивать ядро MIC и GF - не корректно. У них совершенно разные возможности. Как минимум АЛУ GF те которых 512 штук - вообще не могут выполнять вычисления двойной точности и Tesla выполняет вычисления dp на других АЛУ, в то время как MIC выполняет их векторно на каждом ядре и при переходе от fp к dp - в идеале даст двойной прирос в скорости.
А если учесть удобство модификации кода под MIC, то Tesla действительно плохо смотрится на его фоне.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 22
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения