Member
Статус: Не в сети Регистрация: 22.06.2011 Откуда: Н.Новгород
о каком вообще разгоне может идти речь когда говориться о серверных процессорах? и сравнение с десктопами типа i7 совсем не уместно Mosga уже писал об этом: жесткие требования по TDP из-за необходимости монтажа в стойку и стандартные системы охлаждения не позволят даже думать о каком либо разгоне.
ЗЫ: в начале этого года был выпущен проц(под серверный сокет LGA1567) http://ark.intel.com/products/53580 10(20) ядер(потоков), 2.4ГГц, 30Mb L3, укладываясь при этом в 130 ваттный TDP.
Member
Статус: Не в сети Регистрация: 29.10.2003 Откуда: 埼玉、日本 Фото: 9
перестаньте сказать про разгон ксеонов. обычно тому кто ответственный за сервер с ксеоном, отрывают голову при сбое особенно если downtime затянется. а вы говорите разгон... там даже перезагрузка очень часто - конец света, а вы разгон ..
Member
Статус: Не в сети Регистрация: 23.11.2010 Откуда: DE
DokFreeman писал(а):
о каком вообще разгоне может идти речь когда говориться о серверных процессорах?
Zio писал(а):
перестаньте сказать про разгон ксеонов.
Если они серверные, это не значит, что их можно использовать только в серверах. Бенчеры часто балуются разгоном Xeon на свои нужды, именно их я имел ввиду под "энтузиастами", тут скорее о принципиальной возможности разгона Xeon.
Учим русский по графѣну
Статус: Не в сети Регистрация: 30.12.2004 Откуда: У зайца яйца
Mosga писал(а):
Вон, есть модель с частотой 3.1 Ггц - так этот 8-ядерник в 135 Вт не уложился, поставили 150 Вт TDP. Такое большое тепловыделение - огромная проблема для сервера, где частенько нужно разместить два таких проца в 1U корпус и обойтись пассивным радиатором с общим продувом.
Ага. Пока Оптероны для серверов интереснее смотрятся, там разумные цифры TDP. С Бульдозером можно будет даже собрать 64-ядерный 1U, цифры, те что мы пока видели, позволяют.
Member
Статус: Не в сети Регистрация: 23.11.2010 Откуда: DE
Varg писал(а):
Ага. Пока Оптероны для серверов интереснее смотрятся, там разумные цифры TDP. С Бульдозером можно будет даже собрать 64-ядерный 1U, цифры, те что мы пока видели, позволяют.
Опыт говорит об обратном. Использую на работе кластер, в котором есть два типа процессоров - Opteron 6176SE (x12, TDP 140 W, 2.3 GHz, 12 MB L3) и Xeon X5670 (x6, HT, TDP 95 W, 2.93 GHz, 12 MB L3), оба вышли приблизительно в одно время и цены очень близкие. При расчете на 12 потоков Xeon оказывается на 30 процентов быстрее. Понятно, что Xeon имеет частотное преимущество, но это кластер, как есть, так есть. Выходит, что при меньшем энергопотреблении Xeon более производителен. Причем это еще Nehalem. Так что много ядер не всегда лучше, даже в многопотоке. Причина может быть в работе с памятью, может быть это только моя программа такая. Хотя тенденция больше ядер - больше требования к памяти всегда действовала.
Учим русский по графѣну
Статус: Не в сети Регистрация: 30.12.2004 Откуда: У зайца яйца
Terve!R писал(а):
...который будет работать так же быстро, как и два Xeon с их 32 потоками
Раза так в 2.5-3 быстрее, судя по имеющимся предварительным бенчмаркам. Ну другое дело что и low-TDP ксеоны будут.
nedelhof писал(а):
Причина может быть в работе с памятью, может быть это только моя программа такая.
Возможно. Вообще задача числодробильная, а не серверная. В именно серверных задачах нужно побольше одновременно обрабатываемых запросов, что предъявляет требования к числу ядер.
Member
Статус: Не в сети Регистрация: 21.06.2004 Откуда: Санкт-Петербург
nedelhof Ага, но смотрите: Opteron 6176SE вы можете воткнуть 4 штуки, причем материнки под это безобразие стоят практически не дороже 2-х процессорных! (например, линейка от supermicro http://www.supermicro.com/Aplus/motherboard/Opteron6100/). А зеончика не больше двух штук. Так что даже если два оптерона сливают этим двум зеонам - если у вас задача паралеллится, вы можете взять 4 оптерона и получить хорошую производительность, а вот 4 зеона.. хм.. придется переходить на линейку Westmere EX, которая, конечно, замечательная, но процессоры будут стоит ощутимо дороже и частоты будут меньше.
Что касается ПСП, то тут да, в многоядерных конфигурациях с ней всегда проблема. 6 каналов памяти на два проца - кажется круто, но если вспомнить про 12 ядер (24 под HT), на которые это делится - то оказывается уже "не так идеально". А Westmere EX с четырьмя каналами под процессор имеет зашкаливающую общую ПСП в 70 Гб/с, но на эти 4 10-ти ядерника это выйдет 70/40 = 1.75 Гб/с под каждый проц, что уже при действительно параллельной нагрузке окажется гм.. не так идеально.
Member
Статус: Не в сети Регистрация: 23.11.2010 Откуда: DE
Mosga писал(а):
Ага, но смотрите: Opteron 6176SE вы можете воткнуть 4 штуки, причем материнки под это безобразие стоят практически не дороже 2-х процессорных!
У нас именно 4x 6176SE там и стоит. Вот только не знаю, какая мать. Звучит хорошо, можно сэкономить на одной материнке и месте в стойке, но расход энергии все равно больше, и это в основном процессор, а не мать. Все-таки 95*2=190 Вт и 140*2=280 Вт - это существенная разница, учитывая, что кластер работает 24 часа в сутки при средней загрузке не менее 60-70 процентов. Мать окупится довольно быстро. Единственное "но" - это задачи, которые безусловно требуют 24-48 потоков. Там система на Opteron будет значительно выгоднее. Но мне о таких задачах неизвестно. Кстати, пробовал разное количество потоков на Xeon, чтобы найти оптимальное соотношение производительность/количество потоков. Как это легко предположить, самым оптимальным является использование 12 потоков, т.е. одного процессора. При расчете сразу на двух процессорах (>12 потоков) масштабируемость резко ухудшается, выходя на асимптоту уже к 18 потокам. Это, конечно, только одна конкретная взятая программа...
Member
Статус: Не в сети Регистрация: 21.06.2004 Откуда: Санкт-Петербург
nedelhof Хм да, дело скорее всего в локальности памяти - приложение не написано с рассчетом на NUMA Без NUMA-режима и соответствующего проектирования приложение, "одно единственное" приложение, считающее, что вся память общая и что с любого процессора с ней работать одинаково, может сталкиваться с такими вот затыками в производительности. Серьезные проекты, для которых актуальна производительность узнают топологию NUMA и стараются по возможности не обращаться из кода, выполняющегося на одном процессоре к памяти, которая находится за контроллером другого; но писать такой код в общем случае - удел достаточно профессиональных программистов
Собственно, без NUMA на "одном большом приложении" никогда и не получить нормальное распараллеливание в подобных системах; либо пачка мелких приложений или виртуалок, не вылезающих со своих процессоров (более типично), или нужно знать про NUMA, по другому чисто технически не выйдет получить всю мощность. Слишком дорогая операция постоянной работы с памятью "не своего" процессора.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 37
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения