Member
Статус: Не в сети Регистрация: 18.02.2005 Откуда: Москва
Waramagedon писал(а):
Kot-II Наверное ты пил на выходных
Конечно. Я всегда пью на выходных. А иногда еще и по будням
Waramagedon писал(а):
Kot-II 1. серверные були уже отгрузили и они в пути к дилерам.
...и могут находится "в пути" еще долго.
Waramagedon писал(а):
Kot-II 2. процессоры интел в исполнении 2011 задерживаются.
Дык и я о том же: процессоры интел в исполнении 2011 задерживаются, но у интел и без процессоров в исполнении 2011 уже есть восьми- и десяти ядерные процессоры... Они, конечно, не обладают главным для серверного процессора свойством - "исполнением 2011", но работать и рвать Opteron'ы им это не мешает
Community Manager
Статус: Не в сети Регистрация: 30.12.2004 Откуда: У зайца яйца
Gus@r Да это франкенштейны, там по факту в одном чипе 6-ядерник плюс 4-ядерник, цена конская. Их ставят только где принципиально уместить побольше в заданное число вершков.
Остальные ставят восьмисокетники или (чаще) обходятся несколькими четырёхсокетниками.
Реально интересен sub-$1,000 сегмент.
Добавлено спустя 1 минуту:
Boris_leo писал(а):
А чё енто за сокет такой? Или это всё-же LGA 1366?
1356, три канала памяти, серверный аналог 1366 для новых.
Member
Статус: Не в сети Регистрация: 02.02.2007 Откуда: Казахстан
есть та есть 8-ядерынеи более только они на предыдущей архитектуре Westmere-Ex ну не совсем предыдущей, вот сервера докатились только к половине 2011 года когда как их настольные карлики (если сравнивать кэши/ядра) вышли еще 2010
Member
Статус: Не в сети Регистрация: 23.11.2010 Откуда: DE
Varg писал(а):
Да это франкенштейны, там по факту в одном чипе 6-ядерник плюс 4-ядерник, цена конская.
Что значит "на одном чипе 6-ядерник плюс 4 ядерник"? Вполне нормальный десятиядерник. По бокам по пять ядер, посередине кэш и контроллер памяти. Кэш общий для всех ядер. В чем дичь? А цена может и конская, ну так и рынок для знатных "коней". Есть возможность построить компьютер с 80 ядрами, 160 потоков. Такое счастье само по себе будет весьма компактным, но при этом может заменить небольшой вычислительный кластер при значительно лучшей энергоэффективности. Жадный платит дважды.
Community Manager
Статус: Не в сети Регистрация: 30.12.2004 Откуда: У зайца яйца
nedelhof писал(а):
Что значит "на одном чипе 6-ядерник плюс 4 ядерник"? Вполне нормальный десятиядерник. По бокам по пять ядер, посередине кэш и контроллер памяти. Кэш общий для всех ядер.
Есть сомнения в том, что он фактически общий, а не только формально. Как-никак переучить ядро делить кэш иначе, и между прямым доступом и тем что связывает эти два блока - не глобальные, но переделки, там широкие параллельные шины. Куда проще скопипастить отработанный дизайн два раза. Особенно учитывая, что клиентов интересует достаточно равномерная многопоточность.
nedelhof писал(а):
Есть возможность построить компьютер с 80 ядрами, 160 потоков. Такое счастье само по себе будет весьма компактным, но при этом может заменить небольшой вычислительный кластер при значительно лучшей энергоэффективности.
Лучшей ли? Отбраковывать эти кристаллы особо некуда, значит речи об отборе лучших экземпляров не идёт. Частоты не сильно высокие, у самого старшего ($4,600 в 8-сокетном, $4,200 в 2-сокетном) турбо 2.8 ГГц. TDP 130 ватт, и можно не сомневаться, он их выбирает. Или возьмём 8860 ($4,000), чтобы сравнять по кэшу.
Аналогичный по предельной частоте (2.8) L5640 - TDP 60 ватт, стоит официально около $1000. Ставим пару, дважды по 60 ватт, 120 ватт. Дополнительное потребление памяти и прочего невелико, к тому же получаем 6 каналов на 12 ядер вместо 4 на 10 ядер, это скомпенсирует чуть меньшие частоты и кэш. Так что энергоэффективнее выходит.
Ну и не мне напоминать, что рынок восьмисокетников сейчас совсем небольшой, смысла мало (единственное что память общая), возни много. Кому надо - делают рэки 4-сокетных или блейды. Получается значительно компактнее 8-сокетных, проще в обслуживании, в случае 4-сокетных дешевле. Существующие восьмисокетники и строятся по сути как недоделанные блейды, на райзерах, только вот хот-свапа и прочих блейдовых функций нет. По компактности - упомянутых камней легко позволяется ставить 4 штуки на блейд (а вот 130-ваттных, в те блейды где такой TDP вообще позволяется, не более двух), получается 120 ядер в 4U, 30 на вершок. 8-сокетные шасси редко влезают в стандартные 4U, больше 5U, а 80 ядер в 5U - всего 16 на вершок.
Member
Статус: Не в сети Регистрация: 23.11.2010 Откуда: DE
Varg писал(а):
Есть сомнения в том, что он фактически общий, а не только формально.
Именно фактически. Каждое ядро имеет доступ к своему банку кэша (3 МБ), обмен данными между банками происходит по кольцевой шине. Никаких 6-ядерных и 4-ядерных блоков там нет.
Varg писал(а):
Как-никак переучить ядро делить кэш иначе, и между прямым доступом и тем что связывает эти два блока - не глобальные, но переделки, там широкие параллельные шины. Куда проще скопипастить отработанный дизайн два раза.
Это безусловно проще, но не эффективно. Вы недооцениваете Intel. Что касается "проще скопипастить" - это как раз про Thuban, в котором два ядра просто "тупо" прилепили к Deneb. Расположение элементов практически не изменилось, про эффективность взаимодействия с L3 можно не упоминать... Намного эффективнее было бы поместить ядра в одну линию с общим полем L3 (как в Gulftown), или как в Westmere-EX - по 3 ядра по краям и кэш внутри.
Varg писал(а):
Лучшей ли?Отбраковывать эти кристаллы особо некуда, значит речи об отборе лучших экземпляров не идёт.
Отбраковывать есть куда, на этом кристалле выпускаются целых пять вариантов процессоров - 10 ядер/30 МБ L3, 10/24, 8/24, 8/18, 6/18. При таком размере кристалла - 513 кв. мм, брака должно быть достаточно много, поэтому и цена такая.
Varg писал(а):
Аналогичный по предельной частоте (2.8) L5640 - TDP 60 ватт, стоит официально около $1000. Ставим пару, дважды по 60 ватт, 120 ватт. Дополнительное потребление памяти и прочего невелико, к тому же получаем 6 каналов на 12 ядер вместо 4 на 10 ядер, это скомпенсирует чуть меньшие частоты и кэш. Так что энергоэффективнее выходит.
В таком варианте согласен, конечно, производительность почти та же, но потребление двухсокетника почти всегда больше, чем односокетника, не говоря о доступе к памяти. Я имел ввиду 8-процессорные конфигурации. C L5640 это вообще невозможно. Другое дело - надо оно или нет. Я уверен, что и десятиядерники покупают, для больших учреждений и корпораций $4000 - это небольшие деньги.
Community Manager
Статус: Не в сети Регистрация: 30.12.2004 Откуда: У зайца яйца
nedelhof писал(а):
Это безусловно проще, но не эффективно. Вы недооцениваете Intel.
Ну почему же? Наоборот, переоценил. Действительно совсем просто сделано, как на 4-ядерниках.
nedelhof писал(а):
Отбраковывать есть куда, на этом кристалле выпускаются целых пять вариантов процессоров - 10 ядер/30 МБ L3, 10/24, 8/24, 8/18, 6/18
Это отбраковка по битым ядрам. А с отбраковкой по VID/частоте пространства очень мало.
nedelhof писал(а):
В таком варианте согласен, конечно, производительность почти та же, но потребление двухсокетника почти всегда больше, чем односокетника, не говоря о доступе к памяти.
Да не "почти та же", а выше. И доступ к памяти - до тех пор, пока ядра не пытаются лезть все одну область (а это далеко не везде принято, у виртуальных серверов чётко разделение) - тоже лучше. Потребление двухсокетника выше при прочих равных, здесь они не равны. Впрочем оно все равно будет чуть побольше, за счёт чипсета, но разница по производительности (+2 ядра, +15%...+25%) это перекроет.
nedelhof писал(а):
Я имел ввиду 8-процессорные конфигурации. C L5640 это вообще невозможно. Другое дело - надо оно или нет.
Ну, восьмисокетных серверов продаётся примерно так... даже один на сотню не будет. Раритет сегодня. Рынок своё мнение сказал.
nedelhof писал(а):
Я уверен, что и десятиядерники покупают, для больших учреждений и корпораций $4000 - это небольшие деньги.
Только и 10 ядер для них - ничтожная мощность. А когда их нужны тысячи, любая организация подумает, надо ли им такое, или лучше собрать дешевле на 6-ядерниках, или почти так же по цене, но проще в обслуживании на блейдах. А когда задачи плохо распараллеливаются, то интереснее становятся не 10-ядерные монстры, а быстрые 6-ядерники. К примеру X5690 - 3.46 ГГц - то есть по прикидке примерно 87% производительности 10-ядерника при единичной эффективности распараллеливания, и более 100% при недостаточной.
Member
Статус: Не в сети Регистрация: 23.11.2010 Откуда: DE
Varg писал(а):
А когда задачи плохо распараллеливаются, то интереснее становятся не 10-ядерные монстры, а быстрые 6-ядерники. К примеру X5690 - 3.46 ГГц - то есть по прикидке примерно 87% производительности 10-ядерника при единичной эффективности распараллеливания, и более 100% при недостаточной.
Это однозначно. Для вычислительных кластеров общего назначения самый лучший вариант. У нас в университете как раз трудятся 24 Xeon X5670 на двухсокетниках. Частота довольна высокая, но и на 24 потока считать можно. Там же есть еще 4x4 Opteron 6176 SE, 12 ядер, но частота ниже - 2.3 ГГц, они уже больше для хорошо распараллеливаемых задач подходят, и то, даже в таких задачах 12 потоков X5670 часто оказываются быстрее 12 ядер 6176 SE. Скорее всего проблема в доступе к памяти.
Member
Статус: Не в сети Регистрация: 23.11.2010 Откуда: DE
GReY писал(а):
расположение без серьёзной необходимости не меняют - очень много подводных камней
Просто как пример консервативной структуры привел.
GReY писал(а):
что у тубана не так со взаимодействием?
Большая латентность L3 у Thuban, чем у Deneb (статья). Конечно, не факт, что именно расположение элементов сыграло здесь решающую роль, такова моя гипотеза. Да и подтвердить это на самом деле практически невозможно, так что остается только гадать.
GReY писал(а):
вы забываете,ь что архитектура кэшей у AMD традиционно отличается от Intel, и что хорошо одному, то другому...
С этим не поспоришь, хотя, мне кажется, симметричная структура чипа никогда не помешает, вот тут как раз подводных камней меньше всего. Что касается архитектуры кэша, то реализация явно очень разная, потому что по факту L1 кэш у Phenom II работает существенно быстрее L1 кэша Sandy Bridge, но при этом L2 кэш работает приблизительно со скоростью L3-кэша Sandy Bridge. L3 кэш по пропускной способности не так далеко от оперативной памяти, несмотря на меньшую латентность.
GReY писал(а):
Энергопотребление Xeon EX и 12-ядерных Opteron
Это для информации? Ничего нового не узнал. Или Вы хотели показать, что Westmere-EX горячее Magny-Cours? Это и так очевидно, так же как и их совершенно разная производительность.
Community Manager
Статус: Не в сети Регистрация: 30.12.2004 Откуда: У зайца яйца
nedelhof писал(а):
L3 кэш по пропускной способности несмотря на меньшую латентность
Ну пошло... Пропускная способность кэша вообще никакого значения не имеет, исключительно латентность. Ради которой его вообще и делят на уровни. Иначе можно и врубить все три шины в один массив DRAM - вот там будет ПСП.
А латентность кэша - кстати, правильно говорить о средней латентности, поскольку на отдельных запросах она варьируется раз так в 100 - зависит не от расстояния, которого в процессоре немного, а от объёма, поскольку в нём надо копаться для поиска данных. И чем больше кэш, тем дольше копаться, поэтому и деление на уровни.
nedelhof писал(а):
Или Вы хотели показать, что Westmere-EX горячее Magny-Cours? Это и так очевидно
Там не об этом речь, а о потреблении под реальной нагрузкой. Westmere-EX слабо снижает его по сравнению с полной загрузкой, даже в простое потребляя большую часть пиковой мощности, Opteron значительно снижает. Поэтому при случайной загрузке, соответствующей не-пиковым часам сервера (а рассчитывать-то надо на пиковые), у Оптерона получилось почти вдвое меньшее потребление при выполнении равной работы.
Из чего вывод, датацентрам, где характерна случайно варьирующаяся загрузка, особенно при выделении виртуальных серверов, выгоден более экономичный на ней процессор, не только из-за цены самих процессоров, но и сниженного потребления, а следовательно и нагрузки на системы энергоснабжения, кондиционирования, резервного питания.
Member
Статус: Не в сети Регистрация: 23.11.2010 Откуда: DE
Varg писал(а):
Пропускная способность кэша вообще никакого значения не имеет, исключительно латентность.
Согласен, что латентность - важнейшая характеристика (сравнение с оперативной памятью было неуместно), но далеко не исключительная, важную роль играет также количество путей для доступа в кэш и их ширина, особенно для кэшей высших уровней. Логично, что ПС зависит от обоих параметров, поэтому общую производительность вполне можно оценивать по ПС кэша. Недаром же при тестах кэшей исследуют оба параметра.
Varg писал(а):
А латентность кэша - кстати, правильно говорить о средней латентности, поскольку на отдельных запросах она варьируется раз так в 100 - зависит не от расстояния, которого в процессоре немного, а от объёма, поскольку в нём надо копаться для поиска данных. И чем больше кэш, тем дольше копаться, поэтому и деление на уровни.
Согласен. Только вот объем L3-кэша в Thuban и Deneb абсолютно одинаков, так что таким образом разницу в латентности не объяснить. Стоит добавить, что скорость работы кэша зависит еще от частоты его работы, которая также уменьшается при увеличении уровня кэша. Может частота работы L3 в Deneb и Thuban разная?
Varg писал(а):
Westmere-EX слабо снижает его по сравнению с полной загрузкой, даже в простое потребляя большую часть пиковой мощности, Opteron значительно снижает. Поэтому при случайной загрузке, соответствующей не-пиковым часам сервера (а рассчитывать-то надо на пиковые), у Оптерона получилось почти вдвое меньшее потребление при выполнении равной работы. Из чего вывод, датацентрам, где характерна случайно варьирующаяся загрузка, особенно при выделении виртуальных серверов, выгоден более экономичный на ней процессор, не только из-за цены самих процессоров, но и сниженного потребления, а следовательно и нагрузки на системы энергоснабжения, кондиционирования, резервного питания.
Покупать очень дорогой десятиядерник и не нагружать его по полной - кто вообще таким занимается? Для этого есть процессоры послабее и соответственно поэкономнее. А Westmere-EX - это тяжеловес, созданный для тяжелой работы, и оправдывает он себя при полной нагрузке.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 18
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения