Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Cronos Вопросик такой - ядра не отключаются? Просто хотелось бы получить тест памяти без негативного влияния захвата шины другими ядрами. Это дало бы более качественную прикидку эффективности контроллера (ты писал 30%, это с 8 ядрами, так?). Тайминги не твикал?
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Antinomy писал(а):
Cronos Вопросик такой - ядра не отключаются? Просто хотелось бы получить тест памяти без негативного влияния захвата шины другими ядрами. Это дало бы более качественную прикидку эффективности контроллера (ты писал 30%, это с 8 ядрами, так?). Тайминги не твикал?
Не отключаются да это и не к чему. Определенная и весьма значительная часть траффика тратится на поддержание когерентности кэшей. Если убрать логику отвечающую за это, получится совсем другой чипсет. Cмысла в этом нет никакого.
Я тестировал ПСП пакетом RMMMA (RightMark Multi-Threaded Memory Test).
Если запустить один поток на одном ядре, а потом добавлять потоки на ядра другого процессора, падение ПСП на первом потоке не превысит 10% (для 4 потоков на втором процессоре). При запуске потоков на одном процессоре, падение ПСП практически линейно. Суммарная ПСП на каждой FSB (т.е. каждом процессоре) ограничена порядка 37% от теоретической. Это еще благодаря тому что у меня 8 модулей памяти - с 4 модулями эффективность падает до 30%.
Тайминги здесь менять значительно сложнее -нужно запрограммировать микросхему AMB (буфер) на каждом модуле. Это нетривиальная задача. Я пробовал -все просто виснет. Здесь скорее всего ничего нельзя сделать.
Есть два варианта:
1. Модифицировать BIOS. Оптимально, но весьма нетривиально. Биос очень сложный, 8Mbit и сама процедура инициализации чипсета чрезвычайно сложная. В-общем, практически глухо. У меня на эту работу, с моим небольшим опытом, уйдет несколько месяцев -а через полгода эта машина уже будет неактуальна.
2. Прошить новые тайминги в SPD. Если не стоит защита на модулях, то можно попробовать сделать.
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Cronos писал(а):
Если запустить один поток на одном ядре, а потом добавлять потоки на ядра другого процессора, падение ПСП на первом потоке не превысит 10%
Логично, FSB то разные.
Cronos писал(а):
Суммарная ПСП на каждой FSB (т.е. каждом процессоре) ограничена порядка 37% от теоретической.
Понял, спасибо.
Cronos писал(а):
нужно запрограммировать микросхему AMB (буфер) на каждом модуле.
А что регистры чипсета уже не рулят? Вроде там так, судя по дате.
Cronos писал(а):
У меня на эту работу, с моим небольшим опытом, уйдет несколько месяцев -а через полгода эта машина уже будет неактуальна.
Можно попросить кого-нибудь, хорошо разбирающегося ромбай, к примеру...
Cronos писал(а):
Прошить новые тайминги в SPD.
Да, так проще гораздо. Но ты уверен, что регистрами из-под винды не меняется? Хорошо, что регистры у него PCI, а не PCI-EX, как на i9x5. Могу адреса кинуть, но уверен, ты сам их знаешь. У тебя-то система есть.
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Статус: Не в сети Регистрация: 14.05.2005 Откуда: Новосибирск.
Antinomy писал(а):
Вопросик такой - ядра не отключаются? Просто хотелось бы получить тест памяти без негативного влияния захвата шины другими ядрами.
Физически ядра отключать нельзя, но есть диспетчер задач. В котором для каждого запущенного приложения можно назначать ядра с которыми оно будет работать. По номерам. И ограничивать их количество до необходимого пользователю. И думаю для некоторых задач критичных к ПСП или с плохой оптимизацией, есть смысл попробовать отключить по одному ядру в каждой из 4-х пар, двух процессоров. Получится, как бы, работа с четырехьядерником, но с неразделяемыми 4 мегабайтными кэшами на каждое ядро. Думаю кстати, что в такой комбинации использования ядер, например 3dmark06 cpu test имеет шансы набрать больше очков. Так как по всему видно, что у него или неважная мультипоточная оптимизация или высокая загрузка ПСП. В такой ситуации 4 ядра с максимально обьемными 4 мегабайтовыми кэшами и достаточная для 4х ядер ПСП могут привести к более эффективной и результативной работе этого тэста. Хотя конечно это только предположение.
Cronos писал(а):
Суммарная ПСП на каждой FSB (т.е. каждом процессоре) ограничена порядка 37% от теоретической. Это еще благодаря тому что у меня 8 модулей памяти - с 4 модулями эффективность падает до 30%.
Однако при этом Sandra у вас дает результаты пропорционально увеличенные относительно разгона чипсета/памяти. Если например сравнивать с тестами только четырех модулей на thg.ru. Хотелось бы услышать об этом более подробно. По моей информации между работой с четырьмя и восемью модулями не должно быть разницы. Так как контроллер i5000x четырехканальный и ему, в теории, без разницы сколько инсталированно модулей. Главное чтобы количество было кратно четырем. Т.к. есть физическая привязка к количеству модулей. Изза этого если например поставить 2 модуля, будет ситуация в которой четырехканальный режим запустить не удастся, только двухканальный. Но между четырьмя и восемью разницы в эффективности использования и ПСП быть не должно. Так же, как например, в настольных двухканальных чипсетах, между двумя и четырьмя модулями. Так как и 2 и 4 кратно двум и допускает использование 2х канальным контроллером с максимальной эффективностью и ПСП. Или всетаки есть разница? В чем именно?
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Eternal писал(а):
Cronos писал(а):
Суммарная ПСП на каждой FSB (т.е. каждом процессоре) ограничена порядка 37% от теоретической. Это еще благодаря тому что у меня 8 модулей памяти - с 4 модулями эффективность падает до 30%.
Однако при этом Sandra у вас дает результаты пропорционально увеличенные относительно разгона чипсета/памяти. Если например сравнивать с тестами только четырех модулей на thg.ru. Хотелось бы услышать об этом более подробно. По моей информации между работой с четырьмя и восемью модулями не должно быть разницы. Так как контроллер i5000x четырехканальный и ему, в теории, без разницы сколько инсталированно модулей. Главное чтобы количество было кратно четырем. Т.к. есть физическая привязка к количеству модулей. Изза этого если например поставить 2 модуля, будет ситуация в которой четырехканальный режим запустить не удастся, только двухканальный. Но между четырьмя и восемью разницы в эффективности использования и ПСП быть не должно. Так же, как например, в настольных двухканальных чипсетах, между двумя и четырьмя модулями. Так как и 2 и 4 кратно двум и допускает использование 2х канальным контроллером с максимальной эффективностью и ПСП. Или всетаки есть разница? В чем именно?
Эффективная ПСП должна увеличиватся при увеличении количества модулей на каждом канале. Все обмены данными с памятью идут через буфер -AMB. Этот канал работает на очень большой частоте (4GHz) и имеют собственную низкую латентность, вся латентность "сидит" в AMB и в собственно чипах памяти. Если на канале "висят" два модуля, AMB на первом становится дополнительно транслятором данных со второго модуля. Латентность доступа при этом возрастает, но можно несколько повысить ПСП, одновременно считывая данные с обоих модулей. Хотя пропускная способность канала AMB- чипсет и AMB-AMB эквивалентна тем-же DDR2-667, но при наличии двух и более модулей ее можно полнее загрузить.
Еще один момент состоит в том что можно одновременно читать и писать данные , для записи и для чтения используются разные шины. Можно например читать из первого модуля и писать во второй, во всяком случае теоретически это возможно.
Статус: Не в сети Регистрация: 14.05.2005 Откуда: Новосибирск.
Cronos писал(а):
Еще один момент состоит в том что можно одновременно читать и писать данные , для записи и для чтения используются разные шины. Можно например читать из первого модуля и писать во второй, во всяком случае теоретически это возможно.
Теоретически возможно многое, интересней увидеть какие либо тэсты сравнивающие конкретно 4 и 8 модулей по ПСП. Посчитал если сложить 15% от разгона памяти и 23% (37 против 30) от восьми модулей то гдето столько, сколько у вас по сандре вышло, и должно быть. Но хотелось бы практические тэсты гдето увидеть.
Cronos писал(а):
Суммарная ПСП на каждой FSB (т.е. каждом процессоре) ограничена порядка 37% от теоретической.
Кстати, а такая ПСП не может быть изза каких либо архитектурных особенностей самих процессоров? Может они просто не в состоянии обеспечить более высокоскоростной доступ к контроллеру памяти? Например мешают какие то внутренние задержки или еще чтонибудь в этом духе.
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Eternal Исключено, архитектура камней полностью идентична Conroe. Да и чтобы проц влиял на память, мало случаев припомню, а вот контроллер запросто.
Cronos У тебя проблема с тем, как записать данные в AMB или что записать? Просто нашел упоминание в дате на то, как писать. И еще - подними тайминги RFC, RD с помощью WPCREDIT, должно помочь с потолком 390. Данные очень точные. По ходу тайминги менять нельзя (только AMB), а вот подтайминги можно. Слей себе WPCREDIT и кинь дампом 16 devicem f0,1 на PCI шине. Я буду думать. Еще было бы неплохо заставить danthebanjoman попробовать BSEL400, ибо его-то система на 400 с копейками заработала. Есть у меня подозрение на наличие strap400 в 5000.
И еще - для большего разгона Clover\Kent нужно поднять напряжение GTLref, часто в него упираются. Но схемы у меня нету.
Устроим brainstorming. russian team.
Сейчас пробую региться на 2cpu, трабл с нетом какой-то... Добавлено спустя 6 минут, 53 секунды Что скажешь, как тебе ватеры промодза? И что за помпу с ними юзаешь? Там думаю не актуально спрашивать.
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Antinomy писал(а):
Cronos У тебя проблема с тем, как записать данные в AMB или что записать? Просто нашел упоминание в дате на то, как писать. И еще - подними тайминги RFC, RD с помощью WPCREDIT, должно помочь с потолком 390. Данные очень точные. По ходу тайминги менять нельзя (только AMB), а вот подтайминги можно. Слей себе WPCREDIT и кинь дампом 16 devicem f0,1 на PCI шине. Я буду думать. Еще было бы неплохо заставить danthebanjoman попробовать BSEL400, ибо его-то система на 400 с копейками заработала. Есть у меня подозрение на наличие strap400 в 5000. И еще - для большего разгона Clover\Kent нужно поднять напряжение GTLref, часто в него упираются. Но схемы у меня нету.
Тайминги MCH и AMB должны быть согласованы.
Проблемы как записывать нет. Есть частичная проблема что записывать. ( Я под Linux кстати работаю. )
Есть несколько проблем
1. Отсутствие даташита на мою AMB. Есть на Intel, но согласие не 100%. Ряд интересных регистров, похоже, не совпадают.
2. Отсутствие подробной документации даже на чипсет.
То что есть -лишь часть. Не описано детально как осуществляется
clocking, в особенности как задается частота SMBus, можно-ли и как ее
запрограммировать, что очень важно.
3. Необходимость программировать все AMB сразу.
4. Самое главное, программирование AMB при старте осуществляется в режиме, когда они еще не полностью инициализированы. Поэтому часть таймингов (и наиболее важные) вообще нельзя програмно изменять.
Тайминги чипсета я менял, но никакого особого эффекта не заметил. Правда я не очень активно этим занимался -еще можно повозится. Попробую еще с rfc, rd. Но я на это особо не надеюсь.
К тому-же, есть другая проблема -с SMBus, я ее обнаружил и описал на 2cpu.
Конечно, от тех товарищей толку не будет -они все чайники, кроме может XeonTux -но он самоустранился. Со мной связался один человек, который пообещал достать даташит на мою AMB -но что-то пропал. Нужен инсайдер в какой-то крупной IT компании, этого документа нет в открытом доступе.
У banjoman один процессор и тот Woodcrest, так что особо на него ориентироватся не стоит. Судя по всему на Woodcrest-ах потолок чуть выше. Чипсет, вполне возможно, можно запустить на 400MHz - но еще раз повторяю, проблема в BIOS. BIOS не знает как запрограммировать
чипсет и AMB на частоту 400MHz. Поэтому попытки сделать 1600FSB mod не увенчались успехом. Сама комбинация для 400MHz известна -это не проблема.
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Изменение таймингов чипсета не дает вообще ничего. Я увеличивал буквально все тайминги сразу -эффекта ноль.
Однако заметил интересную вещь.
На частоте 2756/393FSB погонял linpack, этот тест очень сильно нагружает процессоры и использует всю память.
Оказалось, что
Если не трогать USB -мышь, то машина не виснет. Тесты проходятся, но на этой частоте напряжения 1.2V уже не
хватает, что видно по результатам. Самое главное, машина не виснет, а напряжение можно и поднять при желании.
Если трогать мышь, при полной нагрузке зависает.
Конечно, ради такого мизерного прироста я не буду делать вольтмод. Если удастся запинать на 3GHz/430FSB, можно попробовать.
Теперь нужно научится управлять множителем, задать 6 чтобы проверить предел
разгона по FSB.
Плата не имеет возможности задавать множитель, Intel как обычно подкладывает свинью скрывая
загадочный CLOCK_FLEX_MAX MSR. Кстати ни одна утилита под виндой не умеет менять множитель,
а драйвер cpufreq-centrino под Linux может. Но он при этом еще и напряжение понижает, что нехорошо.
Надо с ним разобратся и попробовать модифицировать.
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Cronos писал(а):
Кстати ни одна утилита под виндой не умеет менять множитель,
Crystal CPUID? Rightmark?
Cronos писал(а):
На частоте 2756/393FSB погонял linpack, этот тест очень сильно нагружает процессоры и использует всю память. Оказалось, что Если не трогать USB -мышь, то машина не виснет. Тесты проходятся, но на этой частоте напряжения 1.2V уже не хватает, что видно по результатам. Самое главное, машина не виснет, а напряжение можно и поднять при желании.
Тайминги чипсета на влияют. Напряжение Vcc можно попробовать, но сначала надо убедится что в этом есть смысл - ради пары процентов я не буду напрягатся.
Сегодня проверю как влияет хорошее охлаждение памяти.
Выставлю трубу пылесоса за окно, а выхлоп направлю на память
Если эффект будет, буду думать над водяным охлаждением памяти.
Кстати, реальные идеи по этому поводу приветствуются.
Пока продумываю следующее -проложить тонкостенную гибкую силиконовую трубку между модулями. Трубка сомнется и обеспечит хороший контакт с радиатором модуля памяти. Тонкостенная -чтобы хорошо сминалась, имела невысокое термосопротивление и максимально большой внутренний диаметр.
Проблемы: изгиб, гидросопротивление и availability самой трубки.
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Есть возможность прописывать в SPD модулей памяти все что захочешь,
програмно.
Я сделал из FB-DIMM-667 FB-DIMM-533 модуль, но с таймингами 4-4-4.
Что это означает на практике -BIOS выставляет делитель 5:4, так что можно дальше гнать
FSB.
Нужны идеи как сделать тайминги 5-5-5, и вообще любые идеи как дальше разгонять
это дело.
P.S.
Полностью меняю в этом месяце систему СВО на топовые компоненты из Штатов.
Если/когда удастся прописать нужные тайминги в SPD, сделаю вольтмод.
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Cronos
Cronos писал(а):
Я сделал из FB-DIMM-667 FB-DIMM-533 модуль, но с таймингами 4-4-4.
Молодец Стоп. Ты перешил SPD? А чего тайминги не сменил сразу? Тебе сказать, что на что менять? Но вещь сделал очень важную - как раз хотел советовать сменить делитель via SPD. Сейчас буду лить дату на твои SPD. ИМХО тайминги - как два пальца.
Cronos писал(а):
Полностью меняю в этом месяце систему СВО на топовые компоненты из Штатов.
Расход маленький? Ладно, я бы чуток подваял бивизовские лучше.
Cronos писал(а):
Если/когда удастся прописать нужные тайминги в SPD, сделаю вольтмод. Цель -3.4-3.5 GHz
:beer: Еще - жду дампа обоих SPD
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Расход маленький? Ладно, я бы чуток подваял бивизовские лучше. Когда/ если придет посылка из штатов, я соберу систему и сделаю фото.
Увидешь -поймешь.
It looks ..so ..shiny!
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Cronos В общем фигня твои тайминги, как и говорил. Я так понял, ты менял байт 11.
Чтобы сменить CL, RP, RCD нужно 19, 21 байты - 75 (5 при 533МГц). 4B (в HEX)
13 - 00100101 - 25HEX (5,6) - отвечает за доступные CL
14 - 75, 4B - чтобы при 533 он выбирал именно 5. Будет у тебя 5-5-5. Дерзай. Но я бы другие потом поковырял еще. У тебя есть дата на SPD FB-DIMM? Могу линкануть.
Cronos писал(а):
Следи за темой на 2cpu.com. Там все есть.
В течение недели будет анлим, будет всё
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения