покидаться помидорами в автора хочется, но в лом, пущай лучше учится JohnGalt, Andy**Pro и у вас совсем нет никаких мыслей по поводу малого прироста ПСП на современных системах от двухканалки?! тут же всё ясно как божий день, даже у автора на скринах с эвереста можно увидеть
Добавлено спустя 20 минут 5 секунд: Jinx твои скрины лишь подтверждают показания эвереста а ты не пробовал тоже самое, но в несвязном режиме? ИМХО, скорость по отдельным ядрам может быть больше а может и нет т.к. узкое место всё равно никуда не исчезает ведь скорость шины памяти в твоей системе 27,4 ГБ/с, что более чем в 2 раза превышает реальную скорость подсистемы памяти
Member
Статус: Не в сети Регистрация: 05.09.2003 Откуда: дровишки ???
Koschey Bessmertniy, пробовал в несвязном, картина та же самая. Одно ядро "проглотить" ПСП не может. Два - уже близки, три и более - выходят на максимум.
Цитата:
твои скрины лишь подтверждают показания эвереста
, неа, как раз наоборот. Эверест показывает скорость чтения памяти 10,3 гиг/с. А райтмарк (не смотря на то что старенький и только SSE2) с 6 потоками запросов считает на 2 Гб/с больше. Кроме того, если через диспетчер задач Эверест ограничить доступом только к одному ядру - данные измерений изменятся в пределах погрешности. Кеши L1 и L2 он тестит неплохо (и особо немудрено, потому как L1 и L2 - они к конкретному ядру привязаны), райтмарк это подтверждает, но вот реальную картинку для оперативки Эверест, ИМХО, показать не умеет.
_________________ Шуруп, забитый молотком, держится лучше чем гвоздь, закрученный отверткой.
Jinx что 10, что 12 - это только разброс методики тестирования и сути дела не меняет. скорость шины памяти, повторюсь, у тебя 27,4, а не 12. скорость чтения памяти на феномах стремится к скорости записи в кэш L3, а скорость записи - к чтению из L3. разница в показаниях при тестировании связана с изменением задержек, идущих на операции, обслуживающие чтение/запись. про копирование говорить не берусь, точной последовательности операций не знаю.
Member
Статус: Не в сети Регистрация: 05.09.2003 Откуда: дровишки ???
Koschey Bessmertniy, разница между 10 и 12 - это 20 процентов. Если инструмент дает такую погрешность, им лучше не пользоваться, ИМХО, разве что для личных целей. Кроме того, я уже говорил, что Эверест по сути тест одноканальный.
Цитата:
скорость шины памяти, повторюсь, у тебя 27,4, а не 12
Это же хорошо, что подсистема памяти способна отдавать больше, чем может "скушать" проц. Вспомните 939 сокет, где тесты двухканала давали цифры, близкие к теоретическому максимуму 6,4 Гб/с - это значит прежде всего, что ПСП для данной платформы не хватало, а не только то, что ИКП по тестам работал с максимальной эффективностью.
Цитата:
к скорости записи в кэш L3
Не совсем так. L3 нужен прежде всего для ускорения межъядерного обмена данными и не является необходимым звеном в цепи проц-память - живут же себе денебы и пропусы без него. А вот от частоты северника - зависит.
Есть подозрение, что тот же эверест измеряет только ту ПСП, которую может "скушать" сам проц. А вот то, что помимо этого сможет скушать видяшка и прочая периферия, он уже не меряет. Поэтому не совсем честно говорить, что, дескать КП негодяй и плохо работает. Скорее всего мы просто не можем измерить всю работу, которую он делает, потому как я такого инструмента не встречал.
На скриншоте диаграмка (взята отсюда) #77 От ядер до контроллера памяти стоит crossbar (XBAR) и System Request Interface. Вполне вероятно, что вы видим (и измеряем) ограничение как раз именно в System Request Interface, а не в самом ИКП.
_________________ Шуруп, забитый молотком, держится лучше чем гвоздь, закрученный отверткой.
JinxЯ неочень хорошо понял, но вы сказали, что обмен данными между проц-память-(мать) зависит от частоты северного моста, а от каких еще данных зависит? И подскажите, где здесь частота северника: http://www.easycom.com.ua/data/mboard/1 ... 3/?lang=ru - там в середине данные Биоса платы. Или на словах скажите.
_________________ Inst с фотографиями: https://www.instagram.com/go.d_bq/ Мои статьи: https://overclockers.ru/tag/show/4736/go_d_bq
Member
Статус: Не в сети Регистрация: 05.09.2003 Откуда: дровишки ???
_NooB_, частоту северника (а также его режим работы, частоту памяти и тайминги) можно посмотреть в закладке Memory в программе CPU-Z.
Цитата:
Игры и 3DMark Vangate: Как всегда начну лучше с Вантажа. Скриншоты я не стал делать. 1)Одноканальный режим: Частота процессора 3250Мгц, NB=2500Мгц, Память=1667Мгц ----~11150баллов 2) Двухканальный режим: Частота процессора 3250Мгц, NB=2500Мгц, Память=1667Мгц ----~11130баллов
NB=2500Мгц Считается как частота шины(у вас в статье 250), умноженная на множитель северника (по умолчанию 10, можно снижать). В биосе это, видимо, опция в закладке Advanced -> CPU/NB Frequency
_________________ Шуруп, забитый молотком, держится лучше чем гвоздь, закрученный отверткой.
Jinx весьма интересная картинка задумано хорошо, но узкое место всё равно есть, может интерфейс SRI? или probe filter, встроенный в L3 и работающий с памятью, тормозит весь процесс? склоняюсь к версии об интерфейсе. можно отметить транзит данных из памяти через xbar в шину HT минуя основные блоки процессора это должно позитивно сказываться на производительности IGP, но там узким местом является уже сам HT.
Добавлено спустя 3 минуты 17 секунд: точно могу сказать, что узкое место конструктивно имеет отношение к северному мосту, т.к. при повышении частоты именно северного моста (это и КП и L3), а не ядер, происходит улучшение ПСП.
Member
Статус: Не в сети Регистрация: 05.09.2003 Откуда: дровишки ???
Koschey Bessmertniy, не думаю, что это L3 влияет. Обычные "обескешенные" 2,3 и 4 ядерники в тестах показывают такие же цифры. Тут вот еще какой момент меня удивляет #77
Плохо, что сам пакет RMMA 3.8 под 7-кой не пашет. Буду ставить 2003, разбираться.
_________________ Шуруп, забитый молотком, держится лучше чем гвоздь, закрученный отверткой.
Jinx вот это и хотелось увидеть, когда говорил про тест в несвязанном режиме объясняется не так уж и сложно: контроллеры памяти работают абсолютно независимо, как и процессорные ядра. получается, что каждый контроллер обслуживает по 3 процессорных ядра. таким образом узкое место частично обходится но только частично несвязный режим КП - умный ход инженеров АМД, ввиду известности проблемы и невозможности её исправить в данной архитектуре, ИМХО. ИМХО, SRI работает на частоте северного моста и, следовательно, повышение его частоты весьма актуально для скорости работы процессора.
Koschey BessmertniyВся проблема только в том, что процессоры с заблокированным множителем не могут изменять множители, в частности на НТ - поэтому приходиться прибегать к разгону через шину процессора, что крайне неохото в данном случае)
_________________ Inst с фотографиями: https://www.instagram.com/go.d_bq/ Мои статьи: https://overclockers.ru/tag/show/4736/go_d_bq
Member
Статус: Не в сети Регистрация: 05.09.2003 Откуда: дровишки ???
_NooB_
Цитата:
не могут изменять множители, в частности на НТ
Неправда ваша. На снижение - могут. Иначе бы у меня ИКП и НТ пахали бы на 3210 МГц. Кроме того, на северник (ИКП) отдельно регулируется вольтаж. До 1,35 В на воздухе можно подымать без проблем. Koschey Bessmertniy
Цитата:
SRI работает на частоте северного моста
Сомневаюсь, скорее на частоте ядра. Уж больно узкое место со всех точек зрения. По умолчанию через него данные между ядрами бегают. Если взглянуть на тот же К8, там ИКП пахал в синхроне с ядрами, и SRI, логично, тоже. А вот в К10 частоту ИКП от ядра отвязали. В частности, как я думаю, из-за введения довольно энергожоркого L3 и из-за увеличения количества ядер на кристалле. Поэтому есть мнение, что при выпуске К10 АМД не боялась сделать ИКП узким местом, снижая его частоту. Я в бытность тоже заморачивался вопросом эффективности работы ИКП, правда тогда я еще незнал, что Эверест однопоточен. Вот старые скриншоты моей бывшей системы: #77#77
_________________ Шуруп, забитый молотком, держится лучше чем гвоздь, закрученный отверткой.
Member
Статус: Не в сети Регистрация: 05.09.2003 Откуда: дровишки ???
_NooB_, в таком случае, что мешает поступить так же, как я - снизить множители и поднять шину? Кулер из профиля неплохой, вполне возможно поиметь хотя бы 3,6-3,7 по ядру...
_________________ Шуруп, забитый молотком, держится лучше чем гвоздь, закрученный отверткой.
Member
Статус: Не в сети Регистрация: 19.03.2004 Откуда: Литва
Т.е. при покупки новой бюджетной машины (обычно только 2 слота под рам) есть смысл взять планку памяти побольше, а потом при надобности, докупить уже вторую?
Dirt Да, жалею, что взял по схеме РАМ 2х2 - надо было брать сначала 4 и потом еще в будущем 4 JinxЯ брал 3725Мгц, но НБ оставил около 2К, частоту памяти около 1600мгц и таймиги фиксировал 10-10-10-33-1Т, а теперь хочу НБ до 2800 выжать, память до 1750МГй берет у меня и тайминги пониже Надо посмотреть на что способна система, гланое не перестараться
_________________ Inst с фотографиями: https://www.instagram.com/go.d_bq/ Мои статьи: https://overclockers.ru/tag/show/4736/go_d_bq
Jinx конечно же на частоте ядра оно бы и получше, но... частота ядер первых феномов была не сильно выше частоты северника: 2,2-2,3ГГц против 1,8ГГц (18-22% от частоты ядра), а теперь 2,8-3,4ГГц против 2ГГц (28-41% от частоты ядра). за то, что частота SRI это частота северника, говорит то, что это узкое место ПСП и оно не изменяется с изменением частоты ядер, а так же то, что общение ядер происходит через кэш L3 (так помнится говорили ещё до атлонов 2), а следовательно, этот интерфейс, как часть системы общения ядер, должен быть привязан к севернику. но это всё моё ИМХО.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения