AMT - Asus MemTweakit Asus MemTweakIt 2.02.44 При настройке памяти в BIOS ставим ОБЯЗАТЕЛЬНО MRC Fast boot=disable (включаем при этом режим тонкой тренировки, если же выставим enable, то включаем режим грубой тренировки). Оптимально при разгоне памяти использовать в биосе множитель памяти 133, а не авто или 100, что даст возможность создать комфортные условия для контроллера памяти в процессоре и снизить напряжения ио и са ! Недаром в Jedec шаг между спидбинами именно 133, а не 100! Для плат с Alder Lake напряжения VDD и VDDQ на память могут отличаться не больше, чем на 300 мВ. Для плат на основе логики z690 и b660: VDD>VDDQ VDDQ>=VDD-300mV(0.3V) Лучше на VDDQ не превышать 1.25V. Вполне возможно 1.30V. MSI дает зазор до 1.40V. Для таймингов должно выполняться требование: _dr=_dd
Разгон памяти у современной DDR4 (16 банков,RRDS=4,FAW=16,BL=8) эффективен только при tRC<=64,если каждый новый блок чтения происходит с разных банков памяти. Для 4-х слотовых плат при разгоне желательно в биосе отключить неиспользуемые слоты. Предположительно для максимальной производительности памяти значение tRFC в тактах для 8-Гбитных чипов должно быть кратно 8,а для 16-Гбитных чипов - 16. Если это правило не соблюдать, то будут вставлены лишние такты при каждом цикле обновления памяти. Для желающих максимально снизить tRFC. Делим tRFC на сумму tRCD,tRTP и tRP. Если результат ближе к 4, то снижать tRFC можно по 4 такта. Если результат ближе к 2, то снижать tRFC можно по 2 такта. Это связано с тем, что обновление происходит субмассивами, которые обязательно кратны 2.
Новая информация по tRAS
Чтение с модуля памяти у DDR4 происходит блоками. Минимальный блок сейчас составляет 64 байта, что связано с размером строки кэша у процессора. Этот блок может считываться как с одного банка, так и с разных. На март 2026 года я склоняюсь к тому, что чтение 64 байт идет с одного банка всех 8 чипов модуля. То есть за 4 такта происходит чтение 4 такта х 2(два фронта сигнала) х 8битх8чипов=512 бит или 64 байта. А оптимальный tRAS зависит от политики контроллера по закрытию строк и от его связи с tRC (определяется внутренними невидимыми нам настройками биоса). Можно предположить, что оптимальное значение tRAS=2*tRCD+несколько тактов, это определяется по количеству промахов и попаданий в открытые страницы памяти, тут нужен оптимальный КПД. tRAS=tRCD+tRTP (при считывании 8 байт с одного банка) tRAS=tRCD+tRTP+4 (при считывании 16 байт с одного банка) tRAS=tRCD+tRTP+8 (считывание 24 байт - маловероятно) tRAS=tRCD+tRTP+12 (при считывании 32 байт с одного банка). Самый верный выбор для DDR4! tRAS=tRCD+tRTP+16 (считывание 40 байт - маловероятно) tRAS=tRCD+tRTP+20 (считывание 48 байт - маловероятно) tRAS=tRCD+tRTP+24 (считывание 56 байт - маловероятно) tRAS=tRCD+tRTP+28 (при считывании 64 байт с одного банка) Для DDR4 оптимальным выбором является 4-й или последний вариант. Но если выставить tRAS меньше, то ничего трагичного не произойдет, так как джедек придумала предохранитель (tRTP), поэтому можно не заморачиваться и выставлять минимальный tRAS (=tRCD+tRTP), если позволяют чипы. Искать минимум tRAS можно , начиная с RCD+RTP и идти вверх или с 2*tRCD или tRCD+tCL+4 и идти вниз. Еще возможен такой подход к оптимальному tRAS. tRAS=tRCD+k*CCDS/CCDL+tRTP(опционально), где k - количество банков, к которым идет обращение перед возвратом в открытую строку, наш первый банк тоже учитываем. У ddr4 4 группы по 4 банка, то есть 16 банков. tRTP можно не добавлять при расчете, так как при попадании в открытую строку она не закроется пока не пройдет время tRTP от последнего чтения, а при непопадании мы выиграем время tRTP, быстрее закроется строка Если 1 другой банк, то tRAS=tRCD+8(CCDS учитываем) А с гарантией tRCD+12/14 (CCDL учитываем) Если 2 других банка tRAS=tRCD+12(для CCDS) tRAS=tRCD+18/21(для CCDL) Для 3-х других банков tRAS=tRCD+16(CCDS) tRAS=tRCD+24/28(для CCDL) Полная формула tRASopt=tRCD+k*tCCDS+n*tCCDL+tRTP(опционально) k+n = количество посещенных банков, включая наш первый, до возврата в строку По джедек k+n= обычно 2-3
Напряжения на процессоре при разгоне памяти
SA- безопасный уровень (по данным MSI) 1.35, растет от частоты памяти и зависит от подключенной периферии к PCIE, чем больше скорость видеокарты и NVME-диска, тем выше нужно напряжение. IO (для Z590 =IO2, а просто IO можно оставлять в авто, для Z690=IVR DDQ)- обычно хорошо работает если на 50 мВ ниже SA, но чем ниже, тем лучше, стараться максимально снижать. Тоже растет с ростом частоты памяти. Для ориентира при настройке всегда рекомендую глянуть, что за напряжения SA и IO выставляет материнка в авто.
Для начала тезисно несколько правил «успешного разгона и установки памяти»:
1. Ни в коем случае не используем XMP профили – этот режим протестирован на совместимость, но не даёт оптимальную производительность. Поскольку заводская настройка не блещет идеальным подбором, можно получить до 20-25% производительности дополнительно, вручную настраивая тайминги и напряжения. Также XMP режим чреват завышениями вольтажа самой память и контроллера памяти\SOC. 2. Правильная установка модулей – А2 (для одного модуля), A2B2 (для двух модулей). 3. Самый лучший разгон по частоте достигается при использовании одного модуля, при наличии двух планок максимальная частота лишь немного хуже. У четырёх – либо хуже (на устаревающем LGA2011-3) либо такой же или лучше (LGA2066), которые могут стабильно работать с 4мя модулями на 4000CL16. 4. Если используется два модуля, то худший модуль (требующий бОльшего напряжения для стабильного разгона) должен стоять ближе к процессору в слоте A2. 5. Перед настройкой частоты и таймингов памяти отключить подсветку модулей памяти - т.к. это даёт лишний нагрев.
УНИВЕРСАЛЬНЫЙ ГАЙД ПО НАСТРОЙКЕ от Agiliter
Универсальный гайд. 0. Устраните любые потенциальные проблемы с другим железом. Снимите разгон с видеокарты, снизьте частоту цп на 300 с сохранением напряжения. Не забудьте вернуть RTL в авто если сейчас не авто. 1. Крутим очень короткий мемтест, то есть если минуту живёт сразу снижать тайминг дальше. Ищите не стабильность, а явно сбойное значение тайминга, запишите его - пригодится. Гораздо проще найти явно нерабочее значение и от него плясать чем пытаться ловить нестабильность часами. Это также помогает диагностировать сбойные тайминги на ранее "стабильной памяти". Не пытайтесь найти предельные значение сразу. Сначала скрутите до +2 от минимально стабильного. Многие тайминги идут параллельно поэтому бессмысленно пытаться скрутить до упора с первого прохода. CR выставить на 2 если стоит 1. В самом конце можно попробовать скинуть до 1. 3 Ставить только на очень большую частоту или если по другому ну совсем никак.
Начните с RCD, CL. Не обязательно должны быть одинаковыми, обычно CL идёт меньше чем RCD. RAS сразу пробуйте как RCD+CL+4, до этого значения от него существенная разница, дальше меньше. CWL<=CL. Допустимые значения 9,10,11,12,14,16,18,20. RP можете выставить по RCD, если пойдёт меньше - тоже неплохо, не уверен правда насчёт смысла. RTP без формул. Если не идёт вниз можно попробовать поднять чуть чуть RP. В DDR4 явно связан с WR соотношением 2 к 1 (например WR20\RTP10), физически хранится одно значения и в зависимости от операции интерпретируется. Скрутите FAW до 16(так и оставьте если работает). С таким FAW скручивайте RRD(оба, L обычно больше чем S), возможно поедут на 4 оба. Если до 4 не удалось спустить поднимите FAW до уровня RRDL*4 и попробуйте ещё, хотя это скорее всего уже почти предел. Обычно L>=S. L - SG(Same Group). S - DG(Different Group) Напр. RRD_L>=RRD_S. CKE=5 СCDL>=4 RDRD_DD и прочие подобные можно проигнорировать если у вас нет двух планок на один канал (4 планки). DD-Different Dimm. Тоже самое с DR-Different Rank если у вас одноранговая память. RDWR_SG(DG) и подобные сочетания скручивайте до минимальных рабочих, потом накиньте сверху +2. Как уже отметил обычно SG>=DG. WTR не трогайте он сам спустится когда будете скидывать WRRD_SG(DG) и прочие подобные. Если сам меньше не стал тогда руками скидывать. WR снижать через WRPRE если есть. Если нет или не снижает WR, То скрутите его скажем до 12 или +4 от рабочего, потом дожмёте если не лень будет. RFC явных формул нет, крутить после всего списка сверху. Не пытайтесь найти его минимальное значение если не хотите чтобы память начинала сыпать ошибками от любого чиха. найдите пограничное со стабильностью значение и накиньте сверху 20 или сразу 40. Может реагировать на RAS+RP, RRD, FAW, причём в обе стороны (то есть может "сломаться" если задрать названные), а может и не реагировать... REFi больше лучше. Связан с RFC. REFI сколько память "работает" - RFC сколько "отдыхает". Оба тайминга лучше не пытаться найти предельное значение.Заметно реагируют на температуру. Многие тайминги отзываются и на температуру и на напряжение. Поскольку напряжение может как позволить снизить тайминг, так и увеличить температуру, то середину можно искать очень долго, поэтому лучше бы вовремя остановится. Тестируйте тщательно с перезагрузками, сном, холодным стартом. RTL и IOL вам кто-то другой пусть советует как настраивать, от них у меня голова болеть начинает...
tRASmin=tCL+tRCD+2 WTRS/L устанавливаются в биосе через WRRDdg/sg согласно формуле: WRRD_sg=6+CWL+WTR_L WRRD_dg=6+CWL+WTR_S WR - через WRPRE (для матплат ASUS): WRPRE=4+CWL+WR RTP - через RDPRE (для матплат ASUS) RDPRE=RTP
VDDDQ=1.5 V max по Jedec VrefCA=0.6xVDDDQ=0.9 V (max по Jedec), в даташите контроллера интел тоже разрешено максимальное vrefca=0.6xVdddq. То есть при обычной настройке биоса, когда VrefCA=0.5xVDDDQ, VDRAM<=1.8 V, чтобы уложиться в нормы по Jedec. А если при этом в биосе настроить vrefca=0.49xvdddq (разрешено по Jedec), то безопасное Vdram может быть еще выше=1.837 V. Вывод: для контроллера процессора напряжение на память <=1.8 V неопасно
CPU Name: Intel® Core™ i7-7740K CPU @ 4.30GHz Motherboard Model: MSI X299 GAMING PRO CARBON AC (MS-7A95) Total Size: 8192 MB Type: Single Channel (64 bit) DDR4-SDRAM Frequency: 2750 MHz - Ratio 1:31 Timings: 21-31-31-63-2 (tCAS-tRC-tRP-tRAS-tCR) Slot #1 Module: G.Skill 8192 MB (DDR4-2137) - XMP 2.0 - P/N: F4-3200C14-8GVR
[img]Ссылка на скрин[/img] Для сбора статистики по установленным чипам памяти просьба прикладывать скрины программы Taiphoon Burner и указывать напряжения на DIMM, IO и SA![/color]
Below are the typical tRFC in ns for the common ICs: IC tRFC (ns) Hynix 8Gb AFR 260 - 280 Hynix 8Gb CJR 260 - 280 Hynix 8Gb DJR 260 - 280 Micron 8Gb Rev. E 280 - 310 Micron 16Gb Rev. B 290 - 310 Samsung 8Gb B-Die 120 - 180 Samsung 8Gb C-Die 300 - 340
Таблица tRFC от Reous v26
#77
Расшифровка чипов, находящихся в модуле памяти у разных производителей
#77
Ревизии печатных плат. A0,A1 или A2 планки, как узнать
#77 #77 #77 #77
Статистика tRCD планок в зависимости от типов чипов
#77 #77 #77 Чем выше вы в вертикальном столбце, тем удачнее планки. Чем интенсивнее цвет, тем выше статистический процент (данные старые,теперь удачнее чипы выходят) На 1 таблице все,что выше красной линии - суперотборники.
Советы по верной тренировке
1.Поднять напряжения на VCCSA и VCCIO. 2.Включить в биосе Round Trip Latency. 3.Для гигабайтов - memory enchancement=normal.
Руководство по разгону памяти для начинающих блондинок
Advanced member
Статус: Не в сети Регистрация: 13.05.2020 Откуда: Мытищи
HskR писал(а):
микросхемы все одинаковые
Откуда такие сведения? Нет даже 2-х полностью идентичных друг другу микросхем.
HskR писал(а):
Я не знаю как делается калибровка
Странно, что ты чего-то не знаешь -)
Думаю, как-то так
Вложение:
!DDR4. Стадии калибровки.png [ 240.18 КБ | Просмотров: 371 ]
Bigsun писал(а):
Сделать автономную калибровку в каждом чипе может быть проще, чем синхронизировать процедуру в многочиповой схеме.... подстраивать цикл калибровки под число микросхем (усложнение)
Тут я могу согласиться, но как-то работе CKD в CUDIMM или RCD в RDIMM, - это не мешает... Чипу плевать на сопротивление дорожки, если оно стабильно. Больших частот в ZQ-калибровке нет. Паразитная емкость дорожки ZQ мала, а внести корректировки на ее индуктивность вообще не проблема. Другой разговор про параллельность процесса. Но и это никому не мешает, ведь когда подается команда REF, весь чип (все банки) уходит в глубокий shut down на регенерацию (если не работает FGR, которая доступна и в последних DDR4-чипах) и ничего... Но это уже риторика -)
Всем привет. Давно не юзал ATC, стояла 16 версия, выбивает ошибку (driver cannot be loaded reinstall the program may fix the issue). Отключил изоляцию ядра - бесполезно. По поиску прошелся - ничего особенного, те же советы по отключению. Попробовал разные версии, ничего не изменилось. Единственное, это не смог 13v поставить, ибо ссылка битая, по инету она тоже не гуглится.
Advanced member
Статус: В сети Регистрация: 29.03.2017
Bigsun писал(а):
Agiliter писал(а): Два ранга при прочих равных дают меньше RFC, а не больше. Но только при прочих равных, включая объём.
Возникает лишь минимизация простоя (равного времени пассивности буферов ввода-вывода и шины памяти) чипов при обновлении, из-за чередования рангов. И все. Не более того. Сам по себе tRFC физически не меняется, и зависит лишь от плотности чипов, их ревизии (поколения) и качества. Общее кол-во операций REF остается тем же.
Если объём модуля памяти 16ГиБ двухранговый и 16 ГиБ одноранговый, то у двурангового RFC будет меньше. Но только если всё остальное одинаковое.
Advanced member
Статус: Не в сети Регистрация: 13.05.2020 Откуда: Мытищи
Agiliter писал(а):
Если объём модуля памяти 16ГиБ двухранговый и 16 ГиБ одноранговый, то у двурангового RFC будет меньше.
У тебя есть этому подтверждение? Если конфигурация чипов одинаковая [допустим, 16 чипов по 8 Гбит, 16 × 8 Гбит (x8) = 16 Гбайтный модуль Dual Rank (2R), по 8 чипов на ранг], то физически tRFC никак не изменится. Но может снизиться общая задержка, и только лишь в тех задачах, где идет активный обмен большими объёмами данных. Потому что само по себе чередование тоже вносит небольшую задержку (накладные расходы).
tRFC - "физический" тайминг, это физическая характеристика чипа (а не модуля). Внутри, чипу плевать, как устроен модуль. Поэтому и есть таблицы статистики tRFC по чипам. Dual Rank - принцип организации подключения чипов, а не какие-то уникальные чипы. Один модуль UDIMM без ECC имеет ширину шины 64 бит (и в это все упирается при организации чипов на модуле), и в зависимости от конфигурации чипа (плотность и кол-ва линий данных x4 x8 x16) и разводки на PCB модуля, можно создать модули Single Rank или Dual Rank. Один ранг (ранк) - это тоже 64 бит, как и у всего Dual Rank модуля. Если ранга два - происходит чередование рангов. Но шина одна и та же. На шину данные будут выходит все равно по очереди. Некоторые команды могут одновременно (параллельно) исполняться в рамках и ранга, и чипа (но только между банками разных групп одного чипа). Преимущество Dual Rank в снижении общей задержки, путем маскировки некоторых задержек (Latency Hiding). КП не ждет, пока один ранг отработает цикл команд, а переключается на другой, который уже готов отдать данные (на шину данных).
Bigsun он про то, что планка на 16 гиг двусторонняя будет с меньшим трфц чем односторонняя (которая с чипами вдвое большей плотности, чтобы набрать тот же объем).
Тут интересно, может ли быть меньший трфц у чипов вдвое большей плотности, у другого производителя
Добавлено спустя 21 минуту 18 секунд:
Bigsun писал(а):
У тебя есть этому подтверждение?
Цикл рефреша же ведь быстрее пробежит у чипов меньшей плотности. Ну или меньшей плотности - жирнее техпроцесс, быстрее вкачается энергия. Я так и не понял, блин, физического смысла трфц и рефи.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения