Часовой пояс: UTC + 3 часа




Куратор(ы):   eLfiK   



Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 4368 • Страница 218 из 219<  1 ... 215  216  217  218  219  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 
Прилепленное (важное) сообщение

Member
Статус: Не в сети
Регистрация: 12.10.2016
1. Ликбез по прерываниям.
Все прерывания делятся по следующим приоритетам:
1 место - работает на уровне кольцо -2
прерывания SMI (system management interrupt — прерывание системного управления), которое возникает:
-по сигналу от чипсета или периферии на материнской плате
-программный SMI, посланный системным ПО через порт ввода-вывода
-запись по адресу ввода-вывода, для которого микропрограммно установлена необходимость активации SMM.
2 место - гипервизор, который работает в кольце -1
3 место - ядро операционной системы - работает в кольце 0
4 место - пользовательский уровень - работает в кольце 3

2. Ссылки.

3. Борьба с прерываниями.


Позднее дополню каждый раздел.
Все проблемы у нас связаны с тем, что windows относится к операционным системам с вытесняющей многозадачностью.
Вытесняющая многозадачность требует обработки системного прерывания от аппаратного таймера. По истечении кванта времени, отведённого процессу, происходит прерывание и вызывается планировщик процессов. Частота вызова планировщика критична: слишком частый его вызов будет расходовать процессорное время впустую.
Единственное, что мы можем изменить - это увеличить время кванта и поменять соотношение квантов времени на активную задачу и задачи в фоне, за это отвечает параметр в реестре
Win32PrioritySeparation
По умолчанию
0х26 кванты 18:6 = Оптимальный вариант.
https://github.com/keoy7am/Win32PrioritySeparationTool
При этом само время кванта зависит от системного таймера.
При системном таймера 15.625 мс оно будет больше, чем при 1.0 мс.
Высчитывается время системного таймера * тики.
1 тик= 3 кванта
Для системного таймера 0.5 мс фону тогда буде даваться 0.5мс*6/3 = 1мс из каждых 4 мс.
При 1 мс - 2мс из каждых 8мс.
При 2 мс - 4мс из каждых 16мс.
Для борьбы с фризами оптимально выставить системный таймер 0.5мс.

SMI-прерывания зависят от BIOS/UEFI и оборудования.
Отключаем все лишнее, отключаем энергосохранение, скорость вентиляторов фиксируем, это все, что мы можем сделать.
В нашем плане энергосохранения выбрать оценка для поднятия частоты вместо 15 мс максимум 5000 мс.
Есть программа Intel SMI Latency Checker
Для гипервизора - отключаем поддержку виртуальных машин в биосе.

Про прерывания на уровне ядра и пользователя в windows.
В Windows применяется:
- для x86 - 32 уровня IRQL от 0 до 31 (в скобках указано числовое значение):
High (31)
Power fail (30)
IPI (29)
Clock (28)
Profile (27)
Диапазон аппаратных прерываний, называемых Devices IRQL, или DIRQL (от 26 до 3) или ISR
DPC/DISPATCH (2)
APC (1)
PASSIVE (0)
Это означает, например, что планировщик (работающий на уровне DPC/DISPATCH) может быть прерван аппаратными прерываниями, межпроцессорными прерываниями (IPI) и т. д., но не может быть прерван асинхронными процедурами (APC) и обычными потоками, работающими на уровне PASSIVE. Межпроцессорные прерывания IPI могут быть прерваны сбоем электропитания (прерывание на уровне Power fail), но не могут быть прерваны обычными аппаратными прерываниями от устройств и т. д.
- для х64
16 уровней IRQL (от 0 до 15)
High/Profile (15)
Interprocessor interrupt/Power (14)
Clock (13)
Synch (12)
Device n (11)
.........
Device 1 (3)
Dispatch/DPC (2)
APC (1)
Passive/Low (0)

При этом:
hardware interrupts 3-15 (3-31)
software interrupts 1-2 (1-2)
normal thread execution 0 (0)


Наш пользовательский процесс может иметь следующие приоритеты:
Idle - 4
Below Normal - 6
Normal -8
Above Normal -10
High -13
Real-Time -24
Внутри процесса мы можем задать приоритет для его потоков:
Idle дает итоговый приоритет процесса с потоком 1, кроме real-time, там он его просто снизит до фиксированной 16
Lowest -2
Below Normal -1
Normal 0
Above Normal +1
Highest +2
Time Critical +7

Итоговый приоритет потока - это сумма приоритетов процесса и потока.
31 - максимум
Real-Time - от 16 до 31.
При этом даже максимальный 31 приоритет не лает нам возможности подняться выше уровня Passive/Low(0), поэтому любое прерывание на нашем ядре прервет нашу программу.


Программы для оценки прерываний:
ETW xperf WPA - родной софт от microsoft
Latency monitor https://www.resplendence.com/latencymon
DPC latency https://www.wagnardsoft.com/forums/viewtopic.php?t=5265


Настройка прерываний


Борьба с прерываниями.
Бороться надо двумя путями.
Первый путь - уменьшить само количество прерываний=их частоту.
Частота прерываний за 1 секунду до 10000 считается еще неплохой.
Второй путь - уменьшить длительность прерываний.
Есть еще третий путь - освободить от прерываний нужные нам ядра.
Первое и самое главное.
Установка максимально облегченной и очищенной системы.
Если хватит windows 10, то лучше ставить ее.
23H2 лучше, чем 24Н2.
Отключить динамический таймер.
Поднять, а не снизить время для системного таймера до 15,625 мс!
Если снизим до 0.5 мс, то увеличим количество прерываний.
Но тут вступает в действие многозадачность винды.
1/4 времени отдается фоновым процессам.
Минимум - это 6 тиков=2 кванта
Полностью вырубить все фоновые процессы на винде мы не сможем.
Для 120 кадров нам нужно иметь перерыв не больше 1/120=8.(3) мс.
Поэтому подходит время для системного таймера только
0.5 мс /1 мс и условно 2 мс , так как 2 мс*2=4 мс.

Внести в реестр для глобальной настройки системного таймера (работает только для win 11)
[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\kernel]
"GlobalTimerResolutionRequests"=dword:00000001"

Отключить VSYNC.
Включить тройную буферизацию если процессор успевает рендерить, то компенсирует воемя двух кадров: 2*1000 мс / частоту кадров в Гц
Краткий список исследований по психофизиологии:
Watson (1986): Задержки <5 мс незаметны.
Kelly (1979): Порог фликера <2 мс.
Burr & Ross (1982): 10% кадра = 100мс/частоту кадров (при движении).
Clayton (2018): 1–2% кадров= 1000мс*процент пропуска кадров (10–20 мс/с) незаметно.
Carrasco (2011): <5–10 мс при внимании.
Hoffman et al. (2017): <3 мс с размытием.
Swafford et al. (2016): <4 мс, 2% (20 мс) при редких фризах (реже 1 раза в секунду).
Digital Foundry (2025): 0.125 фриза/с=0.125*1000мс/частоту кадров Гц) заметно при частых повторениях.

Для 120 Гц:
1982-0.833мс
2025-1.042мс


Снизить частоту опроса мыши до 125Гц.

Главные правила для таймеров:
Таймеры используются для времени (QPC) и для системных прерываний=тиков.
useplatformclock disables TSC and uses the platform source clock instead (HPET or PMT). PMT is used when HPET is disabled in BIOS.
useplatformtick disables TSC tick and uses the platform source tick instead (RTC).
Does disabledynamictick work when useplatformtick is used?
No, it does not do anything since RTC is not a dynamic tick counter.

При этом возможны разные комбинации таймеров.
TSC + TSC without desync:
bcdedit /deletevalue useplatformclock - bcdedit /deletevalue useplatformtick
(make sure HPET is enabled in BIOS)
TSC + RTC:
bcdedit /deletevalue useplatformclock - bcdedit /set useplatformtick Yes
HPET + RTC:
bcdedit /set useplatformclock Yes - bcdedit /set useplatformtick Yes
(make sure HPET is enabled in BIOS)
PMT + RTC:
bcdedit /set useplatformclock Yes - bcdedit /set useplatformtick Yes
(make sure HPET is disabled in BIOS)
Частота HPET 14.318180 MHz, в 4 раза выше частоты ACPI PM Timer.
RTC устаревший тайминг с частотой от 2-х до 8192 Гц.
Использует кварц 32.768 KHz
HPET требует больше времени на вызов, чем TSC или PM Timer, но это важно только для системных прерываний.
HPET и PM timer находятся в южном мосте.
TSC в процессоре.
Поэтому вполне допустима комбинация HPET (для времени QPC)+TSC (для тиков).


bcdedit /set useplatformtick no (отключаем RTC и включаем TSC для тиков)
bcdedit /set useplatformclock no (отключаем HPET и включаем TSC для времени QPC)
bcdedit /set disabledynamictick yes (отключаем динамическое изменение частоты системного таймера - влияет только на тики)
bcdedit /set tscsyncpolicy Enhanced (включаем улучшенную синхронизацию TSC-таймера)
HPET не следует отключать в биосе и в диспетчере устройств.
Посмотреть текущую конфигурацию можно с помощью команды
bcdedit /enum


Обсуждение проблем ОС и оборудования: задержка реакции системы (latency), микроcтаттер, инпутлаг, фризы.

Перед тем как задавать вопросы, просьба прочитать FAQ

Осуществлять мониторинг программой Latency Monitor нужно в течение 1 минуты, в состоянии простоя системы т.е. без дисковой, сетевой активности, и любой другой, с выключенным ав и приложениями в трее и автозагрузке,
не раньше чем через 2 минуты после загрузки системы.
Не двигаем мышку и не используем клавиатуру в момент измерений. Потом остановка и скриншот.


Презентация NVIDIA (на англ.) о проблемах статтеров, фризов и лагов (терминология, описание и причины возникновения)


Последний раз редактировалось anta777 16.07.2025 21:44, всего редактировалось 40 раз(а).
Начну редактировать первое сообщение и возьмусь за эту тему.



Партнер
 

Member
Статус: Не в сети
Регистрация: 21.01.2015
Откуда: ---
Фото: 0
ChugBur писал(а):
Вот.
Пфффф хахахаха) Все боится времени и только время боится дров куртки :lol: Кстати миньоны куртки клялись, что они исправили этот косяк в дровах :D

_________________
Я геймер на 60 Гц.)))
Причём я в киберспорт, в Думе играю на сложности, где 1 раз помер и заного. (с) Руфусс


 

Submoderator
Статус: Не в сети
Регистрация: 10.06.2011
Agiliter писал(а):
WhiteRatify писал(а):
Я считаю что если задержка ниже 1000мс

И больше могут быть допустимы, смотря когда и чем они вызваны.

По доках dpc должны быть не больше 100 мкс.

_________________
TableDRAM(simple+обычная) bit.ly/3rTIBLv bit.ly/32WnkTU
Tm5(ddr4/5) bit.ly/2Oe8R00 bit.ly/2H9jIZH bit.ly/2MUvl6n bit.ly/3wedj8U bit.ly/3STH2wx


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
По каким?

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Member
Статус: Не в сети
Регистрация: 17.05.2021
Откуда: Big Shell
Фото: 2
anta777 писал(а):
не больше 100 мкс
Вложение:
Снимок экрана 2025-07-16 211750.jpg
Снимок экрана 2025-07-16 211750.jpg [ 41.31 КБ | Просмотров: 798 ]
anta777 писал(а):
По доках dpc должны быть
кинь свой латмон, с "не больше 100 мкс". Если твои доки не имеют ничего общего с реальностью, зачем о них упоминать ?

_________________
Asus h510m | 10400F | 2666cl13 | 6700XT RD | Be quiet SP 600 | Samsung 980 Pro 512 | FHD&240Hz
Who are the Patriots ? La-li-lu-le-lo !


 

Submoderator
Статус: Не в сети
Регистрация: 10.06.2011
Agiliter писал(а):
По каким?

От микрософт.

_________________
TableDRAM(simple+обычная) bit.ly/3rTIBLv bit.ly/32WnkTU
Tm5(ddr4/5) bit.ly/2Oe8R00 bit.ly/2H9jIZH bit.ly/2MUvl6n bit.ly/3wedj8U bit.ly/3STH2wx


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
Я ссылку хотел :D

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Member
Статус: Не в сети
Регистрация: 17.05.2021
Откуда: Big Shell
Фото: 2
anta777 = microsoft, чо непонятного ?)
получается все эти задержки выше 100мкс за 1,5 часа серфинга не норма.
Вложение:
Снимок экрана 2025-07-16 223624.jpg
Снимок экрана 2025-07-16 223624.jpg [ 291.83 КБ | Просмотров: 760 ]

_________________
Asus h510m | 10400F | 2666cl13 | 6700XT RD | Be quiet SP 600 | Samsung 980 Pro 512 | FHD&240Hz
Who are the Patriots ? La-li-lu-le-lo !


 

Submoderator
Статус: Не в сети
Регистрация: 10.06.2011
Agiliter писал(а):
Я ссылку хотел :D

https://learn.microsoft.com/en-us/windows-hardware/drivers/kernel/guidelines-for-writing-dpc-routines?redirectedfrom=MSDN

_________________
TableDRAM(simple+обычная) bit.ly/3rTIBLv bit.ly/32WnkTU
Tm5(ddr4/5) bit.ly/2Oe8R00 bit.ly/2H9jIZH bit.ly/2MUvl6n bit.ly/3wedj8U bit.ly/3STH2wx


 

Member
Статус: Не в сети
Регистрация: 17.05.2021
Откуда: Big Shell
Фото: 2
anta777 ок, это офф рекомендация майков - "Во избежание снижения скорости отклика системы типичная процедура DPC должна выполняться не более 100 микросекунд при каждом вызове". К бумаге претензий не имею. Просто покажите мне эти "не более 100 микросекунд при каждом вызове" IRL, у меня к этому претензии. Если это недостижимо в реале, то какую практическую ценность имеет эта рекомендация майков ? У кого здесь система работает ≤ 100 мкс на один DPC ?

_________________
Asus h510m | 10400F | 2666cl13 | 6700XT RD | Be quiet SP 600 | Samsung 980 Pro 512 | FHD&240Hz
Who are the Patriots ? La-li-lu-le-lo !


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
Попробовал на драйвер нвидии принудительно указать чтобы прерывания были где угодно кроме 0 ядра. Не работает.
Скорее всего у Nvidia там своя атмосфера и попытки это изменить в реестре ничего не дают.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Submoderator
Статус: Не в сети
Регистрация: 10.06.2011
Надо еще поменять политику.
Но это все работает только для ISR, а DPC раскидывает сама винда, они не задаются на ядра.
Есть только несколько ключей для DPC, что немного могут помочь.

_________________
TableDRAM(simple+обычная) bit.ly/3rTIBLv bit.ly/32WnkTU
Tm5(ddr4/5) bit.ly/2Oe8R00 bit.ly/2H9jIZH bit.ly/2MUvl6n bit.ly/3wedj8U bit.ly/3STH2wx


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
Я пробовал менять таргетирование нагрузки по ядрам до 0.01%. Менял глобальную политику схемы питания. До лампочки.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Submoderator
Статус: Не в сети
Регистрация: 10.06.2011
Я говорю про ключи , связанные с DPC.

_________________
TableDRAM(simple+обычная) bit.ly/3rTIBLv bit.ly/32WnkTU
Tm5(ddr4/5) bit.ly/2Oe8R00 bit.ly/2H9jIZH bit.ly/2MUvl6n bit.ly/3wedj8U bit.ly/3STH2wx


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
Вложение:
2025-07-22 19-57-28 Screenshot.png
2025-07-22 19-57-28 Screenshot.png [ 21.34 КБ | Просмотров: 297 ]

И это пробовал.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Submoderator
Статус: Не в сети
Регистрация: 10.06.2011
Я не про это.
Я про DPC:
отключить многопоточные DPC:
reg add "HKLM\System\CurrentControlSet\Control\Session Manager\kernel" /v ThreadDpcEnable /t REG_DWORD /f /d 0

отключить динамическое перемещение DOC между ядрами:
reg add "HKLM\SYSTEM\CurrentControlSet\Control\PriorityControl" /v DPCEnableDynamicBoost /t REG_DWORD /d 0 /f

_________________
TableDRAM(simple+обычная) bit.ly/3rTIBLv bit.ly/32WnkTU
Tm5(ddr4/5) bit.ly/2Oe8R00 bit.ly/2H9jIZH bit.ly/2MUvl6n bit.ly/3wedj8U bit.ly/3STH2wx


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
А смысл их отключать? Чтобы ещё дольше их выполнять?
Это может только увеличить суммарное время на DPC.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Submoderator
Статус: Не в сети
Регистрация: 10.06.2011
Привяжутся к ядру с isr и не будут гулять, ты видеокарту с одним вектором привязывай к 2 или 3 ядру по нумерации.

_________________
TableDRAM(simple+обычная) bit.ly/3rTIBLv bit.ly/32WnkTU
Tm5(ddr4/5) bit.ly/2Oe8R00 bit.ly/2H9jIZH bit.ly/2MUvl6n bit.ly/3wedj8U bit.ly/3STH2wx


 

Member
Статус: Не в сети
Регистрация: 16.05.2010
Откуда: Ленинград
Фото: 545
Agiliter писал(а):
А смысл их отключать? Чтобы ещё дольше их выполнять?
Это может только увеличить суммарное время на DPC.


Нет смысла, на Нвидии, это тянется с времён Паскаля: 368.95, где значения в идл были 1000-2500us и выше, это пофиксили.

Сейчас 500-ый бранч и тут тоже встречаются проблемы:
https://forums.developer.nvidia.com/t/d ... ems/238290

Связано это c особенностями технологий энергосбережения на чипе,и управления частотами, и учитывайте что все современные wddm 2.1-3.2 адаптеры, будут использовать технологии отложенного рендеринга DWM на рабочем столе, в буфер, и когда это возможно - снижать количество redraw/refresh вызовов. Особенно если стоит режим "Optimal" в панели драйвера.

Самый простой способ, можно сделать в панели драйвера Maximum perfomance. Если хорошо знаете nvidia-smi, можно там "поковыряться".

_________________
5950x\MSI MPG X570S MAX CARBON WIFI\7900xt Nitro+ Vapor\32GB 2x16-DDR4 Gskill 3200 (14-14-14-32-Cr2)\Pccooler YS1200W


 

Advanced member
Статус: Не в сети
Регистрация: 29.03.2017
Я не планирую снижать DPC ради снижения DPC. Просто ковыряюсь с точки зрения любопытства.

_________________
https://docs.google.com/spreadsheets/d/1QpzbIzmoE3ntu6XvpchHspxqA0o6FPxc63_diTelzXw


 

Member
Статус: Не в сети
Регистрация: 16.05.2010
Откуда: Ленинград
Фото: 545
Agiliter писал(а):
Я не планирую снижать DPC ради снижения DPC. Просто ковыряюсь с точки зрения любопытства.

аа, ну это другой вопрос))), кстати тут я вспомнил, если не ошибаюсь вы используете TPM на Амд платформе?,где то мелькало в обсуждениях, можете если вам не сложно,сделать вывод команды get-tpm в пауэр шелл под спойлер?

Интересует состояние и настройки, если у вас есть хэш в поле OwnerAuth - его можете "замазать" по желанию. Хочу сравнить с своим что бы понять, что у меня с fTPM.

_________________
5950x\MSI MPG X570S MAX CARBON WIFI\7900xt Nitro+ Vapor\32GB 2x16-DDR4 Gskill 3200 (14-14-14-32-Cr2)\Pccooler YS1200W


Показать сообщения за:  Поле сортировки  
Начать новую тему Новая тема / Ответить на тему Ответить  Сообщений: 4368 • Страница 218 из 219<  1 ... 215  216  217  218  219  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 6


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan