Все прерывания делятся по следующим приоритетам: 1 место - работает на уровне кольцо -2 прерывания SMI (system management interrupt — прерывание системного управления), которое возникает: -по сигналу от чипсета или периферии на материнской плате -программный SMI, посланный системным ПО через порт ввода-вывода -запись по адресу ввода-вывода, для которого микропрограммно установлена необходимость активации SMM. 2 место - гипервизор, который работает в кольце -1 3 место - ядро операционной системы - работает в кольце 0 4 место - пользовательский уровень - работает в кольце 3
Позднее дополню каждый раздел. Все проблемы у нас связаны с тем, что windows относится к операционным системам с вытесняющей многозадачностью. Вытесняющая многозадачность требует обработки системного прерывания от аппаратного таймера. По истечении кванта времени, отведённого процессу, происходит прерывание и вызывается планировщик процессов. Частота вызова планировщика критична: слишком частый его вызов будет расходовать процессорное время впустую. Единственное, что мы можем изменить - это увеличить время кванта и поменять соотношение квантов времени на активную задачу и задачи в фоне, за это отвечает параметр в реестре Win32PrioritySeparation По умолчанию 0х26 кванты 18:6 = Оптимальный вариант. https://github.com/keoy7am/Win32PrioritySeparationTool При этом само время кванта зависит от системного таймера. При системном таймера 15.625 мс оно будет больше, чем при 1.0 мс. Высчитывается время системного таймера * тики. 1 тик= 3 кванта Для системного таймера 0.5 мс фону тогда буде даваться 0.5мс*6/3 = 1мс из каждых 4 мс. При 1 мс - 2мс из каждых 8мс. При 2 мс - 4мс из каждых 16мс. Для борьбы с фризами оптимально выставить системный таймер 0.5мс.
SMI-прерывания зависят от BIOS/UEFI и оборудования. Отключаем все лишнее, отключаем энергосохранение, скорость вентиляторов фиксируем, это все, что мы можем сделать. В нашем плане энергосохранения выбрать оценка для поднятия частоты вместо 15 мс максимум 5000 мс. Есть программа Intel SMI Latency Checker Для гипервизора - отключаем поддержку виртуальных машин в биосе.
Про прерывания на уровне ядра и пользователя в windows.
В Windows применяется: - для x86 - 32 уровня IRQL от 0 до 31 (в скобках указано числовое значение): High (31) Power fail (30) IPI (29) Clock (28) Profile (27) Диапазон аппаратных прерываний, называемых Devices IRQL, или DIRQL (от 26 до 3) или ISR DPC/DISPATCH (2) APC (1) PASSIVE (0) Это означает, например, что планировщик (работающий на уровне DPC/DISPATCH) может быть прерван аппаратными прерываниями, межпроцессорными прерываниями (IPI) и т. д., но не может быть прерван асинхронными процедурами (APC) и обычными потоками, работающими на уровне PASSIVE. Межпроцессорные прерывания IPI могут быть прерваны сбоем электропитания (прерывание на уровне Power fail), но не могут быть прерваны обычными аппаратными прерываниями от устройств и т. д. - для х64 16 уровней IRQL (от 0 до 15) High/Profile (15) Interprocessor interrupt/Power (14) Clock (13) Synch (12) Device n (11) ......... Device 1 (3) Dispatch/DPC (2) APC (1) Passive/Low (0)
При этом: hardware interrupts 3-15 (3-31) software interrupts 1-2 (1-2) normal thread execution 0 (0)
Наш пользовательский процесс может иметь следующие приоритеты: Idle - 4 Below Normal - 6 Normal -8 Above Normal -10 High -13 Real-Time -24 Внутри процесса мы можем задать приоритет для его потоков: Idle дает итоговый приоритет процесса с потоком 1, кроме real-time, там он его просто снизит до фиксированной 16 Lowest -2 Below Normal -1 Normal 0 Above Normal +1 Highest +2 Time Critical +7
Итоговый приоритет потока - это сумма приоритетов процесса и потока. 31 - максимум Real-Time - от 16 до 31. При этом даже максимальный 31 приоритет не лает нам возможности подняться выше уровня Passive/Low(0), поэтому любое прерывание на нашем ядре прервет нашу программу.
Борьба с прерываниями. Бороться надо двумя путями. Первый путь - уменьшить само количество прерываний=их частоту. Частота прерываний за 1 секунду до 10000 считается еще неплохой. Второй путь - уменьшить длительность прерываний. Есть еще третий путь - освободить от прерываний нужные нам ядра.
Первое и самое главное. Установка максимально облегченной и очищенной системы. Если хватит windows 10, то лучше ставить ее. 23H2 лучше, чем 24Н2. Отключить динамический таймер. Поднять, а не снизить время для системного таймера до 15,625 мс! Если снизим до 0.5 мс, то увеличим количество прерываний. Но тут вступает в действие многозадачность винды. 1/4 времени отдается фоновым процессам. Минимум - это 6 тиков=2 кванта Полностью вырубить все фоновые процессы на винде мы не сможем. Для 120 кадров нам нужно иметь перерыв не больше 1/120=8.(3) мс. Поэтому подходит время для системного таймера только 0.5 мс /1 мс и условно 2 мс , так как 2 мс*2=4 мс. Внести в реестр для глобальной настройки системного таймера (работает только для win 11) [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\kernel] "GlobalTimerResolutionRequests"=dword:00000001"
Отключить VSYNC. Включить тройную буферизацию если процессор успевает рендерить, то компенсирует воемя двух кадров: 2*1000 мс / частоту кадров в Гц Краткий список исследований по психофизиологии: Watson (1986): Задержки <5 мс незаметны. Kelly (1979): Порог фликера <2 мс. Burr & Ross (1982): 10% кадра = 100мс/частоту кадров (при движении). Clayton (2018): 1–2% кадров= 1000мс*процент пропуска кадров (10–20 мс/с) незаметно. Carrasco (2011): <5–10 мс при внимании. Hoffman et al. (2017): <3 мс с размытием. Swafford et al. (2016): <4 мс, 2% (20 мс) при редких фризах (реже 1 раза в секунду). Digital Foundry (2025): 0.125 фриза/с=0.125*1000мс/частоту кадров Гц) заметно при частых повторениях.
Для 120 Гц: 1982-0.833мс 2025-1.042мс
Снизить частоту опроса мыши до 125Гц.
Главные правила для таймеров: Таймеры используются для времени (QPC) и для системных прерываний=тиков.
useplatformclock disables TSC and uses the platform source clock instead (HPET or PMT). PMT is used when HPET is disabled in BIOS. useplatformtick disables TSC tick and uses the platform source tick instead (RTC). Does disabledynamictick work when useplatformtick is used? No, it does not do anything since RTC is not a dynamic tick counter.
При этом возможны разные комбинации таймеров.
TSC + TSC without desync: bcdedit /deletevalue useplatformclock - bcdedit /deletevalue useplatformtick (make sure HPET is enabled in BIOS) TSC + RTC: bcdedit /deletevalue useplatformclock - bcdedit /set useplatformtick Yes HPET + RTC: bcdedit /set useplatformclock Yes - bcdedit /set useplatformtick Yes (make sure HPET is enabled in BIOS) PMT + RTC: bcdedit /set useplatformclock Yes - bcdedit /set useplatformtick Yes (make sure HPET is disabled in BIOS) Частота HPET 14.318180 MHz, в 4 раза выше частоты ACPI PM Timer. RTC устаревший тайминг с частотой от 2-х до 8192 Гц. Использует кварц 32.768 KHz HPET требует больше времени на вызов, чем TSC или PM Timer, но это важно только для системных прерываний. HPET и PM timer находятся в южном мосте. TSC в процессоре. Поэтому вполне допустима комбинация HPET (для времени QPC)+TSC (для тиков).
bcdedit /set useplatformtick no (отключаем RTC и включаем TSC для тиков) bcdedit /set useplatformclock no (отключаем HPET и включаем TSC для времени QPC) bcdedit /set disabledynamictick yes (отключаем динамическое изменение частоты системного таймера - влияет только на тики) bcdedit /set tscsyncpolicy Enhanced (включаем улучшенную синхронизацию TSC-таймера) HPET не следует отключать в биосе и в диспетчере устройств. Посмотреть текущую конфигурацию можно с помощью команды bcdedit /enum
Обсуждение проблем ОС и оборудования: задержка реакции системы (latency), микроcтаттер, инпутлаг, фризы.
Перед тем как задавать вопросы, просьба прочитать FAQ
Осуществлять мониторинг программойLatency Monitorнужно в течение 1 минуты, в состоянии простоя системы т.е. без дисковой, сетевой активности, и любой другой, с выключенным ав и приложениями в трее и автозагрузке, не раньше чем через 2 минуты после загрузки системы. Не двигаем мышку и не используем клавиатуру в момент измерений. Потом остановка и скриншот.
Member
Статус: Не в сети Регистрация: 24.10.2010 Фото: 1
Да норм игра идёт, нет прямо таких явных фризов. https://www.youtube.com/watch?v=L3p-HMHF2k4 Какое сжатие блин на эту трубу надо? Видео 750 метров (H264/AVC/MKV 30 МБит), всё равно перекодируется с квадратами...
Member
Статус: Не в сети Регистрация: 19.11.2012 Откуда: С фронта Фото: 7
Batman Arkham Knight v.1.6.2.0. Настройки - низкие / максимальные. Вертикальная синхронизация - вкл / выкл. Не знаю. Может жесткий диск от старости глючит, может виндовс пора таки обновить (5 лет в работе). Но у маня как то так.
Moderator
Статус: Не в сети Регистрация: 08.05.2015 Откуда: Москва Фото: 6
Sergysy, тут никто не скажет) Нормальное время кадра - величина, обратная fps) То есть если 60fps, то 1000/60=16.666мс Mikanoshi, ну я в FHD играю обычно, там fps ниже и, соответственно, загрузка повыше. Я в игру вообще не играл(чисто тестирование), бэтмобиль не знаю когда откроется)
_________________ По всем вопросам и предложениям пишите в телеграм olegdjus
Member
Статус: Не в сети Регистрация: 16.05.2010 Откуда: Ленинград Фото: 545
Sergysy писал(а):
какое значение frametime и разница между мин макс считаются нормальными?
Зависит от фактического фпс, 75 фпс на скрине это 13.3 мс на кадр,в окне естественно может быть больше,фокус окна,аэро gui,скачки загрузки гпу. От 13 и меньше это хорошая производительность и отличная оптимизация,для сетевых и сингловых проектов с прекрасной оптимизацией и очень пряморуких кодеров 5-10 идеально. В целом всё что от 60 и лучше =16.7мс
При прочих равных минимальный фрейм тайм отражает производительность и в итоге финальный фреймрейт. На фрейм тайм влияет качество написанного движка,и оптимизация конвеера рендера-качество драйверов,тип апи,удельное количество вызовов отрисовки за единицу времени-чем меньше на операцию(ии) -тем лучше-быстрее.
Параллелизация вызовов-Цпу оптимизация. Загрузка Гпу в процентах на мониторах не отражает ситуацию полностью-нагрузка не гомогенна. Для тестирования используйте профайлер от Нвидии.
Olegdjuskiberman Спасибо. То есть если в условном ведьмаке3 фулскрин 2к примерно 11-13 фреймтайм при 60-80 фпс, а в дедспейс 3 и шадоувариоре 2 иногда/в определенных местах начинает скакать фреймтайм до 30мс, то это проблема игры-движка, а не видюхи?
Member
Статус: Не в сети Регистрация: 16.05.2010 Откуда: Ленинград Фото: 545
Sergysy писал(а):
до 30мс, то это проблема игры-движка, а не видюхи?
Да если у вас такая-же ситуация при фиксации частот на гпу,и цпу ничем в этот момент не отвлекается на сторонние процессы-Ось,Ав,дефрагментация и так далее,проблема где-то на цепочке конвеера - видеодрайвер - Directx API- движок игры. Проверяется просто- профиль игры максимальная производительнось в панели видеодрайвера, в панели Ос-Высокая производительность.
Member
Статус: Не в сети Регистрация: 16.05.2010 Откуда: Ленинград Фото: 545
coolio писал(а):
Какой в этом теоретический смысл?
Практический,запись кэша на диск,в момент доступа микрофриз. Например движок ведьмака кэширование очень не любит,если он на Хдд особенно установлен. на Sdd и быстрых тачках без разницы,только для диагностики
Member
Статус: Не в сети Регистрация: 16.05.2010 Откуда: Ленинград Фото: 545
Slimchanskiy писал(а):
разницы не заметил, кэширование шейдеров (оно ведь?) отключил для самой игры. (или надо вообще?)
Для самой достаточно,крутаните prerender frames 1-2, fast sync временно можно вырубить,не поможет ищите в другом месте что может отвлекает цпу или диск,софт любой -что угодно. Железо всё в порядке?, диск?,на p67 свежий frimware. Что с Бп?
Для самой достаточно,крутаните prerender frames 1-2, fast sync временно можно вырубить,не поможет ищите в другом месте что может отвлекает цпу или диск,софт любой -что угодно. Железо всё в порядке?, диск?,на p67 свежий frimware. Что с Бп?
А, про пререндер кадры забыл. Хз что отвлекает, все же я думаю проблема именно в проце, т.к загрузка видяхи кое как 60, а проц на все 100 грузится. Помогает только 4к разрешение, но и проц все равно до 100 иногда умудряется доходить. Но и фризы вроде никуда не пропадают, или становятся меньше. С диском все норм, по мнению CDI проша не свежая, FE, есть там UA6, но все же думаю вряд ли в этом проблема. бп fsp 600pnr
kiberman писал(а):
2500к не самый сок для 1070.
Я понимаю, потому и7 спешит на помощь
_________________ R7 57X3D x MSI B450-A Pro Max x 5070 Ti TUF x Kingston Fury Renegade 2x16 x Fuma 2 x YS1000w Odyssey G7 x G305 x Qck x Corsair K30
Member
Статус: Не в сети Регистрация: 16.05.2010 Откуда: Ленинград Фото: 545
Slimchanskiy писал(а):
Хз что отвлекает, все же я думаю проблема именно в проце
Скорее всего.
Slimchanskiy писал(а):
проша не свежая, FE, есть там UA6, но все же думаю вряд ли в этом проблема.
Вряд ли,но если едет i7,почему нет?. Тут в ветке 1070/1080 у человека был случай на старой матери 67 или 77ка не помню,карта себя плохо вела-работала через раз-думали брак,нет какая-то не совместимость с матерью,обновился и порядок. Это не руководство к действию,просто информация. Вас не агитирую,прошиваться на свой страх и риск если в этом вопросе подкованы. Тут снимаю всякую ответственность.
Member
Статус: Не в сети Регистрация: 16.05.2010 Откуда: Ленинград Фото: 545
Mikanoshi писал(а):
Если монитор 60Гц и залочить на 60 фпс, то может и хватает. А я всегда играю с фаст синком и при максимуме, что может выжать комп (хотя скорее что может оптимизация игры выжать из железа).
С вашим "камнем" можно играть как угодно,другое дело 950ый,ставь там всинк или нет,по минимальному фпс,где 6700к "вывезет" любое "тяжёлое место" или динамику-и вы этого не заметите,950-ка визуально "споткнётся".
Heaven бенчмарк уже показал это и минималка в 28 фпс у человека. Баланс нужен всегда.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 9
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения