Все прерывания делятся по следующим приоритетам: 1 место - работает на уровне кольцо -2 прерывания SMI (system management interrupt — прерывание системного управления), которое возникает: -по сигналу от чипсета или периферии на материнской плате -программный SMI, посланный системным ПО через порт ввода-вывода -запись по адресу ввода-вывода, для которого микропрограммно установлена необходимость активации SMM. 2 место - гипервизор, который работает в кольце -1 3 место - ядро операционной системы - работает в кольце 0 4 место - пользовательский уровень - работает в кольце 3
Позднее дополню каждый раздел. Все проблемы у нас связаны с тем, что windows относится к операционным системам с вытесняющей многозадачностью. Вытесняющая многозадачность требует обработки системного прерывания от аппаратного таймера. По истечении кванта времени, отведённого процессу, происходит прерывание и вызывается планировщик процессов. Частота вызова планировщика критична: слишком частый его вызов будет расходовать процессорное время впустую. Единственное, что мы можем изменить - это увеличить время кванта и поменять соотношение квантов времени на активную задачу и задачи в фоне, за это отвечает параметр в реестре Win32PrioritySeparation По умолчанию 0х26 кванты 18:6 = Оптимальный вариант. https://github.com/keoy7am/Win32PrioritySeparationTool При этом само время кванта зависит от системного таймера. При системном таймера 15.625 мс оно будет больше, чем при 1.0 мс. Высчитывается время системного таймера * тики. 1 тик= 3 кванта Для системного таймера 0.5 мс фону тогда буде даваться 0.5мс*6/3 = 1мс из каждых 4 мс. При 1 мс - 2мс из каждых 8мс. При 2 мс - 4мс из каждых 16мс. Для борьбы с фризами оптимально выставить системный таймер 0.5мс.
SMI-прерывания зависят от BIOS/UEFI и оборудования. Отключаем все лишнее, отключаем энергосохранение, скорость вентиляторов фиксируем, это все, что мы можем сделать. В нашем плане энергосохранения выбрать оценка для поднятия частоты вместо 15 мс максимум 5000 мс. Есть программа Intel SMI Latency Checker Для гипервизора - отключаем поддержку виртуальных машин в биосе.
Про прерывания на уровне ядра и пользователя в windows.
В Windows применяется: - для x86 - 32 уровня IRQL от 0 до 31 (в скобках указано числовое значение): High (31) Power fail (30) IPI (29) Clock (28) Profile (27) Диапазон аппаратных прерываний, называемых Devices IRQL, или DIRQL (от 26 до 3) или ISR DPC/DISPATCH (2) APC (1) PASSIVE (0) Это означает, например, что планировщик (работающий на уровне DPC/DISPATCH) может быть прерван аппаратными прерываниями, межпроцессорными прерываниями (IPI) и т. д., но не может быть прерван асинхронными процедурами (APC) и обычными потоками, работающими на уровне PASSIVE. Межпроцессорные прерывания IPI могут быть прерваны сбоем электропитания (прерывание на уровне Power fail), но не могут быть прерваны обычными аппаратными прерываниями от устройств и т. д. - для х64 16 уровней IRQL (от 0 до 15) High/Profile (15) Interprocessor interrupt/Power (14) Clock (13) Synch (12) Device n (11) ......... Device 1 (3) Dispatch/DPC (2) APC (1) Passive/Low (0)
При этом: hardware interrupts 3-15 (3-31) software interrupts 1-2 (1-2) normal thread execution 0 (0)
Наш пользовательский процесс может иметь следующие приоритеты: Idle - 4 Below Normal - 6 Normal -8 Above Normal -10 High -13 Real-Time -24 Внутри процесса мы можем задать приоритет для его потоков: Idle дает итоговый приоритет процесса с потоком 1, кроме real-time, там он его просто снизит до фиксированной 16 Lowest -2 Below Normal -1 Normal 0 Above Normal +1 Highest +2 Time Critical +7
Итоговый приоритет потока - это сумма приоритетов процесса и потока. 31 - максимум Real-Time - от 16 до 31. При этом даже максимальный 31 приоритет не лает нам возможности подняться выше уровня Passive/Low(0), поэтому любое прерывание на нашем ядре прервет нашу программу.
Борьба с прерываниями. Бороться надо двумя путями. Первый путь - уменьшить само количество прерываний=их частоту. Частота прерываний за 1 секунду до 10000 считается еще неплохой. Второй путь - уменьшить длительность прерываний. Есть еще третий путь - освободить от прерываний нужные нам ядра.
Первое и самое главное. Установка максимально облегченной и очищенной системы. Если хватит windows 10, то лучше ставить ее. 23H2 лучше, чем 24Н2. Отключить динамический таймер. Поднять, а не снизить время для системного таймера до 15,625 мс! Если снизим до 0.5 мс, то увеличим количество прерываний. Но тут вступает в действие многозадачность винды. 1/4 времени отдается фоновым процессам. Минимум - это 6 тиков=2 кванта Полностью вырубить все фоновые процессы на винде мы не сможем. Для 120 кадров нам нужно иметь перерыв не больше 1/120=8.(3) мс. Поэтому подходит время для системного таймера только 0.5 мс /1 мс и условно 2 мс , так как 2 мс*2=4 мс. Внести в реестр для глобальной настройки системного таймера (работает только для win 11) [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\kernel] "GlobalTimerResolutionRequests"=dword:00000001"
Отключить VSYNC. Включить тройную буферизацию если процессор успевает рендерить, то компенсирует воемя двух кадров: 2*1000 мс / частоту кадров в Гц Краткий список исследований по психофизиологии: Watson (1986): Задержки <5 мс незаметны. Kelly (1979): Порог фликера <2 мс. Burr & Ross (1982): 10% кадра = 100мс/частоту кадров (при движении). Clayton (2018): 1–2% кадров= 1000мс*процент пропуска кадров (10–20 мс/с) незаметно. Carrasco (2011): <5–10 мс при внимании. Hoffman et al. (2017): <3 мс с размытием. Swafford et al. (2016): <4 мс, 2% (20 мс) при редких фризах (реже 1 раза в секунду). Digital Foundry (2025): 0.125 фриза/с=0.125*1000мс/частоту кадров Гц) заметно при частых повторениях.
Для 120 Гц: 1982-0.833мс 2025-1.042мс
Снизить частоту опроса мыши до 125Гц.
Главные правила для таймеров: Таймеры используются для времени (QPC) и для системных прерываний=тиков.
useplatformclock disables TSC and uses the platform source clock instead (HPET or PMT). PMT is used when HPET is disabled in BIOS. useplatformtick disables TSC tick and uses the platform source tick instead (RTC). Does disabledynamictick work when useplatformtick is used? No, it does not do anything since RTC is not a dynamic tick counter.
При этом возможны разные комбинации таймеров.
TSC + TSC without desync: bcdedit /deletevalue useplatformclock - bcdedit /deletevalue useplatformtick (make sure HPET is enabled in BIOS) TSC + RTC: bcdedit /deletevalue useplatformclock - bcdedit /set useplatformtick Yes HPET + RTC: bcdedit /set useplatformclock Yes - bcdedit /set useplatformtick Yes (make sure HPET is enabled in BIOS) PMT + RTC: bcdedit /set useplatformclock Yes - bcdedit /set useplatformtick Yes (make sure HPET is disabled in BIOS) Частота HPET 14.318180 MHz, в 4 раза выше частоты ACPI PM Timer. RTC устаревший тайминг с частотой от 2-х до 8192 Гц. Использует кварц 32.768 KHz HPET требует больше времени на вызов, чем TSC или PM Timer, но это важно только для системных прерываний. HPET и PM timer находятся в южном мосте. TSC в процессоре. Поэтому вполне допустима комбинация HPET (для времени QPC)+TSC (для тиков).
bcdedit /set useplatformtick no (отключаем RTC и включаем TSC для тиков) bcdedit /set useplatformclock no (отключаем HPET и включаем TSC для времени QPC) bcdedit /set disabledynamictick yes (отключаем динамическое изменение частоты системного таймера - влияет только на тики) bcdedit /set tscsyncpolicy Enhanced (включаем улучшенную синхронизацию TSC-таймера) HPET не следует отключать в биосе и в диспетчере устройств. Посмотреть текущую конфигурацию можно с помощью команды bcdedit /enum
Обсуждение проблем ОС и оборудования: задержка реакции системы (latency), микроcтаттер, инпутлаг, фризы.
Перед тем как задавать вопросы, просьба прочитать FAQ
Осуществлять мониторинг программойLatency Monitorнужно в течение 1 минуты, в состоянии простоя системы т.е. без дисковой, сетевой активности, и любой другой, с выключенным ав и приложениями в трее и автозагрузке, не раньше чем через 2 минуты после загрузки системы. Не двигаем мышку и не используем клавиатуру в момент измерений. Потом остановка и скриншот.
Member
Статус: В сети Регистрация: 17.05.2021 Откуда: Big Shell Фото: 4
rulik006 писал(а):
Что не так с этими днищенскими драйверами Nvidia?
легко докопаться к столбу, ведь столб не ответит.
rulik006 писал(а):
купил 1070ti
2 года юзал 1070ti, драйвера оставили наилучшие воспоминания. Отыщу стату по латмон, если надо.
rulik006 писал(а):
эта туфта с DPC все еще существует!!!
А вам не приходило в голову копье мысль, что если проблема не уходит, то причина на вашей стороне ?
_________________ Asus h510m | 10400F | 2666cl13 | 6700XT RD | Be quiet SP 600 | Samsung 980 Pro 512 | FHD&240Hz Who are the Patriots ? La-li-lu-le-lo !
К стати как перешел на красную сторону я ни сталкивался с проблемой задержек ни на одной версии драйверов для видюх
Да тут всё просто - скорее всего маркетологи у куртки тупо накидывают задержку с каждыми новыми дровами на карты, что бы люди спустя 1-2 года бежали и покупали новые видяхи, ТАК КАК ОНИ РАБОТАЮТ БЫСТРЕЕ, хотя это чисто программное ограничение, и скорее всего нужно просто сидеть на самых первых дровах под твою видюху, ибо по логике в них должна быть самая маленькая задержка.
Откуда такие выводы? В сети есть официальная графика сравнения задержки на видеокартах с функцией Reflex, и без неё.
Вложение:
ав.jpg [ 18.42 КБ | Просмотров: 2605 ]
Забавно что с этой функцией у топовой на тот момент 3080 задержка снижается с дефолтных 24 до 23мс, т.е. всего на 1мс! Т.е. куртка как бы сам говорит что для топовой 3080 никаких сторонних функций не нужно - покупай и нагибай! А вот дальше мы уже видим чисто маркетинговую гниль от зеленых где бюджетная 1660 имея в дефолте 51мс задержки с рефлексом ускоряется на 30%! Вот это уже буст так буст!
Но самые внимательные люди конечно должны заметить ещё и то, что почему то задержки между 3080 и 1660 отличаются в 2 с лишним раза - 24 и 51мс. С КАКОГО ТАКОГО ПЕРЕПУГУ более мощная карта ещё и задержку меньшую выдаёт? А с того что это програмная фича, и куртка специально так сделал что бы нищеброды страдали, а покупатели жирка радовались и нагибали.
Member
Статус: Не в сети Регистрация: 14.06.2009 Откуда: Омск
Ларго писал(а):
Забавно что с этой функцией у топовой на тот момент 3080 задержка снижается с дефолтных 24 до 23мс, т.е. всего на 1мс! Т.е. куртка как бы сам говорит что для топовой 3080 никаких сторонних функций не нужно - покупай и нагибай!
Там все проще. А картинка маркетинг. Просто польза от рефлекса или режима низкой задержки в дровах есть только при загрузке ГПУ на 100% поэтому и результаты такие. 1660 грузится на сотку - поэтому рефлекс и даёт максимальный буст. 2060s на 90-100% видим соответствующие результаты. 3080 процентов на 70 - тоже все логично и рефлекс даёт улучшения на уровне погрешности. Если на всех видеокартах выставить настройки при которых карта будет грузиться на 50-70% то и инпут лаг будет один и тот же без всякого рефлекса.
Member
Статус: Не в сети Регистрация: 16.01.2015 Откуда: Санкт-Петербург
Ларго Рефлекс и "нулевой кадр" (в драйвере низкая задержка ультра) созданы для того чтобы снизить инпутлаг при полностью загруженном ГПУ.
На скрине ниже подпись "максимальные настройки 4к" 3080 многократно мощнее 1660с, на одинаковых настройках у неё будет больший фпс, что и даст меньший инпутлаг А если первая ещё и не загрузилась по ГПУ на 95-100%, тогда от рефлекса и не будет никакого толка
Добавлено спустя 30 секунд: ... не сразу увидел, выше люди всё грамтно расписалиOLD HunterGuzz
_________________ i7-10700 / RTX 4070Ti Palit GR / Gigabyte Z490M Gaming X / 16Gb RAM
Member
Статус: Не в сети Регистрация: 28.12.2014 Откуда: из Голливуда Фото: 0
с наступающими, ребят! вопрос: правильно ли я понимаю, что у всех устройств, где в графе Supported Modes присутствует Msi/MsiX, нужно проставить галочки и присвоить значение High?
Member
Статус: Не в сети Регистрация: 14.06.2009 Откуда: Омск
antiOVER Там можно вообще ничего не трогать, но если сильно хочется, то можно. Разницы все равно не уловить. А вот высокий приоритет может оказать отрицательное влияние в виде фризов и прочего. Его лучше оставить в дефолте.
Member
Статус: В сети Регистрация: 17.05.2021 Откуда: Big Shell Фото: 4
antiOVER писал(а):
я все думаю, какого хрена
за языком следи, гусар
_________________ Asus h510m | 10400F | 2666cl13 | 6700XT RD | Be quiet SP 600 | Samsung 980 Pro 512 | FHD&240Hz Who are the Patriots ? La-li-lu-le-lo !
Member
Статус: В сети Регистрация: 17.05.2021 Откуда: Big Shell Фото: 4
antiOVER писал(а):
а что с ним не так
да хреновый какой то.
_________________ Asus h510m | 10400F | 2666cl13 | 6700XT RD | Be quiet SP 600 | Samsung 980 Pro 512 | FHD&240Hz Who are the Patriots ? La-li-lu-le-lo !
Advanced member
Статус: В сети Регистрация: 29.03.2017
Guzz писал(а):
Reflex убирает очередь кадров
Он ничего не убирает. Максимум уменьшает количество буферов, да и то если их изначально много. Меньше 2х буферов на вывод не бывает. Один отображаем, в другой рисуем.
Member
Статус: Не в сети Регистрация: 19.11.2024 Откуда: Сургут
Agiliter Я вообще не понимаю гонку за 999999 фпс, люди еще удивляются что у них где-то вплоть до вылета драйвера в какой-то старой игре, где вариантов немного, либо 60 либо 30 кадров, но все хотят 500 000 фпс, чтобы что? У меня друг такой есть, сидит на 60 гц мониторе и играет в игры выше своей частоты развертки, жалуясь на какие то фризы, а как ему скажу сравнять это, он такой: да кто щас играет в 60 кадров, у человека буквально фулл хд монитор на 60 гц и он хочет чтобы всё шло плавно на выше частоте
_________________ Phenom II X4 965 BE 3.4GHz / Sapphire ATi Radeon HD 4890 1GB GDDR5 / 8GB (2x4) DDR2 AMD
Advanced member
Статус: В сети Регистрация: 29.03.2017
Синхронизация с монитором и тормоза\фризы\статтеры игр из за фпс больше чем разработчики задумали вещи не связанные. Вообще, это всё оффтоп в рамках этой темы. Вся дискуссия целиком.
Member
Статус: Не в сети Регистрация: 04.06.2017 Фото: 6
ManOfSteel в играх, особенно до 2020 года, чем выше фпс, тем ниже лаг. Наверное из-за очереди кадров, или я хз. Поэтому 75 фпс на 75гц монике сильно хуже 200фпс на том же 75гц. Не говоря уже про 144+ моники.. И если в асасинскриде 75фпс это терпимо, то в бателфилде 5 лучше иметь 200, а еще лучше - 300. В новых играх рефлекс вывозит хорошо, можно даже 200 от 300 не отличить местами.
Естественно всё это с оговоркой, что 75гц мон не самое лютое говнище у которого лаг 50мс.
Member
Статус: Не в сети Регистрация: 19.11.2024 Откуда: Сургут
Agiliter Возможно вы и правы, месье. Однако, он играет в Дедлок (игра от валв) и если выше 60 он ставит всё начинает заикатся, ставит 60 и всё норм, железо не греется и т.д возможно это правда оффтоп, просто высказал своё никому не нужное мнение
Victor91rus Это от игры зависит, есть игры где VSYNC очень добротный и играть в 60 фпс с ним кайф...
_________________ Phenom II X4 965 BE 3.4GHz / Sapphire ATi Radeon HD 4890 1GB GDDR5 / 8GB (2x4) DDR2 AMD
Member
Статус: Не в сети Регистрация: 04.06.2017 Фото: 6
ManOfSteel писал(а):
есть игры где VSYNC очень добротный и играть в 60 фпс с ним кайф...
не встречал, по мне так +33 и выше мс к базовому лагу по определению не могут быть в кайф)
ManOfSteel писал(а):
и если выше 60 он ставит всё начинает заикатся
такое бывает в некоторых играх если железо на пределе работает, например цпу под 100%, и новую подгрузку будет делать со статтером. Естественно, это всё при условии что сама игра точно не генерирует статтеры.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения