Все прерывания делятся по следующим приоритетам: 1 место - работает на уровне кольцо -2 прерывания SMI (system management interrupt — прерывание системного управления), которое возникает: -по сигналу от чипсета или периферии на материнской плате -программный SMI, посланный системным ПО через порт ввода-вывода -запись по адресу ввода-вывода, для которого микропрограммно установлена необходимость активации SMM. 2 место - гипервизор, который работает в кольце -1 3 место - ядро операционной системы - работает в кольце 0 4 место - пользовательский уровень - работает в кольце 3
Позднее дополню каждый раздел. Все проблемы у нас связаны с тем, что windows относится к операционным системам с вытесняющей многозадачностью. Вытесняющая многозадачность требует обработки системного прерывания от аппаратного таймера. По истечении кванта времени, отведённого процессу, происходит прерывание и вызывается планировщик процессов. Частота вызова планировщика критична: слишком частый его вызов будет расходовать процессорное время впустую. Единственное, что мы можем изменить - это увеличить время кванта и поменять соотношение квантов времени на активную задачу и задачи в фоне, за это отвечает параметр в реестре Win32PrioritySeparation По умолчанию 0х26 квант 18:6 = Оптимальный вариант При этом само время кванта зависит от системного таймера. При системном таймера 15.625 мс оно будет больше, чем при 1.0 мс. Высчитывается время системного таймера * тики. 1 тик= 3 кванта Для системного таймера 0.5 мс фону тогда буде даваться 0.5мс*6/3 = 1мс из каждых 4 мс. При 1 мс - 2мс из каждых 8мс. При 2 мс - 4мс из каждых 16мс. Для борьбы с фризами оптимально выставить системный таймер 0.5мс.
SMI-прерывания зависят от BIOS/UEFI и оборудования. Отключаем все лишнее, отключаем энергосохранение, скорость вентиляторов фиксируем, это все, что мы можем сделать. В нашем плане энергосохранения выбрать оценка для поднятия частоты вместо 15 мс максимум 5000 мс. Есть программа Intel SMI Latency Checker Для гипервизора - отключаем поддержку виртуальных машин в биосе.
Про прерывания на уровне ядра и пользователя в windows.
В Windows применяется: - для x86 - 32 уровня IRQL от 0 до 31 (в скобках указано числовое значение): High (31) Power fail (30) IPI (29) Clock (28) Profile (27) Диапазон аппаратных прерываний, называемых Devices IRQL, или DIRQL (от 26 до 3) или ISR DPC/DISPATCH (2) APC (1) PASSIVE (0) Это означает, например, что планировщик (работающий на уровне DPC/DISPATCH) может быть прерван аппаратными прерываниями, межпроцессорными прерываниями (IPI) и т. д., но не может быть прерван асинхронными процедурами (APC) и обычными потоками, работающими на уровне PASSIVE. Межпроцессорные прерывания IPI могут быть прерваны сбоем электропитания (прерывание на уровне Power fail), но не могут быть прерваны обычными аппаратными прерываниями от устройств и т. д. - для х64 16 уровней IRQL (от 0 до 15) High/Profile (15) Interprocessor interrupt/Power (14) Clock (13) Synch (12) Device n (11) ......... Device 1 (3) Dispatch/DPC (2) APC (1) Passive/Low (0)
При этом: hardware interrupts 3-15 (3-31) software interrupts 1-2 (1-2) normal thread execution 0 (0)
Наш пользовательский процесс может иметь следующие приоритеты: Idle - 4 Below Normal - 6 Normal -8 Above Normal -10 High -13 Real-Time -24 Внутри процесса мы можем задать приоритет для его потоков: Idle дает итоговый приоритет процесса с потоком 1, кроме real-time, там он его просто снизит до фиксированной 16 Lowest -2 Below Normal -1 Normal 0 Above Normal +1 Highest +2 Time Critical +7
Итоговый приоритет потока - это сумма приоритетов процесса и потока. 31 - максимум Real-Time - от 16 до 31. При этом даже максимальный 31 приоритет не лает нам возможности подняться выше уровня Passive/Low(0), поэтому любое прерывание на нашем ядре прервет нашу программу.
Борьба с прерываниями. Бороться надо двумя путями. Первый путь - уменьшить само количество прерываний=их частоту. Частота прерываний за 1 секунду до 10000 считается еще неплохой. Второй путь - уменьшить длительность прерываний. Есть еще третий путь - освободить от прерываний нужные нам ядра.
Первое и самое главное. Установка максимально облегченной и очищенной системы. Если хватит windows 10, то лучше ставить ее. 23H2 лучше, чем 24Н2. Отключить динамический таймер. Поднять, а не снизить время для системного таймера до 15,625 мс! Если снизим до 0.5 мс, то увеличим количество прерываний. Но тут вступает в действие многозадачность винды. 1/4 времени отдается фоновым процессам. Минимум - это 6 тиков=2 кванта Полностью вырубить все фоновые процессы на винде мы не сможем. Для 120 кадров нам нужно иметь перерыв не больше 1/120=8.(3) мс. Поэтому подходит время для системного таймера только 0.5 мс /1 мс и условно 2 мс , так как 2 мс*2=4 мс. Внести в реестр для глобальной настройки системного таймера [spoiler=] [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\kernel] "GlobalTimerResolutionRequests"=dword:00000001"
Отключить VSYNC. Включить тройную буферизацию если процессор успевает рендерить, то компенсирует воемя двух кадров: 2*1000 мс / частоту кадров в Гц Краткий список исследований по психофизиологии: Watson (1986): Задержки <5 мс незаметны. Kelly (1979): Порог фликера <2 мс. Burr & Ross (1982): 10% кадра = 100мс/частоту кадров (при движении). Clayton (2018): 1–2% кадров= 1000мс*процент пропуска кадров (10–20 мс/с) незаметно. Carrasco (2011): <5–10 мс при внимании. Hoffman et al. (2017): <3 мс с размытием. Swafford et al. (2016): <4 мс, 2% (20 мс) при редких фризах (реже 1 раза в секунду). Digital Foundry (2025): 0.125 фриза/с=0.125*1000мс/частоту кадров Гц) заметно при частых повторениях.
Для 120 Гц: 1982-0.833мс 2025-1.042мс
Снизить частоту опроса мыши до 125Гц.[/spoiler]
Главные правила для таймеров: Таймеры используются для времени (QPC) и для системных прерываний=тиков.
useplatformclock disables TSC and uses the platform source clock instead (HPET or PMT). PMT is used when HPET is disabled in BIOS. useplatformtick disables TSC tick and uses the platform source tick instead (RTC). Does disabledynamictick work when useplatformtick is used? No, it does not do anything since RTC is not a dynamic tick counter.
При этом возможны разные комбинации таймеров.
TSC + TSC without desync: bcdedit /deletevalue useplatformclock - bcdedit /deletevalue useplatformtick (make sure HPET is enabled in BIOS) TSC + RTC: bcdedit /deletevalue useplatformclock - bcdedit /set useplatformtick Yes HPET + RTC: bcdedit /set useplatformclock Yes - bcdedit /set useplatformtick Yes (make sure HPET is enabled in BIOS) PMT + RTC: bcdedit /set useplatformclock Yes - bcdedit /set useplatformtick Yes (make sure HPET is disabled in BIOS) Частота HPET 14.318180 MHz, в 4 раза выше частоты ACPI PM Timer. RTC устаревший тайминг с частотой от 2-х до 8192 Гц. Использует кварц 32.768 KHz HPET требует больше времени на вызов, чем TSC или PM Timer, но это важно только для системных прерываний. HPET и PM timer находятся в южном мосте. TSC в процессоре. Поэтому вполне допустима комбинация HPET (для времени QPC)+TSC (для тиков).
bcdedit /set useplatformtick no (отключаем RTC и включаем TSC для тиков) bcdedit /set useplatformclock no (отключаем HPET и включаем TSC для времени QPC) bcdedit /set disabledynamictick yes (отключаем динамическое изменение частоты системного таймера - влияет только на тики) bcdedit /set tscsyncpolicy Enhanced (включаем улучшенную синхронизацию TSC-таймера) HPET не следует отключать в биосе и в диспетчере устройств. Посмотреть текущую конфигурацию можно с помощью команды bcdedit /enum
Обсуждение проблем ОС и оборудования: задержка реакции системы (latency), микроcтаттер, инпутлаг, фризы.
Перед тем как задавать вопросы, просьба прочитать FAQ
Осуществлять мониторинг программойLatency Monitorнужно в течение 1 минуты, в состоянии простоя системы т.е. без дисковой, сетевой активности, и любой другой, с выключенным ав и приложениями в трее и автозагрузке, не раньше чем через 2 минуты после загрузки системы. Не двигаем мышку и не используем клавиатуру в момент измерений. Потом остановка и скриншот.
Member
Статус: Не в сети Регистрация: 16.05.2010 Откуда: Ленинград Фото: 545
Mikanoshi писал(а):
Это не моя логика, точно так же с чего вдруг 2-3мс это показатель проблем?
Разговор был о высоких задержках в Ос. и что это можно использовать для диагностики,аппаратных проблем,драйверов или Ос
Mikanoshi писал(а):
где после 10 минут рубилова в думе макс задержка дров нвидии 0.088 мс. В то же время в других играх 2-3мс и полоска красная, но нигде нет никаких фризов.
"Задержка дров нвидии",нет такого параметра)),или критерия оценки-есть величина при работе с драйвером,сама по себе видеокарта не работает без софта,ядра Ос, и другого оборудования. Скачки эти отражают джиттер частот видеокарты и шины pcie-ex. Всего оборудования Пк. На уровне гпу и драйвера это- рефреш окна,переменная нагрузка, и так далее. То-что Нвидия пилила фикс-они пилили свой режим "оптимальный",в котором ренедр Gui в ос упрощается,меньше рефреша и данные дублируются из буфера. Причина такого поведения-жадность хуанга и паскаль(gpu boost 3.0),что пытаются исправить или уменьшить негатив драйверами.
Добавлено спустя 2 минуты 2 секунды:
DoomBuster писал(а):
Если без в-синк, то это как бы тиринг, а не фризы
На нвидия он традиционен без всинк,особенно заметен на паскале по очевидным причинам.
Member
Статус: Не в сети Регистрация: 09.03.2008 Фото: 4
Да еще по роликам с ютьюба, скорее всего они сделаны шадоуплеем, а он иногда косячит. В игре все плавно, идет запись, потом при просмотре такая ерунда с видео, нормально не захватывает. Не стал разбираться, как и многие, давно когда то занимался фрапсом, сейчас чисто для интереса попробовал шадов - сырой как по мне.
Member
Статус: Не в сети Регистрация: 20.06.2010 Фото: 29
Mikanoshi от игры очень сильно зависит! я же не говорю что у меня везде фризы прям. Нормально играется в основном, но в онлайн шутеры, где нужна скорость реакции и фпс 100+ это очень хорошо видно, а ГТА5 я для примера привел потому что на него миллион видео в ютубе и там тоже видно лаги. Одиночная карта дает задержку около 0.8мс.(а иногда и 2-3мс как человек выше писал) две карты в сли дают уже 1.6, но это не проблема СЛи. тк на одиночной карте тоже самое просто менее наглядно, поэтому многие и не жалуются. Я сейчас играю на СЛИ в 4к разрешении с 300ФПС в игру overwatch а кто то играет на 1 карте в ведьмака с 60 фпс с Всинком, вот и не видит этого. Но не должна быть задержка даже на одиночной карте такая высокая. Это фризы и подлагивания будут
_________________ 14900k 6.2Ghz DDR5 8400 CL36 RTX 5090 WATER COOLING 3300Mhz/34000Mhz. Наш телеграмм канал https://t.me/game_2hard
Последний раз редактировалось Alzov 19.12.2016 18:49, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 16.05.2010 Откуда: Ленинград Фото: 545
Alzov писал(а):
Ну естественно в играх. в ОС у меня везде там почти нули. проблема именно в играх.
Если меряется с альтабом одно дело а если в окне такое-да что-то не то,так понимаю у вас монитор по дисплей порту подключен,а какой там рефреш и частота опроса пикселей?-есть ли масштабирование картинки драйвером? Попробуйте на бюджетном мониторе и dvi проверить. другие есть подключения?
Тут по пунктам: профиль"Высокая и Максимальный"-если сохраняются скачки-,обновляете биос,и настраиваете питание,опорные частоты- фапч(в llc),спред цпу и шин выключаете и pciex принудительно в 3.0 и отрубаете не нужные контроллеры. Не поможет -значит очевидно софт Ос+драйвер или условия эксплуатации.
Вот вы поменяли таймер и всё наладилось,но на интел и так поидее проблем с tsc быть не должно. Говорит о том что виновник сторонний драйвер или конфигурация с условиями. Если речь о динамическом тикрейте,она вызывала проблему на ранних билдах-тут хз где искать-материнка или драйвер сторонний.
Member
Статус: Не в сети Регистрация: 30.05.2009 Фото: 0
NFS
#77
Crysis3
#77
1280x1024 в нфс вертикальная синхронизация вкл., всё настройки на макс, быстрая синхронизация в дровах и там и там включена. Нфс фризит микро не микро тупо падает фпс и не слабо так падает) В крайзисе вроде всё нормально, по крайней мере фпс стабильный, если и есть какие-то микрофризы возможно я не замечаю.
Никакой режим максимальной производительности ставить не собираюсь, очень доволен картой как она сбрасывает частоты. Например поставил в слабой по графике игре лок на 75 фпс, в итоге частота всего 1000 Мгц)
_________________ Никто не сможет спрятаться от правды. И ничто не остановит то, что грядет. Ничто.
Последний раз редактировалось wolfire 19.12.2016 19:09, всего редактировалось 2 раз(а).
Member
Статус: Не в сети Регистрация: 20.06.2010 Фото: 29
kiberman Вот нвидиа проблему то признает только ниче не делает. Поидее можно по гарантии карты возвращать, вот НВидиа пишет что больше 2мс не должно быть в драйвере нигде. и якобы они фиксили, что бы было 0.2мс Download the Nvidia GeForce GameReady 368.95 Hot Fix driver as released by NVIDIA. Some users have reported high latency issues (Deferred Procedure Call)with their GeForce series 10 graphics cards. Nvidia released a hotfix driver to address that issue. The new Geforce driver 368.95 hotfix is dedicated to solve that DPC latency problem, other new features, enhancements, or bug fixes are not in there. The driver seems to do it's job as users report improvements of coming from more than 2,000ms to less than 200 microseconds. The driver is offered exclusively for 64-bit operating systems for Windows 7, 8.1 and 10. This is GeForce Hot Fix driver version 368.95 that addresses the following: Fixed DPC latency bug on Pascal GPUs. Buid version - R368.95 (r368_81-5) / 10.18.13.6895 (7-20-2016) We have a discussion thread open on these drivers right here. Your choice in supported products for this driver are Сейчас качаю этот старый драйвер с хотфиксом попробую установить
Добавлено спустя 59 секунд: kiberman Провал полный эти паскали. Глючное поделией, БИОС досих пор не дали редактировать!! Где это видано то!
_________________ 14900k 6.2Ghz DDR5 8400 CL36 RTX 5090 WATER COOLING 3300Mhz/34000Mhz. Наш телеграмм канал https://t.me/game_2hard
Member
Статус: Не в сети Регистрация: 24.10.2010 Фото: 1
Olegdjus писал(а):
Всё плохо?
Да. Что-то я не видел мониторинга DPC в реальном времени, и что при тормозах время выполнения увеличивается. Так что причину сначала определили бы правильно, прежде чем бежать жаловаться на дрова.
Member
Статус: Не в сети Регистрация: 30.05.2009 Фото: 0
Olegdjus писал(а):
Вообще никаких оптимизаций не делал.
Откуда такие цифры? У меня в простое 4 квдартика набегает, значит дело скорее всего не в дровах, а где-то в самой винде или нет? Только у тебя ndis.sys, а у меня или это зависит от задач?
_________________ Никто не сможет спрятаться от правды. И ничто не остановит то, что грядет. Ничто.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 8
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения