Мемbеr
Статус: Не в сети Регистрация: 13.09.2012 Откуда: Москва Фото: 19
В данной теме обсуждаются видеокарты с архитектурой RDNA 3 - AMD Radeon RX 7000-й серии.
#77
Архитектурные особенности
#77
Графические процессоры серии Navi 30 первыми в истории получили мультичиповую компоновку подобно центральным процессорам Ryzen. Однако, если в ЦП можно было наращивать количество чиплетов с вычислительными ядрами и практически линейно масштабировать производительность, то в случае с ГП не все так просто. Блоки графического процессора требуют высокоскоростного соединения с низкими задержками при «общении» между собой — по всем параметрам гораздо более превосходящего то, которое используется для соединения вычислительных чиплетов в центральных процессорах. Именно поэтому делить графический чип на такие блоки нецелесообразно. Слишком высоких задержек графика не приемлет: они неминуемо будут выливаться в заметный штраф к производительности. При создании новых графических процессоров AMD пошла другим путем. Вычислительные блоки графики остались в базовом чипе Graphics Compute Die (GCD). Из состава ГП выделили контроллеры памяти DDR6 и быстрый Infinity Cache, расположив их в более мелких чипах Memory Cache Die (MCD).
#77
Смысл от применения чиплетов такой же, как и в случае с центральными процессорами: во-первых, малые «кирпичики» чиплета имеют меньший процент брака при производстве, чем большие чипы — особенно такие сложные, как графические процессоры с десятками миллиардов транзисторов. Во-вторых, можно использовать разные техпроцессы производства для разных частей ГП. В отличие от вычислительного GCD, MCD с кеш-памятью и контроллерами DDR от более тонкого техпроцесса выиграют мало, тогда как по чуть более «толстым» нормам производить их дешевле. Третий плюс — унификация. Можно «собирать» графические процессоры разного уровня, используя одни и те же MCD при разных GCD. По слухам, будущий чип среднего уровня Navi 32 будет построен именно так. И четвертое преимущество: при налаженном массовом производстве производство чиплетных ГП должно обходиться дешевле, чем монолитных, что неминуемо должно повлиять на конечную стоимость видеокарт. Пока это не особо заметно, но стоит помнить: Navi 31 лишь первый в своем роде. Как и в случае с процессорами Ryzen 1000 серии, это только начало.
F.A.Q.
1.Как разогнать видеокарты Radeon 7000-й серии? Важной особенностью архитектуры RDNA3 является то, что разгон GPU даёт линейный прирост fps в играх до 2800 МГц. Т. е. на сколько % разогнали, столько % прирост fps в играх получили. После 2800 МГц линейность разгона теряется, и как не гони и не повышай частоты, Power Limit, прирост fps в играх составляет всего 4-5%. Об этом рассказано в этом обзоре https://overclockers.ru/blog/Vorvort/show/121115/obzor-i-testirovanie-videokarty-asrock-radeon-rx-7900xtx-aqua, раздел Нюансы разгона, где оверклокеры, с помощью множества тестов, выяснили подробности. В синтетических бенчмарках порога в 2800 МГц нет, разгон линейный на любых частотах. Обновление: у одного из владельцев 7900XTX линейный разгон в играх после 2800 МГц GPU, но для этого он разогнал GDDR6 до 2800 МГц. Так как же разогнать Radeon 7000-й серии? Хорошие результаты даёт комплексный разгон GPU и GDDR6. Например на моей видеокарте разгон GPU до 2852 МГц и GDDR6 до 2700 Мгц дал прирост fps 12% в играх, в сравнении с референсными частотами 2500 МГц GPU 2500 МГц GDDR6. Вершиной разгона является андервольтинг. Если вам удалось после разгона снизить напряжение на GPU без потери производительности - поздравляю! Вы сделали очень удачный разгон. 2. Как сделать андервольтинг? У видеокарт Radeon 7000-й серии вольтаж на GPU часто завышен с завода. Снизив напряжение на GPU в драйвере Radeon Software пользователь может уменьшить энергопотребление и нагрев видеокарты без потери производительности. Единственный нюанс - не все игры работают на сниженном для GPU напряжении. Например у меня Radeon 7900XTX в игре Baldurs Gate 3, в 4К ультра, работает на 1.05 В, а в игре Division 2, 4К, кастом настройки (тяжелее Макс.) для GPU требуется 1.12 В. Ещё одним важным инструментом андервольтинга является снижение Power Limit видеокарты. Иногда у геймера в игре очень много fps и ему не нужны избыточные энергопотребление и нагрев видеокарты. Он ограничивает в драйвере Radeon Software Power Limit видеокарты, снижая указанные параметры под нагрузкой, зачастую не теряя производительность в играх. Пользователь может сочетать оба инструмента для андервольтинга, получая отличные результаты. 3. Как решить проблемы штатной эксплуатации "воздушных" Radeon 7900XTX при перегреве hot spot? В теме были жалобы владельцев Radeon RX 7900XTX на перегрев hot spot при штатной эксплуатации. Проблема заключалась в штатном термоинтерфейсе, который выдавливало радиатором системы охлаждения. Решается она заменой штатного термоинтерфейса на термопасту с фазовым переходом. Автор F. A. Q. не несёт ответственности за манипуляции с видеокартами, пользователи делают их на свой страх и риск. 4. В каких играх Radeon RX 7900XTX показывает высокую производительность в 4К с ультра настройками? (без RTX Nvidia) 15 проектов, где 7900XTX была на равных или минимально отставала от 4090: AC: Odyssey, Far Cry 6, AC: Valhalla, Cyberpunk 2077, RDR2, CoD: MW2, Remnant 2, Hogwarts Legacy, Starfield, BG3, Immortals of Aveum, Ratchet & Clank: Rift Apart, Fortnite (DX12, HW RT, Nanite epic, Lumen epic), Horizon Forbidden West, Dragon's Dogma 2. С трассировкой лучей и высоким fps в 4K ультра на Radeon RX 7900XTX можно поиграть только в Doom Eternal, Marvel's Spiderman remaster, Far Cry 6.
Стандартная политика модерирования по оффтопику - правило "одного шага". Это значит, что отстоящее от сабжа на 1 шаг не является оффтопиком, но длительные дискуссии (глубже 2-3 ответов) переносятся в тематику.
Сабж: * Видеокарты 7000х * Производительность в играх, майнинге, бенчах * Ремонт, обслуживание, подключение, охлаждение видеокарт * Потребление, необходимый ваттаж БП и размер корпуса * Софт для настройки и иной работы с видеокартой
На один шаг (без развития дискуссии): * Видеокарты 5000-6000 и конкуренты * Приемлемость конкретного БП для карты * Сравнение прибыльности конкретного софта для майнинга * Совместимые с картой мониторы, ТВ и их режимы * "Раскрывающий" процессор (очень осторожно)
Оффтопик: * Эстетические качества игр * Морально-этические аспекты майнинга * Купленный 10 лет назад БП и его целесообразность * Личные качества участников
Обжаловать запреты можно в спецтеме.
Пользователи, которым вменен запрет на постинг в теме
Запреты добавляются по согласованию с любым модератором или после получения 2 ЖК в теме. Xennex - неопределенный срок - varg: успел задолбать 10+ участников ветки, отключен от раздела. Flw, за вброс, провокацию, ложные данные, нарушение запрета на постинг, оскорбление куратора, имитацию дизайна аватара куратора - бессрочно. RoMiLiUs, за флуд, оффтоп, провокации, оскорбления с многочисленными рецидивами - бессрочно.
Member
Статус: Не в сети Регистрация: 27.02.2009 Откуда: Новосибирск
-SPQR- писал(а):
Toxa-134 Тут такое дело. У меня Nitro+ и dq 650m голдовый. Пока из игр запустить могу только Дэд Спейс ремейк и вроде все ок. Но как только нажимаю старт Фурмарка, бп улетает в защиту.
Если судить по графикам потребления с TechPowerUp, то в начале теста есть резкий скачек потребления. У меня он около 390w и мой блок это выдерживает. Была информация, что блоки на старой платформе Seasonic уходят в защиту при таких скачках потребления. #77
Мемbеr
Статус: Не в сети Регистрация: 13.09.2012 Откуда: Москва Фото: 19
Don't Hurt Me писал(а):
Vorvort писал(а):
И там и там GP106.
конфигурации ядер разные, значит нихрена они не одинаковые, а номер это всего лишь номер
Изменение конфигурации чипа в пределах одного GPU криминалом не является если покупателей уведомили. Это как авто одной линейки но с разными двигателями. А вот когда тебе в одной линейке толкают два абсолютно разных чипа, AD104 и AD103 - это мошенничество.
у обеих: Shading Units 2048 TMUs 128 ROPs 64 Compute Units 32 RT Cores 32 Pixel Rate и Texture Rate примерно одинаковые.
но вот откуда получается FP32 (float) 10.60 TFLOPS у 6600XT, и FP32 (float) 21.75 TFLOPS у 7600?
Добавлено спустя 1 минуту 46 секунд:
Don't Hurt Me писал(а):
конфигурации ядер разные, значит нихрена они не одинаковые, а номер это всего лишь номер
конфигурацию ядер програмно настраивают после тестирования кристалла. и вот как раз сами кристаллы абсолютно одинаковые. напечатанные и выпиленные из одной "вафли".
Member
Статус: Не в сети Регистрация: 04.10.2020 Фото: 163
Toxa-134 Думаю просто купить 850w, пусть лучше будет с небольшим запасом + новый интерфейс(ATX 3.0). Пока пал выбор на Montech TITAN GOLD 850 и DEEPCOOL PQ850M.
у обеих: Shading Units 2048 TMUs 128 ROPs 64 Compute Units 32 RT Cores 32 Pixel Rate и Texture Rate примерно одинаковые.
но вот откуда получается FP32 (float) 10.60 TFLOPS у 6600XT, и FP32 (float) 21.75 TFLOPS у 7600?
Это особенность архитектуры RDNA 3, об этом в технических обзорах указывают обычно:
"Переработанные блоки Compute Unit — одно из главных нововведений. Потоковые процессоры RDNA3 впервые получили возможность выполнять две инструкции с плавающей запятой FP32 за такт при сохранении обычного темпа исполнения целочисленных инструкций INT32. Теперь один вычислительный блок CU содержит 128 блоков вычислений FP32 и 64 блока INT32 — точно так же, как один потоковый мультипроцессор SM у архитектур NVIDIA Ampere и Ada Lovelace.
При этом NVIDIA считает CUDA-ядра по количеству блоков FP32, а AMD все также продолжает учитывать именно INT32 блоки, при подсчетах которых в флагманском Navi 31 получается 6144 потоковых процессоров SP. На самом деле блоков FP32 в новой архитектуре в два раза больше — 12288. Этим и объясняется значительный рост вычислительной производительности FP32 между RX6950XT (5120 SP) и RX7900XTX (6144 SP) — 23.6 против 61.4 ТФлопс."
Member
Статус: Не в сети Регистрация: 29.04.2008 Откуда: Москва Фото: 0
ultrafx писал(а):
Потоковые процессоры RDNA3 впервые получили возможность выполнять две инструкции с плавающей запятой FP32 за такт
ultrafx писал(а):
На самом деле блоков FP32 в новой архитектуре в два раза больше
хм, а в какой примерно момент произойдет "расскрытие" данной особенности? и произойдет ли? а то в играх, даже самых свежих, двухкратного буста мягко говоря не наблюдается.
Мемbеr
Статус: Не в сети Регистрация: 15.12.2006 Фото: 83
Listoman писал(а):
Ниоткуда, 6600xt и 7600 одинаковые по производительности)
В старом ПО, которое ничего не знает про RDNA 3. Так всегда было. Первые многоядерные процессоры тоже ничего от одноядерных не отличались, потому что ПО не умели в многопоток. Так же и тут. Между условной 1650 Super и 1060 в старых играх тоже порой могла быть небольшая разница. Зато стоит запустить что-то, что активно использует параллельно FP32/INT32, как 1650 Super начинает заметно убегать от 1060. Просто потому, что 1650 Super умеет параллельно считать FP32/INT32, а 1060 только последовательно. Ситуация немного другая, но суть та же - все упирается в ПО. Всегда так было. Требуется время, пока появится свежее ПО, умеющее утилизировать новые архитектурные особенности.
Member
Статус: Не в сети Регистрация: 11.05.2009 Откуда: Тольятти
-SPQR- писал(а):
Toxa-134 Тут такое дело. У меня Nitro+ и dq 650m голдовый. Пока из игр запустить могу только Дэд Спейс ремейк и вроде все ок. Но как только нажимаю старт Фурмарка, бп улетает в защиту.
Мой 650 ватт тянет вполне
Вложения:
650 ватт тянет.png [ 6.82 МБ | Просмотров: 556 ]
_________________ Только этой зимой!RTX 3090 согреет сильнее, чем две девушки одновременно! Все это уже в прошлом 4090 согреет сильнее, чем три девушки
Member
Статус: Не в сети Регистрация: 04.10.2020 Фото: 163
F@tality С суперпозишеном в 8к проблем нет. Любой старт фурмарка вырубает комп и бп какое-то время не заводится. На прошлой 2070с такого не было. Перед установкой 7800хт я пару дней сидел на 970печ и тоже прогнал без проблем.
Мемbеr
Статус: Не в сети Регистрация: 13.09.2012 Откуда: Москва Фото: 19
Будильник писал(а):
Твоя любимая игра
Твоя наверное, я её видел только на скринах. С лучами опять результаты кидаешь? Не обидно с 60 fps играть на карте ценой в 300К? Без лучей у 4090 всё печально.
Member
Статус: Не в сети Регистрация: 08.11.2016 Фото: 0
Envу писал(а):
rx 7600 ~= rx 6650 xt. 6600 xt сливает ей
А 6600xt и 6650xt хоть как-то отличаются? Там разница мизерная, ну ок, между 7600 и 6600xt целых 3% фпс набежит иногда, но у нас тут речь про рисованные *2 тфлопс, то есть 7600 должна быть на уровне 6900xt)
Последний раз редактировалось Listoman 13.01.2024 23:34, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 23.06.2019 Фото: 0
F@tality писал(а):
Мой 650 ватт тянет вполне
Superposition не нагружает сильно, ни видеокарту, ни процессор. Этот бенч проходится на таких значениях андервольта, на которых реальные игры сразу вылетают. Не стоит ставить его в пример.
С каких пор в убогом растре разница 32% стала печальной? И зачем играть в кланка без лучей, если она на изначальной платформе вышла с поддержкой трассировки? Любитель поиграть с качеством хуже, чем играется на убогих кусках пластика за 500$?)
Member
Статус: Не в сети Регистрация: 23.06.2019 Фото: 0
Вот видите, человек задавал вопрос по блоку питания для 7800XT, но этот вопрос потонул в сраче, в котором принимал участие, в т.ч. и наш куратор.
В итоге, человек не получил ответ на свой вопрос, и наверное, подумал, что у нас тут какая-то дичь творится. И правильно подумал.
Итак, 3 недели прошло с момента назначения Сережи куратором, а ничего не изменилось. Может быть, это решение было ошибочным? Человек не справляется со своими обязанностями.
Добавлено спустя 1 минуту 48 секунд: Более того, сюда ещё пожаловал Listoman. ну вот это уже гвозь в гроб
Это ветка ни техническая, а натурально Диваны 2.0.
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения