RTX 5090 (NVIDIA GeForce GB202 Blackwell 4nm)

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 03.11.2025 13:50

Сообщения без ответов | Активные темы

Список форумов » Тематические форумы » Видеокарты

Часовой пояс: UTC + 3 часа

Модераторы: Kopcheniy, fedx

Куратор(ы): YakovDolgorukiy

Новая тема /

Ответить

Сообщений: 4097 • Страница 18 из 205 • < 1 ... 15 16 17 18 19 20 21 ... 205 >

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Varg

Добавлено: 07.01.2025 11:19

[профиль]

Community Manager
Статус: Не в сети
Регистрация: 30.12.2004
Откуда: У зайца яйца

ТЕМА ТОЛЬКО ОБСУЖДЕНИЯ ВИДЕОКАРТ NVIDIA GeForce RTX 5090
(а также RTX Pro 6000)

#77

1. Технические характеристики: techpowerup.com

2. Характеристики отдельных моделей и обзоры:

2.1. Ссылка на сравнительную таблицу версий 5090: docs.google.com

2.2. Обзоры:

3. Полезные утилиты:
GPU-Z - бесплатная прикладная программа для отображения технической информации о видеоадаптере (видеоконтроллере/видеокарте/видеомодуле).
MSI Afterburner - одна из самых популярных утилит для тюнинга видеокарты.
NVFlash - программа для прошивки BIOS; использовать с осторожностью; только для опытных пользователей.

4. Коллекция БИОСОВ от TechPowerUp:
-верифицированные
-неверифицированные

5. Снижение энергопотребления:

5090 обладает хорошим потенциалом для снижения энергопотребления при минимальном влиянии на производительность.
В отдельных случаях производительность может быть немного лучше стоковых значений.
Основная цель данного процесса – повысить эффективность энергопотребления ВК при минимальном влиянии на производительность относительно заводских настроек.

ВАЖНО:
Любые манипуляции со значениями частот/напряжения могут приводить к нестабильности.
Необходимо все тщательно тестировать и держать в уме, что даже хорошо протестированная кривая частот/напряжения может «вылететь». На мой взгляд, данный риск оправдан, т.к. речь в 99,99% случаев идет про игры.
Необходимость в снижении энергопотребления таким способом вы определяете самостоятельно. Не следует делать его по принципу "все побежали и я побежал".

Отличный материал по теме:
- YouTube (оригинал) / пост автора видео на reddit
- Rutube (перезалив)

6. Полезная/интересная информация от опытных участников конференции:

Alex TOPMAN: оптимизация кривой частоты/напряжения в MSI Afterburner

В процессе спора про корректность использования понятия "андервольт" (в том или ином контексте) камрад Alex TOPMAN выдал полезную информацию о связи частоты/вольтажа.

Оригинал сообщения (рекомендуется к прочтению): ссылка

Отредактировано, чтобы читалось как самостоятельное сообщение:

Цитата:

Кривая у видеокарт придумана для того, чтобы работать на разных частотах с разным вольтажом в разной по величине нагрузке.
Нет никакой ОДНОЙ стоковой частоты. Для каждого шага напряжения - СВОЙ потолок частоты.
И на заводе всем точкам кривой присвоен далеко не потолок частоты, а некая середина, на случай любых плохих условий охлаждения, вроде душного корпуса. Задача оверклокера - найти и выставить свой потолок частоты для ВСЕХ точек кривой.
Не оптимальный подход, хоть он и имеет право на жизнь - это ограничиваться "выставлю для всех случаев 2900 и типа мне хватит".
Для того, чтобы выставить этот потолок - есть программа MSI Afterburner и инструмент редактирования кривой напряжение/частота.
Выбираем точку с нужным напряжением и тащим вверх (или вниз, если даже в стоке карта перегревается в душном корпусе) частоту. Не наоборот! Точку с напряжением можно лишь выбрать. Также выбирает и сама карта ту точку, которая соответствует нагрузке, чтобы вписаться при этом в PL. Например, попробовала запустить Киберпанк на 3000 с напряжением 1в (цифры примерные), упёрлась в PL, переключилась на следующую вниз точку, где уже 0,975в и частота 2985. И т.д. (это за доли секунды всё делается), пока ей не удастся вписаться в PL. Наивный "оверклокер" при этом считает, что карта у него настроена именно на 3000 (как он хотел и нарисовал в курве), но "почему-то" по факту работает на -200 (потому что не держит в такой нагрузке). О чём после этого и пишет здесь на форуме, что "раньше такого не было" и "он не знает почему так" (а надо было сесть и разобраться, как следует). А если занизить частоту для этой игры, то в другой, более лёгкой - карта "будет задушена".

Пошаговая инструкция по оптимизации кривой для увеличения производительности (на базе поста и лс) :

0. Необходимо задрать левую часть кривой повыше - выбираем любую крайнюю правую точку, зажимаем Ctrl и тянем вниз, тем самым поднимая левую часть кривой.
Без разницы, за какую точку тянуть, но здесь лучше задрать самую левую часть повыше (но, карта всё равно будет сбрасывать её до некоего потолка, который на кривой превысить просто не получится).
90% обычных пользователей обойдутся без опционального пункта 0 и будут двигать всю кривую только альтом.
Но, тех, кто захочет выжать из карты побольше потенциала, ждёт ловушка из-за небольшой дельты запаса потенциала в правой части, по сравнению с левой.

1. Выбираем любую точку, зажимаем Alt и поднимаем всю кривую пока в какой-то точке не потеряется стабильность.
Стабильность в каждой точке тестируем прогоном ОССТ 3D Adaptive с настройкой от 10 до 100% с шагом 10%, смена шага через 20 секунд (не меньше, но можно и дольше - по желанию).

2. После того, как курва предельно поднята, но все точки частота/напряжение сохраняют стабильность (=успешно прошли весь указанный выше ОССТ тест),
нам достаточно пристреляться лишь по верхней точке (показываемые частота/напряжение при 10% нагрузки в тесте) и нижней (100% нагрузки) - на остальных точках стаб мы получим автоматом в 95% случаев (если не ковыряли отдельные точки вверх руками).
"Пристреляться" = поднял всю курву через альт или погнул её через ctrl - потестировал. Тест проходит - поднял/погнул ещё. Нашёл, где стабильность потерялась - опустил всю курву до стабильного значения "нестабильной" точки и запомнил её - её больше превышать нельзя. Далее пробуем гнуть противоположную часть кривой, чтобы понять, какой запас остался там.
Другими словами: цель = найти нестабильную частоту для напряжения 1,1в (у кого-то 1,075в или около того и выше не поднимется) в тесте 10% нагрузки и спустить её на 15-30 МГц до стабильности. Запомнить. Затем найти такую же точку при 100% нагрузки (например, у кого-то это будет 2400 и 0,85в). Запомнить. Далее, нужно минимально простыми манипуляциями со всей курвой целиком поднять и наклонить всю кривую так, чтобы она проходила через две точки, что мы ранее запомнили.

3. После этого можно ещё дополнительно залочить по кнопке L любую желаемую максимальную точку (сам я ставлю L на точке 1.1в) - для гарантии. А чтобы карту в моменте не бустили ещё выше какие-то её внутренние алгоритмы, можно через выделение с шифтом всех точек далее L вместе с точкой L, выровнять их в ровное плато: выделяем, жмём шифт-ентер на первой (левой, которая у меня L) из выделенных точек, видим значение её частоты (нашего будущего потолка) с возможностью её редактирования ручками, жмем просто ентер (="применить значение для всех выделенных точек"). Остальные точки сами выровняются по введённому значению. И тогда даже сняв лок по L, частота в нагрузке уже никогда не уйдёт выше выбранной нами верхней желаемой частоты и минимального по курве напряжения для неё.

Видео от Алекса (просто пример, какие инструменты нам понадобятся, чтобы достичь результата минимумом действий): https://youtu.be/wzc85dbfpnM?feature=shared

Если требуется, можно дружно попросить записать Алекса более подробное видео, где будет симулирован весь процесс настройки у рядового юзера.

ВАЖНО: Вы можете задаться вопросом: а зачем оно мне надо, если "ползунковый" разгон у меня прекрасно работает. Ответ: работает - не трогай! Но если хочется глубже изучить тему и выжать максимум, то это хорошая отправная точка.

Alzov: кастомное водяное охлаждение для 5090

Дисклеймер:
1/ длительное обсуждение водяного охлаждения для 5090 является оффтопом, для этого есть отдельная тема;
2/ к сожалению, особенности личности камрада Alzov несовместимы с правилами этого форума, поэтому он забанен. Тем не менее, отрицать наличие у него определенных компетенций глупо. Свои вопросы, если они появятся, вы можете задать в его тг канале.

ВОПРОС: ссылка на сообщение

frmreg писал(а):

Alzov писал(а):

Карта стоит 300-400к рублей, что так сложно водоблок с алишки взять за 16к+ радиатор медный за 10к и помпу с резом за 15к? И играть как человек, а не в даунвольте с -фпс.

Для неподготовленного юзера это непросто, учитывая что все поколения карт до этого нормально работали на воздухе и не требовали водянки.

Напиши плиз конкретные модели деталей и материалов для кастомной водянки чисто под 5090, без добавления проца в контур.

Понятно, что водоблок будет от Alphacool, а дальше что брать?

- какие фитинги для удобного и надежного монтажа?
- трубки?
- помпу (чтобы не шумная)?
- радиатор?
- и воду для залива?

Нужны конкретные брэнды и модели, желательно со ссылками, чтобы прямо сейчас пойти и заказать тем, кто не имел с этим дел ранее.

Я так понимаю, будет безопаснее сначала собрать и протестировать саму водянку на предмет утечек, и только потом цеплять ее на карту.

ОТВЕТ: ссылка на сообщение

Alzov писал(а):

frmreg А вот это грамотный вопрос, на портале по разону, на такой вопрос я конечно же отвечу без троллинга.
1) Берешь водоблок с алишки, топ европейские бренды, альфакул, ЕКВБ, либо ватеркул, можно букски взять конечно но не рекомендую.
https://de.aliexpress.com/item/1005008892734892.html?spm=a2g0o.productlist.main.7.4c565ad1Fb6JvP&algo_pvid=74633a1d-5b39-4857-ab26-6cd0b8c83a04&algo_exp_id=74633a1d-5b39-4857-ab26-6cd0b8c83a04-6&pdp_ext_f=%7B%22order%22%3A%2211%22%2C%22eval%22%3A%221%22%7D&pdp_npi=4%40dis%21EUR%21286.99%21281.99%21%21%21327.95%21322.24%21%402101c80217512009656933774e9d9c%2112000047101813147%21sea%21DE%210%21ABX&curPageLogUid=GQQgGdOniFNj&utparam-url=scene%3Asearch%7Cquery_from%3A
Либо в России из наличия.
https://www.evopc.ru/catalog/vodobloki/vodobloki_gpu/vse_vodobloki_gpu/36909/
2)Радиатор минимум один медный хороший 360мм толщиной хотя бы 45мм, если корпус позволяет можно толще взять радиатор, в стандартный большой корпус обычно минимум 2-3 штуки помещаются, весь пк можно на воду сразу перевести. Минимум 1 радиатор.
Например
https://www.onlinetrade.ru/catalogue/aksessuary_dlya_svo-c4040/watercool/radiator_dlya_svo_watercool_heatkiller_rad_480_l_white_24119_24119_watercool-3518709.html
3)Помпа сразу с резервуаром для заливки. Д5 оригинал+любой рез.В ДНС например.
https://www.dns-shop.ru/product/ef3009760a273330/rezervuar-s-pompoj-dla-szo-thermaltake-pacific-pr22-d5-cl-w082-pl00bl-a/
4)Фитинги, шланги, бери сразу нормальные EPDM шланги черные, мякие, и фитинги под их размер. Если шланг 10/13 то и фитинги 10/13 если шланг 10/16 то и фитини 10/16
Хорошие дешевые фитинги, на озон. Тебе потребуется на каждый элемент СВО по 2 штуки. Т.е на каждый радиатор, водоблок итд по 2 штуки на каждый элемент.
https://www.ozon.ru/product/komplekt-fitingov-monsoon-16-10mm-six-pack-green-1556445677/?at=08tYn4xnqcl2JV7msOZ214Kh7M1l5vs48YQzBivNqZBm
Это облегченные фитинги, которые не давят весом, если например на оперативку или SSD воду поставишь.
ШЛАНГИ
https://www.evopc.ru/catalog/shlangi_i_trubki/shlangi/36692/
Это основа, база, БЕЙЗ.
Сам по себе контур СВО достаточно надежен, даже если собирать пьяным, под пиво, коньяк, я осуждаю сборки в не трезвом виде. Неподготовленный человек( любовница 18 лет) собирает кастом сво на видеокарту за 1.5-2 часа. Подготовленный человек собирает если чисто на видеокарту минут за 30.
В комплекте к водоблоку уже есть нарезанные термопрокладки нужных размеров и инструкция в картинках, для самых маленьких, паста тоже в комплекте. Для 5090 можно на пасте водоблок ставить, дельта ВОДА-ЧИП будет 16-17 градусов примерно, на ЖМ будет чуть лучше, на пару градусов, но оно не стоит того, т.к водоблок н никелерованный а хромированный то жм будет расходоваться с образованием интерметалидов, жм придется со временем добавлять, + нужно будет СМД элементы лаком закрывать, поэтому рекомендую 5090 на воде на пасте собирать. В играх будет 45-50 градусов при обычно воде без экстрима.
Если прям страх есть( а не должно быть) что протечет что-то есть тестер утечек от EKWB
https://www.dns-shop.ru/product/94cd5cdef6db3332/tester-dla-proverki-na-tec-ekwb-ek-leak-tester/
Накачиваешь и смотришь, стравливает где-то или нет, если хотя бы 0.5 бара держит то в целом уже нормально. Оно и на меньшем давлении ничего не течет, водоблоки то акрил в основном, много давить не нужно туда по давлению.
Так же первый старт можно делать без старта ПК, отключаешь БП от материнки, видеокарты итд, подключаешь только помпу, замыкаешь на 24 пин 3и4 пины или 4 и 5 пины(PS_ON на GROUND) либо пользуешься от комплекта СВО готовой пластиковой штукой которая позволяет включить БП без компа и проверяешь.
По жидкости, можно лить дисцилят, но он зацветет, особенно в южных регионах на солнце за 6-12 месяцев, цветет это не когда вода зеленая, а белая прозрачная слизь. Поэтому лучше лить дисцилят с присадками. Есть надежный вариант с сроком службы 10 лет. Называется ТЕРМАГЕНТ.
Вот такой зеленый он безопасный на пропиленликоле.
https://thermagent.ru/produkcija/thermagent-20-s-jeko-kopirovat/
Если есть еще вопросы можешь в телегу нашу писать.

7. Участие в теме запрещено для:

Michailovsky - бессрочно
Антон_Мск - до 06.11.2025
Бозеп - до 03.12.2025

___________
ОТ КУРАТОРА:
1. Шапка будет дополняться по мере необходимости;
2. Основная цель кураторства - не допускать балаган в теме. Общаемся, спорим, состязаемся в остроумии, но без оскорблений. Бессмысленный оффтоп* будет удаляться;
3. Если кто-то хочет поделиться полезными материалами по теме (за своим авторством или за авторством других людей), то пишите мне в ЛС - информация будет добавлена в шапку.

*про оффтоп (обязательно к прочтению)

Varg писал(а):

Стандартная политика модерирования по оффтопику - правило "одного шага".
Это значит, что отстоящее от сабжа на 1 шаг не является оффтопиком, но длительные дискуссии (глубже 2-3 ответов) переносятся в тематику.

Последний раз редактировалось YakovDolgorukiy 03.11.2025 0:57, всего редактировалось 20 раз(а).

Реклама
Партнер

Slumber

Добавлено: 23.01.2025 21:40

[профиль]

Member
Статус: Не в сети
Регистрация: 18.12.2018

DemonAk писал(а):

инженер nvidia говорил что белые термопрокладки хорошо себя зарекомендовали поэтому суют их начиная с 30й серии:D

надеюсь что это просто потому что реф SFF-Ready)

-SPQR-

Добавлено: 23.01.2025 23:57

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 04.10.2020
Фото: 162

Slumber писал(а):

NVIDIA has removed the "Hot Spot" sensor

Судя по тому что щас(тесты сегодняшние) показали это неудивительно.

#77

_________________
CP2077 mfg test: Антифанатская 2.0 #18495886

mike-lesnik

Добавлено: 24.01.2025 0:07

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 15.09.2008
Фото: 0

тесты с даунвольтингом где-нибудь были?

_________________
8ulleTin

Hermes_Conrad

Добавлено: 24.01.2025 1:03

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 04.05.2024
Фото: 22

mike-lesnik писал(а):

тесты с даунвольтингом где-нибудь были?

Зачем даунвольт? Вы не понимаете, это два в одном: ВК и обогреватель! :good:

Для наглядности обратился к помощи ИИ: :good:

5090 от ИИ

Вложение:

5090 от ИИ.png [ 1.05 МБ | Просмотров: 1092 ]

_________________
https://valid.x86.fr/vynwaz

Garik14

Добавлено: 24.01.2025 1:08

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 28.04.2012
Откуда: Москва
Фото: 31

Ожидаемо все, нет конкуренции, нет нормального топа. Разгон наверно два коннектора и кастомный водоблок потребует

хотя тема андервольта нераскрыта
Уже немного раскрыта
https://www.reddit.com/r/hardware/comments/1i8emnz/rtx_5090_undervolting_results_6_at_400w/

_________________
Z690 TUF/14700K DELID+LM5.5/4.3/4.9/ALF III 360 PRO/64Gb@4133CL18/MSI RTX4080S/RMx650W/ TT CORE P3 PRO

Varg

Добавлено: 24.01.2025 1:17

[профиль]

Community Manager
Статус: Не в сети
Регистрация: 30.12.2004
Откуда: У зайца яйца

Файлы нового DLSS4,
https://www.reddit.com/r/nvidia/comment ... patch_221/
https://disk.yandex.kz/d/w863QHxt-okDQw

_________________
Мы же не в море. Не на острове посреди океана.

Винни-Пух

Добавлено: 24.01.2025 1:30

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 24.04.2007
Откуда: и куда?
Фото: 7

Varg писал(а):

Файлы нового DLSS4,
https://disk.yandex.kz/d/w863QHxt-okDQw

Вложение:

Screenshot_2.jpg [ 25.52 КБ | Просмотров: 1071 ]

Добавлено спустя 19 минут 32 секунды:

Varg писал(а):

DLSS4

Выглядит и правда неплохо.

_________________
13700К/Z790/32GB/990 PRO/RTX 4080/G6/7XL/AG271QG 165Hz G-sync

mike-lesnik

Добавлено: 24.01.2025 2:50

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 15.09.2008
Фото: 0

Garik14 писал(а):

Уже немного раскрыта
https://www.reddit.com/r/hardware/comme ... 6_at_400w/

Ну вот, -6% фпс и -30% потребления, прекрасный результат! Значит не совсем печка получилась, просто на чип подают излишне завышенное напряжение.

_________________
8ulleTin

Винни-Пух

Добавлено: 24.01.2025 2:52

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 24.04.2007
Откуда: и куда?
Фото: 7

mike-lesnik писал(а):

-6% фпс

Это прям мем опасный поцик на операции обрезания: вы куда режете, тут и так мало!

_________________
13700К/Z790/32GB/990 PRO/RTX 4080/G6/7XL/AG271QG 165Hz G-sync

stockclock

Добавлено: 24.01.2025 3:35

[профиль]

Member
Статус: Не в сети
Регистрация: 06.01.2015

Эта карта создана для ИИ большей частью, 32ГБ об этом красноречиво говорят. В этой области главное это объём и скорость памяти. К тому же добавили FP4 под нейросетки, в этом плане она в разы быстрее 4090. Она создана под то что будет актуально через пару лет. Поэтому стоит смотреть на неё либо как на инвестицию под новые ИИ фичи, либо ждать RTX 6090, когда эти фичи уже внедрят. Главное тут не пытатся экономить и покупать 16 гиговые карты - это ещё больший развод на бабки чем 5090.

Varg

Добавлено: 24.01.2025 4:35

[профиль]

Community Manager
Статус: Не в сети
Регистрация: 30.12.2004
Откуда: У зайца яйца

В картах для ИИ памяти нужно еще больше. У нвидии будет отдельная, уже спеки показывали.
https://www.youtube.com/watch?v=8USdZsSzn0E

stockclock писал(а):

К тому же добавили FP4 под нейросетки, в этом плане она в разы быстрее 4090.

Ни одна промышленная нейросеть не использует FP4. В этом плане чистая подтасовка цифр.

_________________
Мы же не в море. Не на острове посреди океана.

stockclock

Добавлено: 24.01.2025 5:38

[профиль]

Member
Статус: Не в сети
Регистрация: 06.01.2015

Varg писал(а):

В картах для ИИ памяти нужно еще больше. У нвидии будет отдельная, уже спеки показывали.

2500 - интересно, а вот 4000 баксов за 64Гига уже нет. Теперешные нейросетки умеют использвать несколько ГПУ. Проще две 5090 купить и получить те же 64 гига, но уже с двойной производительностью и продать такое будет проще.

Varg писал(а):

Ни одна промышленная нейросеть не использует FP4. В этом плане чистая подтасовка цифр.

Я имею ввиду что это карта с ориентировкой на ИИ для десктопа, а здесь FP4 - это стандарт, потому что памяти мало. Речь идёт о языковых моделях, ИИ в играх, различных генераторах картинок, видео, ассистентах для программирования, собственнных голосовых помощниках способных что-то делать на ПК, искать в сети и т.д. тот же Copilot от МС уже существует. Такого плана вещи скоро будут повсеместно встраивать в софт. 5090 тем и хороша что она и в играх ничё и памяти накинули, а Titan если выйдет с теми параметрами что в таблице - это уже реально чисто профессиональная железка, а не универсальная.

Varg

Добавлено: 24.01.2025 8:59

[профиль]

Community Manager
Статус: Не в сети
Регистрация: 30.12.2004
Откуда: У зайца яйца

stockclock писал(а):

Я имею ввиду что это карта с ориентировкой на ИИ для десктопа, а здесь FP4 - это стандарт, потому что памяти мало.

Приведешь несколько примеров этого "стандарта", то есть использующих FP4 ИИ-приложений для десктопа?

Термин "промышленные" в айти не связан со станками и заводами, а всего лишь означает стадию жизненного цикла ПО, когда оно закончило все беты и пре-релизы.

stockclock писал(а):

Теперешные нейросетки умеют использвать несколько ГПУ. Проще две 5090 купить и получить те же 64 гига, но уже с двойной производительностью и продать такое будет проще.

Максимальный размер модели при этом не меняется - то, что не влезает в память одной карты, не может обучаться или выполняться.
На двух картах можно апскейлить по половине одной картинки, но генеративные модели на них будут работать только те же, что на одной.

_________________
Мы же не в море. Не на острове посреди океана.

Lurk

Добавлено: 24.01.2025 9:15

[профиль]

Member
Статус: Не в сети
Регистрация: 18.12.2010

Varg писал(а):

Приведешь несколько примеров использующих FP4 ИИ-приложений для десктопа?

Есть FLUX и stable diffusion FP4 чекпоинты. ИМХО t2p рисовалки вполне подходят под десктопные приложения.

ParKur

Добавлено: 24.01.2025 10:50

[профиль] [Фотоальбом]

Moderator
Статус: Не в сети
Регистрация: 21.10.2010
Откуда: вопросы?
Фото: 67

RTX 5090 - CPU BOTTLENECKS, PCIE SCALING, BENCHMARKS & MORE

_________________
i9-7980XE ✸ ASROCK X299 TAICHI XE ✸ 64GB RAM ✸ RTX 5070Ti ✸ SSD/HDD ✸ СЖО | PS5

Varg

Добавлено: 24.01.2025 10:55

[профиль]

Community Manager
Статус: Не в сети
Регистрация: 30.12.2004
Откуда: У зайца яйца

Lurk писал(а):

Есть FLUX и stable diffusion FP4 чекпоинты.

Есть такие варианты, но ценой потери качества, поэтому народ все равно в FP16 гоняет.

#77

Стандарт сейчас - FP16, что на десктопе, что где-то еще. Некоторые модели начали успешно обучать на FP8. Но это другие модели с другим результатом, нежели FP16 и FP32.
Есть успешные модели со смешанной квантизацией, 8/4, только там производительность не будет удваиваться.
Это не к тому, что поддержка FP4 не нужна, конечно нужна и давно есть в ИИ-чипах, а к тому, что она не означает х2.

Добавлено спустя 29 минут 18 секунд:

Бушкапе писал(а):

У 4090 буст примерно 2.73-2.77 в играх.
В фурмарке 2.685.

Varg писал(а):

4090 Boost Clock (GHz) 2.52 Base Clock (GHz) 2.23
5090 Boost Clock (GHz) 2.41 Base Clock (GHz) 2.01

4090 реально 2.6 бублик 2.8 игры 3.0 разгон 3.1 вода
5090 Возможно вживую увидим 2.5 в бублике, 2.6 в играх, 2.8 в разгоне с 3 под водой.

Так, посмотрим, насколько кто попал...

#77
https://www.youtube.com/watch?v=VZYnW12KlTc

В этот раз официальные и реальные частоты совпадают. Но в разгоне получили только 2.66, а не навангованные 2.8.
Насколько помню, ниже 2.95 в разгоне у 4090 почти не бывает, даже на простом стоковом биосе.
Так что потеря в реальной частоте порядка 300 МГц, больше чем 200, которые я ожидал.

_________________
Мы же не в море. Не на острове посреди океана.

tolikmixx

Добавлено: 24.01.2025 13:00

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 20.08.2011
Откуда: Рязань
Фото: 0

Varg писал(а):

Насколько помню, ниже 2.95 в разгоне у 4090 почти не бывает, даже на простом стоковом биосе.
Так что потеря в реальной частоте порядка 300 МГц, больше чем 200, которые я ожидал.

Я вообще ожидал прироста частот, чтобы было хотя бы 3100-3200 МГц в разгоне за счёт перехода на улучшенный техпроцесс.
А что кстати за такие некрасивые значения частот в графике, с RTX2000 по rtx4000 включительно был красивый шаг в 15 МГц, а тут что-то кривое или это какие-то средние значения? :?:

_________________
Palit GeForce RTX 5090 GameRock OC; AMD Ryzen 7 9800X3D; MSI MPG X870E EDGE TI WIFI; be quiet! DARK POWER PRO 12 1500W; Samsung Odyssey OLED G8 G80SD

stockclock

Добавлено: 24.01.2025 15:08

[профиль]

Member
Статус: Не в сети
Регистрация: 06.01.2015

5090 в работе

Varg писал(а):

Приведешь несколько примеров этого "стандарта", то есть использующих FP4 ИИ-приложений для десктопа?

Ты похоже с генерацией картинок больше знаком и языковые модели не используешь. Большие LLM приходится в FP4 запускать. Он стал дефолтным вариантом на практике. Те кто пользуются языковыми моделями типа LLama, Gemma, Deepseek просто знают об этом. Это дефолтный вариант для скачивания в оболочках типа LM-Studio. Что сейчас в генерации картинок не знаю, просто не актуально для меня. Я думаю мы получим мультимодальные LLM в которых будет всё и сразу и модели вроде Stable Diffusion просто будет внутри LLM. А там модели объёмом уже давно десятки и даже сотни гигабайт. К тому же более менее сносно работают модели на 70B - а это 140ГБ в FP16, что неподъёмно для обычного ПК. В языковых моделях выше FP8 сейчас не используют. На FP8 вообще практически нет потерь, на FP4 удовлетворительно. Большая модель в FP4 будет работать лучше чем маленькая в FP16, проверено.

Varg писал(а):

Максимальный размер модели при этом не меняется - то, что не влезает в память одной карты, не может обучаться или выполняться.

В языковых моделях можно юзать несколько карт, память в этом случае суммируется.

Varg писал(а):

Есть такие варианты, но ценой потери качества, поэтому народ все равно в FP16 гоняет.

По моему разницы нет.

mike-lesnik

Добавлено: 24.01.2025 18:16

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 15.09.2008
Фото: 0

Появились обзоры нерефов, MSI Suprim на первый взгляд выглядит интереснее чем Asus Astral, но если приглядеться то у MSI меньше рабочее напряжение и powerlimit, похоже отсюда и преимущество.
https://www.techpowerup.com/review/asus ... al/39.html

_________________
8ulleTin

SaturnV

Добавлено: 24.01.2025 18:29

[профиль]

Member
Статус: Не в сети
Регистрация: 10.09.2020

stockclock писал(а):

А там модели объёмом уже давно десятки и даже сотни гигабайт. К тому же более менее сносно работают модели на 70B - а это 140ГБ в FP16, что неподъёмно для обычного ПК.

исполняется в обычном CPU из обычной RAM

stockclock писал(а):

Большая модель в FP4 будет работать лучше чем маленькая в FP16, проверено.

но 70B в 32GB все равно не полезет

_________________
Xeon W9-3595X, 2TB DDR5, RTX 6000 Pro MAX-Q

Новая тема /

Ответить

Сообщений: 4097 • Страница 18 из 205 • < 1 ... 15 16 17 18 19 20 21 ... 205 >

Список форумов » Тематические форумы » Видеокарты

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: alexsecl, Google [Bot], Legender, she1tan, TJS, unhurtable и гости: 34

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти: