Member
Статус: Не в сети Регистрация: 26.02.2017 Откуда: Санкт-Петербург
i7 14700f
542 gflops
Вложение:
2025-05-14_00-50-55.png
У вас нет необходимых прав для просмотра вложений в этом сообщении. _________________ CPU: Intel i7-14700F (20+8) @2,1-5,4ГГц; Cooler: 220вт; Mem: DDR5 32G 5600MHz; MB: Gigabyte B760M; Supply: 600W; GPU: NVIDIA 4060 Ti 8G; Display: 2K@165Hz;
Уважаемые товарищи! А для AMD версия, чтобы не выдавало ошибку, когда результат выше 999 Gflops, существует?
Не обращайте внимание на сообщение об ошибке. В интерфейсе справа снизу появляется кнопка Log. Там подробный результат, если Residual checks PASSED - значит тест пройден, ошибок нет. Увы, оболочка неправильно разбирает результат - про это давно писал Производительность системы в гигафлопсах? (Linpack / IBT / LinX / etc.) #14716166 , TFlops уже не понимает. Обидно, что так только 1 проход можно запустить. Хотя если сразу перезапустить это будет примерно тоже самое, т.е. можно прогреть проц последовательными запусками и посмотреть что будет при N запусках - как упадет прозиводительность, если охлаждение не справляется. Ошибки выявить, но нужно кнопку запустить перенажимать N раз.
Для AVX/AVX2 LinX вполне сойдет даже каноничная версия что закреплена в начале темы это 0.6.5 AVX. Она точно на 100% нагреет ваш проц по потреблению, если только у вас не проц с AVX512, его можно еще более дичайше прогреть и сбрасывать частоты он будет от такого сильно больше, но и результат выдаст скорее больше. В старом Linx нет AVX512.
Левые китайские сборки я бы не качал, там запросто вирусы или в коде написали конченый результат= результат * 1.5...Чтобы получить результат в китайских гигафлопс. Хотите современное - качайте текущую библиотеку от Интела Linpack, компилируйте, ну и она через командную строку с параметрами запускается... Что в логе linx - это и выводит как результат текстом библиотека Интела. Это не так удобно как готовый Linx с GUI скачать. Но можно и Linx поправить, там небольшой фикс.
P.S. Греет эта штука на максимум, близко к максимальной теоретичской производительности процессора = количество ядер*частоту*количество операций за такт(AVX, в старом linx нет AVX512, так что под 512 собирайте отдельно из библиотеки интел, но такое прожаривает еще сильнее), так что будьте готовы что полыхнет - огнетушитель держите рядом... HT естественно всегда отключить, он мешает и выдает где-то на 20-30% ниже результат с "лишними неполноценными" задействованными ядрами. Собственно так и соревнуются суперкомпьютеры - кто больше операций сделает, на самой простой задаче - перемножении огромных матриц, которая имеет и вполне адекватную математическую интерпретацию. Это решение системы линейных уравнений с огромным количеством параметров. Ну и якобы "AI" в виде LLM делают это на огромных объемах данных, вообщем тупая мощь все еще востребована.
Member
Статус: Не в сети Регистрация: 25.11.2016 Фото: 14
Товарищ Ким писал(а):
Ну и якобы "AI" в виде LLM делают это на огромных объемах данных, вообщем тупая мощь все еще востребована.
Правильное замечание.
Добавлю свои 3 копейки. LLMs работают в разы быстрее, если объём модели позволяет поместить её целиком не в оперативную память (и считать на cpu), а при условии что модель целиком помещается в память gpu. Маленькая модель, (до 16Гб) на моём ПК (gpu Radeon VII), буквально в несколько раз быстрее выдаёт первыё токен, ответ на запрос, чем когда, она работала на cpu из оперативной памяти. Если модель велика, не помещается в память gpu, то возможна её частичная выгрузка, но это лишь немного ускоряет работу, по сравнению с работой на одном cpu. В этом случае, количество ядер имеет решающее значение.
Выбор предпочитаемых иструкций — SSE 4.2; AVX2, AVX512 (AVX1 не поддерживается в этой версии LINPACK)
SSE 4.2 - 274 ГФлопс
Вложение:
274.png
AVX2 - 656 ГФлопс
Вложение:
656.png
AVX512 - 1195 ГФлопс
Вложение:
1195.png
белоруС_80 писал(а):
Уважаемые товарищи! А для AMD версия, чтобы не выдавало ошибку, когда результат выше 999 Gflops, существует?
Причина ошибки из-за увеличения длинны строки. LinX ищет в строке log файла слово pass в столбце 70. Если целое значение GFlops получается 4-х значное, то слово pass смещается на 1 символ и находится в столбце 71. LinX сравнивает слова - "pass" и " pas" и выдаёт ошибку т.к. они не совпадают. Можно изменить проверку и сравнивать только 73 символ, он даже с учётом смещения всегда будет s, если тест пройден без ошибки.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения