Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Gorod писал(а):
Но в целом Gflops упали (те же 4.6GHz)
А почему флопсы такое УГ даже для 4 гигов памяти?
C_i_t_r_u_s писал(а):
Опять таки в теории, на практике в многопоточке
От задач же зависит) Можно придумать задачу, которая вообще не будет нормально скейлится ни от скорости процессора, ни от памяти, ни от I/O. Упираясь, например, в скорость переключения контекста.
C_i_t_r_u_s писал(а):
а линпак лишь немногим быстрее прогрузит данные.
Линпак на порядок требовательней к подгрузке данных, чем любые игры. Как раз из-за использования хорошего такого SIMD.
SuperPI is a floating point, cache / memory benchmark. All the areas the test cares about are EXTREMELY weak on AMD 15h CPUs. SuperPI was written > 20 years ago and it certainly doesn´t intentionally try to make AMD to look weaker than it really is. The fix I made for SuperPI reverted something made by AMD themselves. It was made a standard setting in Steamroller.
Цитата:
Stores and cache state (no speculation required), but that´s all I can say. I know exactly what it does, but nobody ever explained me why (been waiting for the reply for nearly three years, lol) it was configured in the way it was. The part that pisses me off is that there is tons of stuff (configuration) like this, and there is zero guarantee that the other few thousand configuration options are any better configured than this. Since I never received any official answers (or a budget) I left them alone. 15h is dead anyway so it doesn´t matter anymore regardless.
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
C_i_t_r_u_s писал(а):
Так есть же современные суперпи с многопоточкой
y-cruncher какой-нибудь? Ну так там и код с алгоритмами другой. Цитата TheStilt выше - это как раз доказательство того, что крутилок в процессоре дофига (а их реально дофига, если доки почитать) и хз как они все работают. И абсолютно не факт, что bios разных материнок их одинаково выставляет. Тут только если полные дампы MSR сравнивать.
Member
Статус: Не в сети Регистрация: 03.10.2007 Откуда: Ufa Фото: 130
devl547 писал(а):
y-cruncher какой-нибудь? Ну так там и код с алгоритмами другой.
Да там их уже несколько с методом чудновского к примеру.
devl547 писал(а):
И абсолютно не факт, что bios разных материнок их одинаково выставляет.
Скорее факт что он выставляет не то что надо)) На сайбере некоторый тайминги я вообще не могу выставить как в профиле оперативки, просто потому что там нет таких значений в биосе. Такие крутилки разве что для роговских плат, там их очень много и больше возможностей. Простые платы не особо подходят для таких вещей.
Member
Статус: Не в сети Регистрация: 10.07.2004 Фото: 183
С Новым Годом всех !
Значит , почти победил кукурузу в 2015-ом , почти потому что что то странно просели в тестах с 7-го по 10-тый , или у меня параноя ? Причина предыдущей кукурузы была в объеме памяти , когда ставлю на всю память галочку то какие странные вещи происходят включая дикий своп жесткого диска на несколько минут - вообще ну его ... поставил 6144мб . Что скажете эксперты по линксу , есть кукуруза или нет ?
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Gorod писал(а):
С Новым Годом всех !
И тебя с Новым Годом
Поставил новую память и заодно почистил радиатор сейдона. 48 GFlops @ 4000 как с куста. На холод пока не выносил, у нас -12 на улице и я хз, как на это отреагирует водянка (там гликоль должен быть, но кто его знает)
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Дабы соблюдать порядок, пишу тут.
Разработка мат. либы ACML была остановлена и наработки по ней ушли в проект ACL (AMD Compute Libraries). Проект в целом заточен под APU/GPGPU, но есть и процессорная часть, представленная либами libflame и BLIS.
Есть документик с описанием работы и тестами на разных архитектурах - https://www.cs.utexas.edu/users/flame/p ... _TOMS2.pdf Там есть тесты BLIS в сравнении с MKL, ACML и ATLAS (для ленивых - почти равны). Интересен тест на 5800k@3700 - 23-24 GFLops/FPU (В режимах 1 core - 1 FPU, 2 core - 2 FPU, 4 core - 2 FPU эффективность GFlops/FPU практически одинаковая), что даёт реально достижимые ~50-51 Gflops на 2 модулях@4ГГц.
Junior
Статус: Не в сети Регистрация: 29.06.2016 Фото: 9
devl547 Вы таки правы! Модули все равны - по 25%. Только повышение частоты разгона гдето начтнает тормозить и 8 ядер начинают недобтрать флопсы. а вот на пониженных вольтажах и частотах - в пересчете выходит на Вами расчитанные 100гф на 4ГГц. Вот 3840 даёт 93гф а значицца на 4.0 должно быть 97гф.
_________________ fx8350 FA 1432PGY vid 1.363 gigabyte970-A-UD3 CORSAR 2X4GB 12800(800MGZ) 1600 CL11
Junior
Статус: Не в сети Регистрация: 29.06.2016 Фото: 9
это да. но пообщавшись с мастерами это факт что на грани срабатывания защит мп. то есть на 93 выходит когда защиты не включаются. попробую понизить частоту ещё.
Добавлено спустя 1 час 56 минут 38 секунд: Куда капать? Начитался про сбитые таймеры, 10 прогонов за 37 минут это нормально? И куда капать с этим residual? #77
Добавлено спустя 5 минут 16 секунд: Аэро отключил, флопсы выросли, а что за residual и где что коверять?
Добавлено спустя 3 часа 24 минуты 9 секунд: #77
_________________ fx8350 FA 1432PGY vid 1.363 gigabyte970-A-UD3 CORSAR 2X4GB 12800(800MGZ) 1600 CL11
Статус: Не в сети Регистрация: 06.11.2016 Откуда: КИЕВ Фото: 3
C_i_t_r_u_s писал(а):
Это бесполезная теория не может объяснить: 1) С какого на 8** выдается больше, чем на 9**? 2) С какого при отключение того или иного модуля все эти комбинации веду себя в линпаке по другому? 3) С какого при одинаковых параметрах проца/кп/памяти/задачи/времени такая большая разница в поведении линпака?
Сначала ответы а потом мнение о полезности 1 Проц не зависит от матери - и 8* открывает его потенциал больше чем 9*. То есть 9* кукурузит 2 Это неправда. Модули ведут себя одинаково с учётом масштабируемости 3 Разные охлады и разные МП имеют разный порог ОР
Добавлено спустя 2 минуты 51 секунду:
C_i_t_r_u_s писал(а):
А теперь смотрим внимательно, у нас у обоих абсолютно одинаковые параметры все. Но почему то при большей производительности у Виктора выполнилось все те же 11 проходов за 30 минут и 2 секунды, что и у меня за 30 минут и 3 секунды (1 секунда погоды не делает, 11 проход был пройден уже на 28 минуте).
Потому что количество проходов зависит от частоты. А гигафлопсы от отсутствия кукурузы.
C_i_t_r_u_s писал(а):
Сделал кукурузный проход
Это правда.
Добавлено спустя 4 минуты 42 секунды:
Roman V писал(а):
Аэро отключил, флопсы выросли, а что за residual и где что коверять?
Аэро понижает флопсы потому что отнимает ресурсы. Невязки ковЫрять надо на напряжениях nb. И понизить пробуй вольтаж проца. Зачем там 1.5v?
Добавлено спустя 2 минуты 14 секунд: И ещё - память под потолок? по объёму? Уменьшить объём или добавить планки попробуй.
Добавлено спустя 15 минут 4 секунды:
devl547 писал(а):
Интересен тест на 5800k@3700 - 23-24 GFLops/FPU (В режимах 1 core - 1 FPU, 2 core - 2 FPU, 4 core - 2 FPU эффективность GFlops/FPU практически одинаковая),
+100500 Из этого следует что не 100гф на 4000мгц для 8* "чудофлопсы" - а меньшие значения это кукуруза. И искать надо почему одни платы догоняют эти значения, а другие нет. Взять даже аналогию с ш7 6700к Если за эталон C_i_t_r_u_s стал брать х265 то на интеле этом на частоте 4700 в среднем 31fps а на FХ 15.5fps Значит если в линпаке там с среднем 230 гф - то на FX должно быть 115 на той же 4700 частоте. А всё что ниже кукуруза. И если на гигах и 8* чипсете это "малая" кукуруза - есть до 110 гф результаты, то на асусах кукуруза в линпаке "крупная"
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения