Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 443 • Страница 22 из 23<  1 ... 19  20  21  22  23  >
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Mause писал(а):
Ваши слова, если что

вещество != материя.
Mause писал(а):
возросшая эффективность это хорошо показывает

... с учетом того что она упала ниже 1 то нет не показывает... вот обратное да.
Mause писал(а):
Они даже используются сейчас!

где? где есть хотя бы "программно - аппаратная" система кроме видеокодеков - там совершенно другие принципы... в лет я вспомнил только "флак на опенсл" и то он использует унифицированный апи для запусках на видеокартах и да он сжимает без потерь. есть модуль джепега на суда - и опять же там про изменение разрешения картинок на видеокарте качество такого кодирования ниже чем на цпу и так же запускается через унифицированное апи... приведите пример может я чего то не знаю?

// то есть меня конкретно интересует алгоритм сжатия с потерями который бы на видеокартах или цпу выполнялся с минимальной нагрузкой и успевал обработать 2-4гб в секунду (примерно такой сейчас размер врама / рабочего пака текстур). если не знаете то молчите - сойдете за много.

Mause писал(а):
Ведущий инженер-программист со стажем

... только в нашей стране можно встретить такое чудо - программист который не знает проблем параллеливания и путает слова "эффективность" и "производительность".

Renegade1979 там проблема в другом... фактически там кластер ядер 2+2алу лежащие в разных "ядрах" и два fmac юнита на два "ядра"... в первых версиях было 2 собственных планировщика для алу и один "лежащий ниже" по иерархии для вещественных операций. проблема архитектуры была в сильном дробление целочисленного блока (2+2) и не всякий код мог эффективно загрузить такой кластер так и доступ к вещественным операциям мог иметь каждый из блоков алу при этом возникали проблемы "доступа". и проблема высокой частоты - медленный кеш который так и не завили на этой частоте (точней он очень латентный)... но при этом в целочисленных операциях где задействовались все потоки "бульдозер" показывал производительно сравнимую / выше интела (у которого физическое ядро было с 3 алу на тот момент и тактовая была ниже). а вот вещественных операциях буль отставал в два раза - видимо это было связано с планировщиком / кешем / или недоработкой вещественного юнита (или все вместе).

_________________
Мертвый киберпанк с улыбкой мутанта... (:



Партнер
 

Member
Статус: Не в сети
Регистрация: 11.08.2013
ооо ревьюшки пошли
https://www.youtube.com/watch?v=RryaX3R9Vq0

видел ещё одно видео в с 1 бенчем - метро.
ну что сказать там 390х равна 970 :D другое дело что 8 гигов это фьючерпруфно.


Последний раз редактировалось palegamer 18.06.2015 16:32, всего редактировалось 2 раз(а).

 

Member
Статус: Не в сети
Регистрация: 20.03.2011
Откуда: Москва
mag_ai вы сойдитесь уже в терминах. Эффективность может считаться на доллар, на ватт, эффективность в целом или отдельных этапов обработки, эффективность в целом может возрасти за счёт улучшения в других сферах, например переход от нетбурстов к коркам, конвеер сократили в 2 раза, частоты тоже, это ведь понижение эффективности? Вроде да, с другой стороны смогли за счет улучшенной работы с кэшем и многоядерности перегнать пни и получить +100% прироста.

_________________
I would tell you a joke about UDP, but you probably wouldn't get it.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Psilon я считаю эффективность на юнит / ядро... для того чтоб это имело конкретные числа - беру тесты где проверяли именно 3 вида производительности шейдернуню / текстурную / филл рейт ну или просто скорость закраски.
Psilon писал(а):
от нетбурстов к коркам

... ммм коры изначально были более эффективны на любой пересчет на ватт хоть на юнит хоть на черта лысого. если посчитать то 1мгц скажем пентиума м приходилось несколько мгц нетбрустов (тут я беру величину "мгц" только потому что чипы имеют разный подход в работе ~ и невозможно в лоб сравнить мобильный пентиум с заниженной частотой).

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 20.03.2011
Откуда: Москва
mag_ai а какой смысл смотреть производительность на юнит? То есть допустим мы увидем, что производительность на юнит упала в 2 раза, но зато в результате они смогли в 10 раз больше юнитов запихнуть при той же цене и TDP. Следует ли из этого, что архитектура в 2 раза стала хуже, в не в 5 раз лучше? :)

Как по мне, пусть там хоть волшебные гномики работают без единого юнита, лишь бы выдавал лучший результат за меньшие деньги и TDP.

_________________
I would tell you a joke about UDP, but you probably wouldn't get it.


 

Member
Статус: Не в сети
Регистрация: 11.08.2013
Psilon писал(а):
лишь бы выдавал лучший результат за меньшие деньги и TDP.

я практически то же самое писал пару дней назад в этой же теме. максвелл действительно очень хорош как я считаю, соотношение производительности к потреблению просто замечательное. отличная архитектура в которой нвидия действительно не занималась переименовкой и допиливанием, а сделала шаг вперёд.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Psilon разговор вообще не с того начался. я объяснял чем максвелл - лучше кеплера и объяснял что огромные вычислительные кластеры кеплера мало эффективны поэтому их порезали и из за того что алу (как и fp64 блоки) потребляют больше чем кеш или планировщики - дали возможность сделать "менее жрущий чип" но в реальности он жрет столько же просто кластеры стали эффективней по сравнению с кеплером. "при сохранении производительности уменьшили потребление" это на одном тп но так же сказал что эффективность роста "юнитов в графическом процессоре" привела к падению кпд на юнит - и привел ферми у которой этот кпд высокий. то если сравнивать именно эффективность архитектур ферми более эффективная нежели кеплер / максвелл.

то есть если бы ферми промасштабировали до размеров кеплера-масвелла то вероятней всего ее производительность была выше (опять же у ферми на юнит производительность выше то можно такое предположить) но это - теория не известно с какими проблема столкнись бы разработчики... поэтому "есть то что есть". но есть еще один закономерный вывод - производительность на юнит уже меньше 1 ед - есть конкретный "не до загруз" чипа что говорит о том "такое количество юнитов если не избыточно то близко к этому числу"... возвращаясь к графику где х это кол. исполнителей и у это скорость - то мы уже прошли "пик" в графике и рост производительности от увеличения кол. исполнителей (в данном конкретном случаи алу) будет приводить к менее значительному росту производительности на чип - если в ближайшем будущем не увеличат сложность задачи.

// фиг знает более подробно это не объяснить... :roll:

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 20.03.2011
Откуда: Москва
mag_ai то есть проектировщики нвидии идиоты, и вместо того, чтобы отмасштабировав старый чип получить лучшую производительность, они взяли и сделали максвелл, который хоть и лучше по абсолютной производительности, но хуже, чем потенциальный отмасштабированный ферми?

#77

_________________
I would tell you a joke about UDP, but you probably wouldn't get it.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Psilon это шло как дополнительный вывод - и я же уточнил "но это - теория не известно с какими проблема столкнись бы разработчики"... такая же песня была с феномом 2 - фх "лучше бы амд выпустила феном на новом тп с более высокими частотами" - все это теория мы не знаем проблем такого масштабирования, но исключать такой возможности нельзя.

"проектировщики нвидии идиоты" - ну они же выпустили дутый кеплер? не всегда все проходит "удачно". в теории все звучит прекрасно "192 алу на кластер - эпик вин производительность" в реальности "128 алу на кластер с еще +1 планировщик = сравнимая производительность с кластером 192 ядра..." или тот же пример амд в теории фх были круты в реальности? вышло то что вышло.

или тот же пример с интел пентиумом - до того как интел показали что нетбруст "не настолько эффективен как в рекламе" - кто нибудь задумывался о его не эффективности? зато после выхода "коров" все плевались на них хотя информация об эффективности была рядом - просто нужно было лучше тестировать (те подойти к методам тестов).

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 20.03.2011
Откуда: Москва
mag_ai иногда новая архитектура дает прирост только через поколение. Парабола на интервале от 0 до 1 тоже ниже прямой, однако в перспективе она лучше. Даже если выходит фейл, в следующем поколении он исправляется, как интел - разгонали команду нетбурста и дали израильтянам сделать корки. Вышло прекрасно. А если бы нетбурст не был таким шлаком, этого могло и не произойти.

mag_ai писал(а):
но это - теория не известно с какими проблема столкнись бы разработчики"... такая же песня была с феномом 2 - фх "лучше бы амд выпустила феном на новом тп с более высокими частотами" - все это теория мы не знаем проблем такого масштабирования, но исключать такой возможности нельзя.

ну а раз нельзя, то и все эти обуждения "эффективности" архитектур вилами на воде писаны, ввиду нехватки информации.

_________________
I would tell you a joke about UDP, but you probably wouldn't get it.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Psilon но при этом со сцен же орут об возросшей эффектности в пересчете на "кисель от бабушки" и каждый раз что у интел нв или амд термин за последние время менялся - например интел начина с "производительность на мгц" окупился такой подход? да только когда был "нетбруст".

теперь все как ошарашенные считают "эффективности на ватт" - окупается такой подсчет только с этой итерацией архитектур - в будущем возможно заменят на что то новое. я же говорю о бесполезности такого подсчета эффективности - потому что эффективность не зависит от потребляемой мощности железкой а зависит от эффективности конечного юнита вычислителя... поэтому это все таки эффективней для сравнения "насколько возросшие количество юнитов эффективно по отношению к прошлому решению".

и поэтому цпу считаю по критерию ipc "инструкций за такт" но это актуально если количество вычислительных юнитов не растет в ядре (те в целочисленных операциях haswell будет быстрей иви / санди бриджка в пересчете "инструкций за такт" потому что в его ядре 4 алу и агу при той же тактовой частоте в отличии от предшественников у которых всего 3)... так понятно? поэтому я беру производительность на юнит которая показывает реальную производительность конкретного юнита а не целой большой структуры.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 20.03.2011
Откуда: Москва
mag_ai эффективность зависит только от того, как её считают. Ваша метрика бесполезная, для кого-то бесполезной будет метрика в TDP, а кому-то пофиг на него, зато важна цена. Все эти метрики объективны и влияют на потребительский опыт. А вот "насколько эффективнее данные блоки в этом поколении" метрика не дает ничего, поэтому что это только одна из составляющих, и мы берем видеокарту не для того, чтобы блоки эти считать. То есть метрикой может быть либо потребительская хараеткристика, либо что-то, что однозначно её задает. Количество этих блоков однозначно её не задает - мы не можем построить регрессию, которая будет гарантированно говорить, что с увеличением/уменьшением блоков в 2 раза будет такое-то изменение потребительских характеристик, потому что всех остальных переменных мы не знаем.

_________________
I would tell you a joke about UDP, but you probably wouldn't get it.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Psilon писал(а):
мы берем видеокарту не для того, чтобы блоки эти считать

:roll: "мы берем видеокарту для того, чтобы эти блоки считали" - не просто валялись как куча не нужного кремния и жрали электроэнергию.
Psilon писал(а):
Количество этих блоков однозначно её не задает

я когда писал другое? я писал наверное совершенно иное?
Psilon писал(а):
с увеличением/уменьшением блоков в 2 раза будет такое-то изменение потребительских характеристик, потому что всех остальных переменных мы не знаем.

какие в рот компот характеристики нужно знать кроме как производительность?
"если один коллектив работает 10 часов и состоит из 10 человек а другой из 20 человек но работает по 5 часов - в результате оба коллектива работают по 20 часов" - нет ничего заоблачного есть контерный тест шейдеров он показывает конкретный фпс (кадров в секунду) на обеих карта проводились одинаковые тесты и значит они актуальны для построения зависимостей. можно только корректировать процент погрешности при проведении каждого теста чтоб свисти к минимуму любые влияния на результат но это составляет обычно не больше ~2-3% от результата и в данном случаи на общую картину не повлияет.

// я уже сам начал загоняться в попытках доказать реальность - ошибку в математике я оставлю для потомков. которая выражается в "по 100 часов".

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 20.03.2011
Откуда: Москва
mag_ai писал(а):
какие в рот компот характеристики нужно знать кроме как производительность?


ну например TDP, карта на 10% производительнее 980ti даже если будет дешевле его стоить, с TDP600 никому не нужна будет.

mag_ai писал(а):
"если один коллектив работает 10 часов и состоит из 10 человек а другой из 20 человек но работает по 5 часов - в результате оба коллектива работают по 20 часов" - нет ничего заоблачного есть контерный тест шейдеров он показывает конкретный фпс (кадров в секунду) на обеих карта проводились одинаковые тесты и значит они актуальны для построения зависимостей. можно только корректировать процент погрешности при проведении каждого теста чтоб свисти к минимуму любые влияния на результат но это составляет обычно не больше ~2-3% от результата и в данном случаи на общую картину не повлияет.

это вообще поток сознания. Замеры ничего не гарантируют. Если у карты в 2 раза меньше блоков, она может быть все равно производительнее карты, у которой её в 2 раза больше.

_________________
I would tell you a joke about UDP, but you probably wouldn't get it.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Psilon tdp складывается не из архитектуры а большей частью из количества транзисторов которые "реально работают". грубо без смены тп карта может стать экономичней только если у нее алу и других высоконаруженных элементов меньше - как пример "каплер - максвелл" каждый блок порезали на 64 юнита а в место этого добавили 1 планировщик и увеличили кеш - все это жрет меньше чем 64 алу (это я еще блоки фп64 не посчитал) - вот и вышло что smx жрал больше а smm жрет меньше и размером поменьше. в реальности если бы не было дутого кеплера (те карты с очень большими кластерами) никакого бы максвелла не вышло... и да эффективность smm выше smx - об этом всем я писал уже если конечно читать. другой пример карты амд там алушек больше (и фп64 есть) и тд вот и жрут они больше... это конечно очень грубо но от реальности не далеко.
Psilon писал(а):
Если у карты в 2 раза меньше блоков, она может быть все равно производительнее карты, у которой её в 2 раза больше.

ну наконец вы прозрели! я об этом и писал - Следим за прямой трансляцией с мероприятия AMD #12980034
Цитата:
первый же тест "пиксельного шейдинга" - fur для 580 1080 кадров для 980ти - 2189 только в распоряжении бедной 580 512суда ядер а у 980ти?

:bandhead: это то что я уже битые сутки пытаюсь донести.

// просто если сравнивать редеон и джефорс. 290х и 980 - одна жрет 300вт другая жрет под 200вт. в реальности у одной 2800 алу у другой 2000 алу - ровно на треть джефорс "тоньше" ровно на треть и потребление. чудес не бывает.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 10.06.2012
Откуда: Норильск
Фото: 1
mag_ai писал(а):
вещество != материя.

ууууууууу как всё запущено :))))) а вы знаете что это синонимы и обозначают они одно и тоже? :))))
mag_ai писал(а):
... с учетом того что она упала ниже 1 то нет не показывает... вот обратное да.

Вы так ничего и не поняли. Нельзя считать эффективность на ядро, когда сами эти ядра меняются! Это и есть конвеерное производство! Над одним кадром работает сразу группа ядер, с какого чёрта вы позволили себе решить что 1 кадр = 1 ядро? Это глупо, очень, очень глупо. Ни в одной архитектуре подобного бреда нет, да вы и сами тут это заливаете о распараллеливании задачи, но считаете при этом кадр / ядро? Лишний раз доказывает что вы не понимаете того, о чём говорите. Я уже приводил пример с огромными по размерам ядрам, когда 2 ядра размером с дом будут по вашей глупости эффективнее и производительней 2000 маленьких. У вас там совсем каша в мозгах творится...
mag_ai писал(а):
где? где есть хотя бы "программно - аппаратная" система

Оглянитесь вокруг, практически везде используется кодирование. От сетевых протоколов до тех же видеокарт.
mag_ai писал(а):
то есть меня конкретно интересует алгоритм сжатия с потерями который бы на видеокартах или цпу выполнялся с минимальной нагрузкой и успевал обработать 2-4гб в секунду

Цифровые фото-видео камеры сжимают поток данных перед записью, с потерями, да, в RAW-формате - без. Сжатие с потерями используется далеко не везде, но алгоритмы сжатия с потерями многократно быстрее алгоритмов сжатия без потерь, для которых нужен глубокий анализ.
mag_ai писал(а):
только в нашей стране можно встретить такое чудо - программист который не знает проблем параллеливания и путает слова "эффективность" и "производительность".

В отличии от вас, я не путаю :) а вот вы считаете эффективность одного ядра - что в корне не верно для оценки архитектуры, не ну есть только потешить собственное эго, ибо эта величина ничего не значит. С проблемами распараллеливания запутались опять же вы :) Поймите наконец, какую ересь вы несёте. А расписывать на пол страницы "почему трава зелёная" - оставьте для ваших детей, тут этого не надо объяснять никому. У вас хорошая база, но абсолютно никакой логики, чтобы связать одно с другим, поэтому вы и запутались в понятии о том, что для чего нужно и где это использовать.
P.S. Вообще если для вас вещество и материя разные вещи... то тут я бессилен)

_________________
Ryzen 7900X / 192Gb / 4070Ti


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Mause меня уже достало говорить с таким троллем как вы. каменный топорный и постоянно переводит стрелки и не приводит аргументов. если например я знаю что Psilon программист то в вашей "ведущий инженер-программист со стажем" сомневаюсь - вы какими языками программирования хоть владеете? чтоб я мог проверить насколько "вы программист" для начала - накидаю вам 2-3 простейшие задачи и узнаю... чтоб базар не разводить.

// и да если я не программист это не значит что я не знаю пары языков для личного использования как скриптовых так и системных.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 07.01.2012
Откуда: деревня Локотки
Psilon писал(а):
кэш придумали в нынешнем виде еще 40 лет назад, и ничего нового с тех пор не изобрели. Колесу так вообще тысячи лет, и пользуемся как-то.

Неадекват что ли? Ему говорят про то, что было бы неплохо, если AMD использовала более дорогую (=быструю) кэш память, а он в ответ тут бред какой-то плодит ... когда уже не каждую 5-ую букву видеть начнёте?

Posted спустя 2 часа 51 минуту 21 секунду:
mag_ai писал(а):
// и да если я не программист это не значит что я не знаю пары языков для личного использования как скриптовых так и системных.

Вот это супер просто. Настолько эпичное выражение, что просто $#%$@!#! :lol: :lol: :lol: :lol: :lol: :lol:

Аналогично можно сказать и про поломойку, которая не физик-ядерщик, но смело может оценить другого физика-ядерщика, ибо она иногда синтезом занимается ... а вот ядерный ли он или просто фото - это лишний вопрос.

Я хренею с этого форума. #%^@$* какой-то!


 

Member
Статус: Не в сети
Регистрация: 20.03.2011
Откуда: Москва
Mekanika писал(а):
Неадекват что ли? Ему говорят про то, что было бы неплохо, если AMD использовала более дорогую (=быструю) кэш память, а он в ответ тут бред какой-то плодит ... когда уже не каждую 5-ую букву видеть начнёте?

быстрее SRAM на текущем уровне развитии ничего не существует в промышленном производстве. А кэш на ней, привет, и основан.

_________________
I would tell you a joke about UDP, but you probably wouldn't get it.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
Mekanika человек для того чтоб знать языки не нужно быть лингвистом :oops: программист это тот человек который пишет код для продакшена и зарабатывает деньги этим. я же фактически "что то знаю для себя" об вопросах поддержки и качестве кода не забочусь - "работает - значит сойдет"... но этих знаний (моих знаний) хватит чтоб вывести на чистую воду всех кто орет "я прогер - склонитесь перед моими знаниями".

человек с лишкой взял уровень "ведущий инженер-программист со стажем" - это очень высокая должность и понятно дело он знает несколько системных языков и несколько крупных фрейворков (я тоже знаю но не так хорошо) и я с легкостью определю врет он или нет написав пару примеров вроде "привет мир". так понятно?

_________________
Мертвый киберпанк с улыбкой мутанта... (:


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 443 • Страница 22 из 23<  1 ... 19  20  21  22  23  >
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 15


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan