Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 52 • Страница 3 из 3<  1  2  3
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Member
Статус: Не в сети
Регистрация: 06.11.2007
Фото: 9
Гы-гы чё для чего не знай, но всюду надо-не надо пихай. SSE4.2 предназначен для работы со строками. И в графике или расчетах он делает... внимание... - НИЧЕГО! AVX2 плохо на райзене работает?!... сорри, но я не увидел. Работает на уровне или быстрее интелов (ну если опять же судить по тесту x265 из профильной ветки). По крайней мере двойного-тройного отставания как у FX'a от интелов нигде не увидел. Дальше больше MS VS не умеет одновременно SSE и AVX и делить всё это на разные codepaths. Задаешь AVX - получаешь екзешник, которому подавай проц с AVX. Хочешь и то и другое - делай 2 екзешника (но так никто не делает). Надеюсь не надо говорить, что каждая первая игра "около ААА" написана в VS? Ну и самый распространенный наверное вариант использование потоковых инструкций - это банальное копирование памяти, потому что регистры жирные, в них много за раз влазит, а потом вылазит. От тут от них реальный профит. :lol:

ps Глянул advancedrender.cdl64 (dll) из cinebench - увидел максимум SSE3 инструкции. SSE,SSE2,SSE3 в сумме, ну оно и очевидно, что нет SSSE3 даже, ибо работает на Феномах и иже с ними.



Партнер
 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Sulphide писал(а):
Дальше больше MS VS не умеет одновременно SSE и AVX и делить всё это на разные codepaths.


А как у нас тогда работает x264/x265, собранный msvc?)

Добавлено спустя 3 минуты 5 секунд:
Sulphide писал(а):
SSE4.2 предназначен для работы со строками. И в графике или расчетах он делает... внимание... - НИЧЕГО!


Для меня sse4.2 = sse 4.2+4.1 (по сути 4.2 = полная поддержка sse4).

А в sse4.1 как раз для ускорения видео были инструкции.
А ещё есть такая вещь как pillow-simd для обработки картинок. А по-дефолту хочет sse4 для ускорения фильтров.


 

Member
Статус: Не в сети
Регистрация: 06.11.2007
Фото: 9
devl547 писал(а):
А как у нас тогда работает x264/x265, собранный msvc?)

Там ручные оптимизации либо ассемблерные либо интринсинками. Тоесть кодеры вручную писали codepaths.


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
Sulphide писал(а):
Там ручные оптимизации либо ассемблерные либо интринсинками. Тоесть кодеры вручную писали codepaths.


Вооот) И в большинстве цивильного софта оно так и работает. Это не так сложно на самом деле.


 

Member
Статус: Не в сети
Регистрация: 26.11.2011
Откуда: Из ада
Фото: 11
Renegade1979 писал(а):
Куратор проф. ветки недавно так это и назвал "радиальной кривизны изделия кривое г*но", и я почему-то ему верю

Конечно же диванному "куратору" лучше известно как надо делать контроллеры и цпу в целом. Куда там Джимам Келлерам всяким до диванных "инженеров" овер.сру...
А сколько технических подробностей этот "куратор" раскрыл...
Одно радиальное синезадое имхо...
Sulphide писал(а):
AVX2 плохо на райзене работает?!

Разве что в синтетике, где чисто поток avx кода. Там отставание если и есть, то небольшое. Когда дело касается реального софта, то процент использования этих инструкций намного ниже, чем в синтетике.
Какую-то чушь придумывают люди, вечный поиск отговорок, дабы как то принизить рузен.

_________________
Ryzen 2600, Asus C6H, Trident-z 3000C14D-32GTZR


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
lizardx писал(а):
Какую-то чушь придумывают люди, вечный поиск отговорок, дабы как то возвысить рузен.


И ведь даже потенциала нет, как в случае с радеонами. У FPU в Ryzen всё плохо как и раньше.


 

Member
Статус: Не в сети
Регистрация: 06.10.2005
Фото: 1
devl547 писал(а):
У FPU в Ryzen всё плохо как и раньше.

#77
#77
#77
А эти тесты не отражают производительность ФПУ? На последнем вверху Рызен 1800, потом вниз - 7700к 4,2 ггц, потом 6900 3,2 ггц..

_________________
Ryzen5 2600•ASUS Prime B450-Plus•Patriot 16GB 3k mhz•MSI RTX 2070•Toshiba HDWE140 4TB•Samsung 850 EVO 500GB•Aorus AD27QD•Be Quiet! Pure Base 600 Glass


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
l33t_h4x00r писал(а):
А эти тесты не отражают производительность ФПУ?


Какие у тебя весёлые тесты. А давай по-очереди)

VP8 - The code behind this benchmark method utilizes the appropriate MMX, SSE2 or SSSE3 instruction set extension, and it is HyperThreading, multi-processor (SMP) and multi-core (CMP) aware. // Что интересно, он по ядрам ничерта не скейлится. Но и тут Ryzen сливает 4-ядернику.
AIDA SinJulia - x87 в режиме 80 бит. Что моветон для 64-битного кода, где FPU=SSE, а не x87. Хотя тут молодцы - сделали мощный блок в момент отказа от него.

Пшшшш, AIDA..

#77

Buuut my FLOPS, my potential, my Radeon-bro.. Ах да, блоки процессора сами отрастут со временем :dance:

Добавлено спустя 11 минут:
Чтоб не было так грустно, вот тебе тесты Сандры c того же сайта:

#77
#77
#77

Видишь вот этот вот весёлый прыжок от быстрого Integer к хилому FP32/FP64?
А всё потому что в погоне за нежручестью туда воткнули не 2x256bit fpu, как у Intel (или даже как обещали в начале разработки Zen), а всё тот же 2x128bit.
Когда FPU гоняет 256-битные и выше инструкции, Intel продолжает скейлить производительность, а AMD стоит на месте (надеюсь, что хоть 5% падение производительности времён FXов убрали).

// На самом деле всё зашибись для тех, кому не нужен потенциал будущих оптимизаций под свежие ISA.
Руки уже чешутся прикупить себе 1700, но жду биосов свежих. :beer:

Кстати, вот тебе цитата от Agner Fog, если конечно в курсе, что это за товарищ:

Цитата:
The single-thread instructions per clock rate of Ryzen is higher than for any Intel processor, except for 256-bit vector code. I am testing the Ryzen right now and the test results are coming soon. Please be patient.


 

Member
Статус: Не в сети
Регистрация: 06.10.2005
Фото: 1
devl547 писал(а):
Видишь вот этот вот весёлый прыжок от быстрого Integer к хилому FP32/FP64?

Ну то что целочисленные у АМД норм,так это вроде всегда было.
devl547 писал(а):
Чтоб не было так грустно, вот тебе тесты Сандры c того же сайта:

В паре тестов,норм,только Сайентифик плохой, не знаю, на чём он основывается и что отражает.
devl547 писал(а):
Руки уже чешутся прикупить себе 1700, но жду биосов свежих

В мае надеюсь окончательно решат проблему высокочастотной памяти.(Я кстати не удивлюсь,если они через полтора года разрешат разлочку процев.)
devl547 писал(а):
Кстати, вот тебе цитата от Agner Fog, если конечно в курсе, что это за товарищ:

К сожалению( наверное) не в курсе.Цитату я понял,но я не знаю что такое векторный код.
П.С. Ещё был скрин с ЦПУ-марк, там тоже ФПУ тест,ну он то хоть отражает что-то?

_________________
Ryzen5 2600•ASUS Prime B450-Plus•Patriot 16GB 3k mhz•MSI RTX 2070•Toshiba HDWE140 4TB•Samsung 850 EVO 500GB•Aorus AD27QD•Be Quiet! Pure Base 600 Glass


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
l33t_h4x00r писал(а):
только Сайентифик плохой,


Мультимедиа плохой ещё. На уровне 4-ядерного i7.

l33t_h4x00r писал(а):
К сожалению( наверное) не в курсе


agner.org, дядька, известный в среде оптимизаторов программ)
В общем, моё мнение и его совпадают - у Zen быстро всё, кроме 256-битных инструкций.


 

Member
Статус: Не в сети
Регистрация: 26.11.2011
Откуда: Из ада
Фото: 11
devl547 писал(а):
В общем, моё мнение и его совпадают - у Zen быстро всё, кроме 256-битных инструкций.

Аида и сандра чистая синтетика, причем для цпу интел. Они не используют инструкции амд. это еще более бесполезные тесты чем супер пи.
Смысл в них тестировать процессоры амд?
Есть синебенч, он отражает реальную однопоточную и многопоточную производительность. Даже в случае с вишерой наглядно показывает сильное отставание в однопотоке над и5 и превосходство 4 модулей в многопотоке. Это все подтверждается тестами в РЕАЛЬНЫХ программах.
Хватит уже заниматься фанатством и выискивать тесты в синтетике, основанной на интеловском компиляторе.

_________________
Ryzen 2600, Asus C6H, Trident-z 3000C14D-32GTZR


 

Member
Статус: Не в сети
Регистрация: 10.05.2011
Откуда: Москва
lizardx писал(а):
Аида и сандра чистая синтетика, причем для цпу интел. Они не используют инструкции амд.


А что, у AMD уже появились "их" инструкции?

lizardx писал(а):
основанной на интеловском компиляторе.


Пруфов опять не будет?


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 52 • Страница 3 из 3<  1  2  3
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 16


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan