Member
Статус: Не в сети Регистрация: 05.01.2011 Откуда: vologda Фото: 3
Lorichic
Цитата:
чтоб не врал про слив
для кого то и 1 фпс - уже решает... особенно в коментах после очередного выхода CPU и тестов... такой срач устраивают... так что это не вранье, а правда, иначе толк от +10 фпс переплачивать ~4т.р.?
Цитата:
угу, ведь это логично, если по твоим словам одно ядро фена мощнее, то и в целом он будет производительней чем 6100\6300
на одной частоте - да, но вас же не устраивает это, для вас CPU он такой как его создали.. то пытаетесь впарить мне результаты с турбокором, то 6300 у которого частота выше изначально... ну и новые инструкции тоже решают... так что 6100 может спокойно обойти фенома даже на более низкой частоте... оптимизация мож - о которой говорили мне тут пару страниц назад... ну и наконец частоты то больше, возможность разгона тоже хорошая ... я знаю что фен уже устарел, что он не может никак тащить лучше FX... но менять фен х6 на FX 6xxx - это немного не правильно... переплата того не стоит, если только какой то компромисс есть с рук.. или обмен..
Member
Статус: Не в сети Регистрация: 15.08.2007 Откуда: Киев Фото: 12
cannibal_pro писал(а):
на одной частоте - да, но вас же не устраивает это, для вас CPU он такой как его создали.. то пытаетесь впарить мне результаты с турбокором, то 6300 у которого частота выше изначально
Member
Статус: Не в сети Регистрация: 05.01.2011 Откуда: vologda Фото: 3
Lorichic ну слив он и есть слив, другими словами - уступает, ладно, если для вас это так важно пусть будет уступает... ну или равно, если хотите
тесты проводятся обычно по 3 раза и берется средний результат... ну да не важно
devl547
Цитата:
К таким разделяемым ресурсам относится не только кэш второго уровня, но и блок операций с плавающей точкой, а также блок выборки инструкций и их декодер. Это значит, что предельный темп исполнения инструкций в процессорах Piledriver остался неизменным – больше четырёх инструкций за такт двухъядерные модули с этой микроархитектурой исполнить не в состоянии.
все верно 4 если второе ядро не занято... иначе от 0, всего 16 возможно (но в вишере есть не большое увеличение скорости выполнения инструкций за такт отдельных видов 5%) тем временем фен на каждое ядро по 3, итого 18
это так я для справки.. не для обсуждения
_________________ Разгоним даже «Запорожец»
Последний раз редактировалось cannibal_pro 02.10.2013 14:08, всего редактировалось 2 раз(а).
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
cannibal_pro писал(а):
это так я для справки.. не для обсуждения
Надо еще копать количество тактов на инструкцию (что-то больше стало, что-то меньше).
Лично моё имхо - основной затык в IPС декодера + проблемы с задержками L3. Шедулер в юнитах другой - у Фенома он может выбрать в ядре любые 3 активных пайпа (комбинации AGU/ALU) из 6, у FX 4 из 4. И вот тут при загрузке всех ядер затык в декодер - он тупо не может прокормить всю эту команду, либо кормит 4 ядра до отвала, либо 8, но наполовину (на самом деле больше из-за того, что инструкции исполняются не мгновенно, но 100% он не может выжать).
Кстати, вангую, что Steamroller все равно будет в LinX сливать в 2 раза i7 - тупо потому что у него FMAC 2х128 бит, а у интела 2x256
Member
Статус: Не в сети Регистрация: 05.01.2011 Откуда: vologda Фото: 3
devl547 люблю дискутировать на те темы в которых понятия не имею что хотели сотворить АМД в лице FX ... можно погадать конечно... потереть шар хрустальный... задержки в L3 - есть такая проблема...
Цитата:
И вот тут при загрузке всех ядер затык в декодер - ...
возможно, а возможно расчет был чтобы не загружать FX по полной... возможно расчет был на то что будут работать 4 модуля не на полную катушку, чтоб оставалось для турбокора и не было затыка в декодере, но для этого и загрузка CPU должна быть через ядро(1 ядро на модуль), основные потоки, и потом уже на вторых ядрах парковались бы вторичные потоки ...что давало бы не плохой бонус за счет повышенных частот
Цитата:
Кстати, вангую, что Steamroller все равно будет в LinX
с таким раскладом так и будет, сравнится он сможет только с 4х ядерными CPU... сейчас 93Гфл значит будет 103? максимум наверно.. ну или нужно существенно улучшать фпу.. ну и интела еще L3 работает на частоте CPU кажись
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Я думал над архитектурой, но упирался в явные бутылочные горла, которые невозможно было пропустить даже при быстром тестировании инженерами. Индус-первоклассник проц проектировал) Думаю, что это не тот буль, который изначально планировали, и дизайн делали в явной спешке,
В новой архитектуре хансвел кеш 3 го уровня работает на свое частоте. А что бы компенсировать снижение скорости они увеличили кол-во "путей". Унификация архитектуры...
Добавлено спустя 1 минуту 20 секунд:
devl547 писал(а):
Я думал над архитектурой, но упирался в явные бутылочные горла, которые невозможно было пропустить даже при быстром тестировании инженерами. Индус-первоклассник проц проектировал) Думаю, что это не тот буль, который изначально планировали, и дизайн делали в явной спешке,
Бред какой то.
_________________ Pentium 4 -> Athlon 64 x2 -> Phenom II x4 -> FX 6300 -> Core i5 4670K
Member
Статус: Не в сети Регистрация: 26.04.2008 Фото: 15
devl547, вы хорошо разбираетесь в архитектуре, видя ее недостатки, тем не менее у вас в профиле 3 системы, собранные на АМД, почему выбор сделан в этом направлении.
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
EVGENIYYY писал(а):
почему выбор сделан в этом направлении.
0. У меня были Q6600 и i7-920 до этого. 1. Небольшая доля фанатизма, я надеялся, что удастся уломать разработчиков быстрее, чем получилось на деле. 2. Под Linux эти процессоры работают лучше, что я знал еще до покупки. 3. Для моих задач более чем хватает + цена/производительность лучше.
Добавлено спустя 6 часов 59 минут 51 секунду: Итак, к вопросу о скорости однопотока на примере lame на piledriver (6800k). Делал по 5 прогонов lame без опций (это 128 килобит и q=4 вроде) на 70-метровом wav.
Debian amd64 сток - ~11.4 секунд Debian amd64 -march=native (aka march=bdver2) - ~10.2 секунд Debian amd64 -march=native + рекомендуемые AMD флаги для gcc - ~9.8 секунд Windows 8 x32 - ~12.0 секунд (Intel Compiler 12.1) Windows 8 x64 - ~9.8 секунд (Intel Compiler 12.1) и вот тут интересное, векторизованная 64-битная версия отсюда - http://tmkk.undo.jp/lame/index_e.html выдает 8.5 секунд
Причем файлы на выходе (кроме последней версии) одинаковые. Вопрос - как вы планируете бенчи прогонять, если там +15% к производительности сходу получается (то есть оригинальный тест не задействует все ресурсы процессора)?
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения