Member
Статус: Не в сети Регистрация: 05.01.2011 Откуда: vologda Фото: 3
Lorichic
Цитата:
чтоб не врал про слив
для кого то и 1 фпс - уже решает... особенно в коментах после очередного выхода CPU и тестов... такой срач устраивают... так что это не вранье, а правда, иначе толк от +10 фпс переплачивать ~4т.р.?
Цитата:
угу, ведь это логично, если по твоим словам одно ядро фена мощнее, то и в целом он будет производительней чем 6100\6300
на одной частоте - да, но вас же не устраивает это, для вас CPU он такой как его создали.. то пытаетесь впарить мне результаты с турбокором, то 6300 у которого частота выше изначально... ну и новые инструкции тоже решают... так что 6100 может спокойно обойти фенома даже на более низкой частоте... оптимизация мож - о которой говорили мне тут пару страниц назад... ну и наконец частоты то больше, возможность разгона тоже хорошая ... я знаю что фен уже устарел, что он не может никак тащить лучше FX... но менять фен х6 на FX 6xxx - это немного не правильно... переплата того не стоит, если только какой то компромисс есть с рук.. или обмен..
Member
Статус: Не в сети Регистрация: 15.08.2007 Откуда: Киев Фото: 12
cannibal_pro писал(а):
на одной частоте - да, но вас же не устраивает это, для вас CPU он такой как его создали.. то пытаетесь впарить мне результаты с турбокором, то 6300 у которого частота выше изначально
Member
Статус: Не в сети Регистрация: 05.01.2011 Откуда: vologda Фото: 3
Lorichic ну слив он и есть слив, другими словами - уступает, ладно, если для вас это так важно пусть будет уступает... ну или равно, если хотите
тесты проводятся обычно по 3 раза и берется средний результат... ну да не важно
devl547
Цитата:
К таким разделяемым ресурсам относится не только кэш второго уровня, но и блок операций с плавающей точкой, а также блок выборки инструкций и их декодер. Это значит, что предельный темп исполнения инструкций в процессорах Piledriver остался неизменным – больше четырёх инструкций за такт двухъядерные модули с этой микроархитектурой исполнить не в состоянии.
все верно 4 если второе ядро не занято... иначе от 0, всего 16 возможно (но в вишере есть не большое увеличение скорости выполнения инструкций за такт отдельных видов 5%) тем временем фен на каждое ядро по 3, итого 18
это так я для справки.. не для обсуждения
_________________ Разгоним даже «Запорожец»
Последний раз редактировалось cannibal_pro 02.10.2013 14:08, всего редактировалось 2 раз(а).
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
cannibal_pro писал(а):
это так я для справки.. не для обсуждения
Надо еще копать количество тактов на инструкцию (что-то больше стало, что-то меньше).
Лично моё имхо - основной затык в IPС декодера + проблемы с задержками L3. Шедулер в юнитах другой - у Фенома он может выбрать в ядре любые 3 активных пайпа (комбинации AGU/ALU) из 6, у FX 4 из 4. И вот тут при загрузке всех ядер затык в декодер - он тупо не может прокормить всю эту команду, либо кормит 4 ядра до отвала, либо 8, но наполовину (на самом деле больше из-за того, что инструкции исполняются не мгновенно, но 100% он не может выжать).
Кстати, вангую, что Steamroller все равно будет в LinX сливать в 2 раза i7 - тупо потому что у него FMAC 2х128 бит, а у интела 2x256
Member
Статус: Не в сети Регистрация: 05.01.2011 Откуда: vologda Фото: 3
devl547 люблю дискутировать на те темы в которых понятия не имею что хотели сотворить АМД в лице FX ... можно погадать конечно... потереть шар хрустальный... задержки в L3 - есть такая проблема...
Цитата:
И вот тут при загрузке всех ядер затык в декодер - ...
возможно, а возможно расчет был чтобы не загружать FX по полной... возможно расчет был на то что будут работать 4 модуля не на полную катушку, чтоб оставалось для турбокора и не было затыка в декодере, но для этого и загрузка CPU должна быть через ядро(1 ядро на модуль), основные потоки, и потом уже на вторых ядрах парковались бы вторичные потоки ...что давало бы не плохой бонус за счет повышенных частот
Цитата:
Кстати, вангую, что Steamroller все равно будет в LinX
с таким раскладом так и будет, сравнится он сможет только с 4х ядерными CPU... сейчас 93Гфл значит будет 103? максимум наверно.. ну или нужно существенно улучшать фпу.. ну и интела еще L3 работает на частоте CPU кажись
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
Я думал над архитектурой, но упирался в явные бутылочные горла, которые невозможно было пропустить даже при быстром тестировании инженерами. Индус-первоклассник проц проектировал) Думаю, что это не тот буль, который изначально планировали, и дизайн делали в явной спешке,
В новой архитектуре хансвел кеш 3 го уровня работает на свое частоте. А что бы компенсировать снижение скорости они увеличили кол-во "путей". Унификация архитектуры...
Добавлено спустя 1 минуту 20 секунд:
devl547 писал(а):
Я думал над архитектурой, но упирался в явные бутылочные горла, которые невозможно было пропустить даже при быстром тестировании инженерами. Индус-первоклассник проц проектировал) Думаю, что это не тот буль, который изначально планировали, и дизайн делали в явной спешке,
Бред какой то.
_________________ Pentium 4 -> Athlon 64 x2 -> Phenom II x4 -> FX 6300 -> Core i5 4670K
Member
Статус: Не в сети Регистрация: 26.04.2008 Фото: 15
devl547, вы хорошо разбираетесь в архитектуре, видя ее недостатки, тем не менее у вас в профиле 3 системы, собранные на АМД, почему выбор сделан в этом направлении.
Member
Статус: Не в сети Регистрация: 10.05.2011 Откуда: Москва
EVGENIYYY писал(а):
почему выбор сделан в этом направлении.
0. У меня были Q6600 и i7-920 до этого. 1. Небольшая доля фанатизма, я надеялся, что удастся уломать разработчиков быстрее, чем получилось на деле. 2. Под Linux эти процессоры работают лучше, что я знал еще до покупки. 3. Для моих задач более чем хватает + цена/производительность лучше.
Добавлено спустя 6 часов 59 минут 51 секунду: Итак, к вопросу о скорости однопотока на примере lame на piledriver (6800k). Делал по 5 прогонов lame без опций (это 128 килобит и q=4 вроде) на 70-метровом wav.
Debian amd64 сток - ~11.4 секунд Debian amd64 -march=native (aka march=bdver2) - ~10.2 секунд Debian amd64 -march=native + рекомендуемые AMD флаги для gcc - ~9.8 секунд Windows 8 x32 - ~12.0 секунд (Intel Compiler 12.1) Windows 8 x64 - ~9.8 секунд (Intel Compiler 12.1) и вот тут интересное, векторизованная 64-битная версия отсюда - http://tmkk.undo.jp/lame/index_e.html выдает 8.5 секунд
Причем файлы на выходе (кроме последней версии) одинаковые. Вопрос - как вы планируете бенчи прогонять, если там +15% к производительности сходу получается (то есть оригинальный тест не задействует все ресурсы процессора)?
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 13
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения