Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
KT писал(а):
Эффективность кода - слышали про такое? Компилятор который подобное допустит можно выкинуть на помойку а его разработчикам надо оторвать руки и отправить обратно в индию...
Если бы такого не было - от НТ прирост был бы нулевой всегда и везде. Код дающий на HT прирост уже не эффективен(по вашим словам), но многопоточен по факту... Вот если это последовательные данные(типа расчет физики в играх, с одной стороны разбивающихся осколков много, а с другой после каждого столкновения траектория осколков меняется)? Результат первого используется как данные для второго...Обзор процессоров Core i5-4670K, Core i5-4670, Core i5-4570 и Core i5-4430 Посмотрите в каких приложениях 4770 уходит в отрыв от 4670(без НТ), в тех зачастую неплох и 8350... Кстати там и мной упомянутая физика из Futuremark 3DMark Fire Strike — Physics Score
И ещё цитата оттуда
Цитата:
Свежая версия архиватора WinRAR приобрела очень качественную поддержку многопоточности. Поэтому процессоры Core i7 демонстрируют внушительный полуторакратный отрыв от представителей семейства Core i5. В число лидеров записался и восьмиядерный AMD FX-8350, в силу своих микроархитектурных особенностей хорошо справляющийся с многопоточной целочисленной нагрузкой.
И как это недоядра в число лидеров выбились? - А вот такая качественная поддержка многопоточности кривым кодом по сути(раз уж 2 АЛУ ядер АМД ему хватает, а процы без догрузки с помощью НТ простаивающих АЛУ отстали)
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Последний раз редактировалось edal 21.08.2013 21:27, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 26.09.2011 Откуда: Canada, Toronto
KT писал(а):
То есть у хасвела - HT дает +7% на ядро...и это самый яркий пример...
Неправильно. 29% - относительный прирост с HT в Cinebench 11.5 как для одного ядра, так и для четырех ядер. Для четырех ядер делить на 4 не нужно. Сами подумаете или обьяснить?
Последний раз редактировалось TiGr1982 21.08.2013 21:39, всего редактировалось 2 раз(а).
Прирост есть конечно...так как есть недогруженные блоки...но на текущей архитектуре потенциал технологии не раскрыт...HT просто "до кучи" имхо.
это из серии "..вижу фигу"? давайте вы, помоляся, примете исходные данные о процентах прироста от НТ на короткоконвеерной архитектуре( а по ссылке до 40+), а потом начнёте рассуждать по новой.
Member
Статус: Не в сети Регистрация: 14.12.2005 Откуда: Спб
k@mikadze писал(а):
Вообще конечно это развод придуманный воспаленным умом маркетологов. 1 модуль = 2 потока но ни как не 2 ядра. Такими темпами у процов с HT количество ядер тоже можно на 2 умножать. В общем интел в этом плане куда честнее со своими пользователями.
Глазки в гору подыми, для таких спецЫалистов даже блок-схему нарисовали (х86 Cores). Модуль представляет из себя физические вычислительные ЯДРА с общим кэшем 2-го уровня, а кэш 3-го уровня общий для всех модулей. Такая архитектура при грамотном программировании позволяет чрезвычайно эффективно распараллеливать задачи и потоки. Это проще, эффективнее и выше КПД. Не беда AMD, что Microsoft и подконтрольные производители софта игнорируют эти возможности, а в преимуществе такого подхода можно убедится например сравнивая производительность в 3D Studio Max или Adobe CS6, где процессоры AMD FX легко обходят Core i5 и идут ноздря в ноздрю с топовыми Core i7 (то-же самое и в некоторых играх). Подобную практику Microsoft распространяет и на GPU вычисления, всячески сдерживая развитие OpenCL, Direct Compute, Cuda, поддерживая их только на словах (можно заценить скорость кодировки в H264 с CUDA и без со средней видеокартой GeForce 660Ti). Если память не девичья, то можно проследить в прошлое подобное поведение Microsoft в отношение поддержки 64-х битных вычислений, многоядерности (пока у Intel не появились подобные решения, воз даже не дернулся!). Здесь нет никакой теории заговора, есть только бизнес, партнерство и долгосрочное планирование. Будет прикольно наблюдать, когда весь этот задел AMD ничтоже сумняшеся Microsoft вовсю будет использовать в Xbox One! Что касается гипер-триппера то это "честная" байда для лохов, особенно меня смешит эта фишка в официальной поддержке Intel и Microsoft в отношении множества ошибок и тормозов в серверных приложениях, когда один из самых популярных ответов техподдержки "отключите HT"!
пора писать вместо ядра/потоки или модули/потоки, просто число целочисленных/вещественночисленных устройств. потоки оставить. как-то типа цел./вещ./пот.
Если бы такого не было - от НТ прирост был бы нулевой всегда и везде. Код дающий на HT прирост уже не эффективен(по вашим словам), но многопоточен по факту...
100% загрузки исполнительных устройств добиться невозможно по определению...именно поэтому HT догружает неиспользуемые в данный момент блоки вторым потоком! Вычисления могут быть инициированны абсолютно другим процессом...
Речь о том что длинный конвейер как раз и дает максимальный простой, то есть меньшую эффективность на такт! Это компенсируется высокой частотой задействованных в данный момент ресурсов + HT догружает простаивающие модули... То есть HT как воздух необходим именно длинноконвейерному процессору...на относительно коротком конвейере он не так нужен...
edal писал(а):
Посмотрите в каких приложениях 4770 уходит в отрыв от 4670(без НТ), в тех зачастую неплох и 8350...
А с этим никто и не спорит И ядра интел+HT и 8-ми ядерный феном получают выгоду от многопоточки, но сильно разную выгоду...у АМД прирост второго ядра в модуле до +80% (то есть каждый модуль дает 180%) а у интела - HT к скорости физического ядра даже по сымым оптимистическим прикидкам - +30....(130% - одно ядро+HT)...
Добавлено спустя 5 минут 4 секунды:
TiGr1982 писал(а):
Неправильно. 29% - относительный прирост с HT в Cinebench 11.5 как для одного ядра, так и для четырех ядер. Для четырех ядер делить на 4 не нужно. Сам подумаешь, или обьяснить? Я к.ф.-м.н., я часто все людям обьясняю, начиная с своих родственников, не стесняйся.
Ок. растолкуй почему +29% восьми поточного i7 не равно +7% на ядро?
william blake писал(а):
давайте вы, помоляся, примете исходные данные о процентах прироста от НТ на короткоконвеерной архитектуре
Я выше писал что хасвел тоже имеет почти 20 тактов целочисленного конвейера (как и нортвуд в котором впервые появился HT), но учитывая большее число выч. блоков и вдвое большее число ядер мы не наблоюдаем более +30% прироста 8-ми (поточного) i7 над 4-х поточным (ядерным) i5...
(+60% в целом ОДНОМ тесте SiSoft Sandra я вообще не рассматриваю...более "синтетического" бенча в принципе нет...и даже там всё крутится в лучшем случае вокруг 30%)
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
KT писал(а):
А с этим никто и не спорит И ядра интел+HT и 8-ми ядерный феном получают выгоду от многопоточки, но сильно разную выгоду
Я имел в виду что есть приложения в которых и 4670 показывает результат близкий к 4770(именно так а не наоборот) и уходит в сильный отрыв от 8350 именно по причине хорошей загрузки 4 ядер(даже без помощи НТ) нормальным кодом...но "не очень параллельным", а вот потоков для всех 8 ядер 8350 уже не хватило
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Member
Статус: Не в сети Регистрация: 26.09.2011 Откуда: Canada, Toronto
KT писал(а):
Ок. растолкуй почему +29% восьми поточного i7 не равно +7% на ядро?
4 Cores without HT (4 threads) give the score 6.34, when each core runs its own one thread. => 1 Core without HT gives the score 6.34/4 ~ 1.59, because all physical cores are the same.
4 Cores with HT (8 threads) give score 8.20. In this case each physical core runs 2 threads, because 8 threads are distributed among 4 physical cores. => 1 Core with HT gives the score 8.20/4 ~ 2.05, because all physical cores are the same.
So, if one physical Intel core runs one thread (without HT), it scores 1.59. If one physical Intel core runs 2 threads (with HT), this physical Intel core scores 2.05. 2.05/1.59 ~ 1.29 (29%). So, the performance ratio is the same for any number of cores.
Последний раз редактировалось TiGr1982 21.08.2013 22:05, всего редактировалось 1 раз.
TiGr1982 Знаешь это похоже на одну из шуточных математических задачек...когда 2+2=5....но все правильно!....надо переварить... кстати не забывайте что у i7 еще и кэша на 2 метра больше...поэтому сравнение с 29% разницы I5 и I7 не совсем корректно
Добавлено спустя 4 минуты 35 секунд: Ну в принципе я не "перешагну через себя" признав что HT на Core I дает те же самые 30% в оптимизированных приложениях что и на P4...то есть в этом плане никакого противоречия для меня этот факт не вызывает...
Добавлено спустя 4 минуты 6 секунд:
edal писал(а):
Я имел в виду что есть приложения в которых и 4670 показывает результат близкий к 4770(именно так а не наоборот) и уходит в сильный отрыв от 8350 именно по причине хорошей загрузки 4 ядер(даже без помощи НТ) нормальным кодом...
Да я выше тоже говорил о том что оптимизация конкретно под P4 могла бы так же загрузить ядро более полно (точнее это говорил не я...а it-сообщество во времена внедрения HT)...но многопоточность судя по всему была более простым вариантом так как работала даже там где нет конкретной заточки под особенности P4...(учитываем так же фоновые процессы и параллельный запуск нескольких приложений)
Ну а на деле в те времена не было ни первого ни второго....поэтому нетберст и провалился... говорили даже что HT физически был реализован даже в виламете, но его не стали включать потому что на момент конца 2000 года параллельные вычисления были реализованы чуть более чем нигде...еще не была анонсирована Win XP поддерживавшая многоядерность...в 98 винда с такими процами просто бы не работала корректно...(2000 хоть и нормально определяет два логических процессора но никакого прироста в ней нет...не помню почему но на деле поддержки многоядерных процессоров в ней тоже судя по всему не было).
Последний раз редактировалось KT 21.08.2013 22:23, всего редактировалось 2 раз(а).
Member
Статус: Не в сети Регистрация: 26.09.2011 Откуда: Canada, Toronto
[quote="KT"]TiGr1982 кстати не забывайте что у i7 еще и кэша на 2 метра больше...поэтому сравнение с 29% разницы I5 и I7 не совсем корректно
It's the same Core i7-4770 in both cases; just 4 or 8 threads, so L3 cache is 8 MB in both cases I was saying that if number_of_threads=4, then i7 scores like i5, but physically it's i7. I tested both cases (4 threads and 8 threads) on my own PC, I didn't change the CPU, and I don't have i5 - only i7
Заметное влияние оказала активация технологии Hyper Threading у процессора Core i5 650 - среднегеометрический рост производительности составил 16% - 20%, в зависимости от разрешения. В некоторых играх эта величина достигла впечатляющих 80% - 90%.
Member
Статус: Не в сети Регистрация: 26.03.2012 Фото: 2
VINRARUS писал(а):
1) в лучшем случае HT дает прибавку 25% на ядро (8 потоков по мощности равно 5 ядрам), в худшем дает убыток; в модуле бульдозера ядра куда более самостоятельны и способны дать прирост под 100%, но это учитывая что сами отдельные ядра изначально не такие производительные как в интела 2) дополнительные потоки HT (почти софтверные) по фотографии кристала никто не сможет найти, в отличии от 2х отдельных (физических) ядер в 1 модуле бульдозера: картинка 3) вырубив HT пользователь с большим трудом сможет заметить разницу, вырубив по 1 ядру в модуле бульдозера (если бы это было возможно) пользователь сразу заметит ощютимое падение мощности где то в 2х раза
Надеюсь максимально ясно обьяснил суть.
максимум тянет на 3-5 класс общеобразовательной школы, как по орфографии и пунктуации, так и по смыслу сказанного)
Fatronix 90% даже удвоение физических ядер не всегда дает o_O...посмотрите на недавние тесты процессоров амд x2 x3 и x4 того же феникса....вообще у него не самая лучшая репутация...много нареканий что он использует результаты полученные на разных конфигах в разное время прибавляя их к результатам в новых статьях...такой своего рода копипаст из статьи в статью...и доверия к его тестам не так много...
Кроме того вызывает некоторые вопросы исключительность i5 650...тесты i3 2xxx такого прироста не показывали...даже близко...(хотя HT там неплохо выступил)....тестирование так же было на этом сайте...
Member
Статус: Не в сети Регистрация: 12.04.2012 Откуда: UA, Чорнобиль. Фото: 37
AlexUnderUA писал(а):
максимум тянет на 3-5 класс общеобразовательной школы, как по орфографии и пунктуации, так и по смыслу сказанного)
Объясни лучше, умник с 7го Б.
И только тогда твое мнение будет иметь ценность, а пока только обиженный писк из под тапка)
_________________ 1я блокировка по нац. признаку это ксенофобия. 2я блокировка сразу после 1й по той же причине это уже расизм. 3я такая же будет фашызмом. Растёте...
Последний раз редактировалось VINRARUS 21.08.2013 23:19, всего редактировалось 2 раз(а).
Надо сказать забавно наблюдать что в некоторых играх удвоение физических ядер АМД дает приблизительно тоже самое что и HT от интел o_O....при том что HT само по себе ничего "вычисляющего" в ядро не добавляет...
На заре HT были разговоры что современные (на тот момент) процессоры интел в ряде случаев простаивают чуть ли не на 70%...но в это по большому счету не верилось...многопоточного софта не было...чтобы это доказать...и даже интел оперировала цифрами порядка 30%... Не знаю....рад бы поверить в результаты, но нет доверия к фениксу...
а так конечно HT перспективная штуковина...недооцененная на заре появления...при учете транзисторного бюджета затрачиваемого на нее!!! даже 30% резалт весьма неплох!
Мемbеr
Статус: Не в сети Регистрация: 07.03.2011 Фото: 7
KT Ну тут с другой стороны чего удивительного, на слабом проце наверно лучше технология HT проявляет себя, тем более Battlefield Bad Company 2 вышла раньше чем core i3 2ххх, да у них разные архитектуры. А нам не как не проверить эти тесты, авторы статьи не публикуют скрипты от AutoHotkey. Ну вот я не знаю на минималках с процессором core i3 540 c разгоном до 4.2 в игре battlefield 3 стабильный 60 фпс разрешение монитора 2560*1440
Кстати была одно время идея протестировать P4 в современном софте с HT и без...с одной стороны было бы интересно...но по большому счету даже с HT имеющийся у меня в наличии проц безнадежно слаб...вся "идея" заглохла на стадии подбора софта...хотя подобные статьи выходили на ПС но давненько... Сейчас нужен по-хорошему Pentium 631@5Ghz для этих целей.... Да и тот окажется в лучшем случае на уровне двуядерного Conroe +1-2MB кэша@2.0Ghz aka e4400...
Последний раз редактировалось KT 21.08.2013 23:28, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 12.04.2012 Откуда: UA, Чорнобиль. Фото: 37
KT писал(а):
а так конечно HT перспективная штуковина...недооцененная на заре появления...при учете транзисторного бюджета затрачиваемого на нее!!! даже 30% резалт весьма неплох!
Но главная проблема в том что неопытные хомячки думают будто у 8ми поточного i7 все потоки равны между собой (то есть соответствует 8ми ядерному ЦП).
_________________ 1я блокировка по нац. признаку это ксенофобия. 2я блокировка сразу после 1й по той же причине это уже расизм. 3я такая же будет фашызмом. Растёте...
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 16
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения