Давно известно, когда выходит новая линейка видеокарт nvidia оптимизирует больше дрова под новое поколение, а старому не уделяет внимание, хотя с такими хар-ми как топовый maxwell он должен дать фору новому поколению, при должной оптимизации дров, но им это не интересно, я как программист поясню, дело в том что перед выходом новой линейки обычно выжимают все соки из видеокарты допилинными дровами, а новое поколение немного перепесивают код и уже эти же дрова готовы для 2ххх серии, а стараться идти выше переписывать код почти с нуля, они не хотят, а зачем проще же стоять на месте клепая каждый год под те же дрова новое железо, а если переписать код грамотно то это поколение будет наравне с maxwell, принимаю любую критику в свой адрес если я не прав
Мемbеr
Статус: Не в сети Регистрация: 13.09.2012 Откуда: Москва Фото: 19
Поздравляю автора со статьей посвященной тематике сайта! Надеюсь что набравшись опыта он сможет удивить нас новым жанром: косплей с одновременным тестированием железа...
Junior
Статус: Не в сети Регистрация: 23.04.2009 Откуда: Ташкент
Цитата:
Но ядра Тьюринг шире, что позволяет им выполнять больше инструкций за такт
бред. и тьюринг и максвелл выполняют 2 инструкции за такт. автор явно не в курсе как высчитывается производительность ядер КУДА, которая в терафлопсах измеряется.
Шаристый гость писал(а):
хотя с такими хар-ми как топовый maxwell он должен дать фору новому поколению
смотря какой представитель нового поколения. если ты думаешь, что он даст фору какой нибудь ртх2070, то ты явно ещё веришь в чудеса. против ттх не попрёшь.
смотря какой представитель нового поколения. если ты думаешь, что он даст фору какой нибудь ртх2070, то ты явно ещё веришь в чудеса. против ттх не попрёшь.
А ты походу с самого начала что я написал не читал ТТХ тут не причем, я за дрова писал, это факт который уже многие знают
Member
Статус: Не в сети Регистрация: 01.10.2004 Откуда: Саранск Фото: 25
1190Мгц - это, конечно, "неочемный" разгон, но хорошо хоть в стоке не догадались тестировать. Моя 980ти из коробки 1404мгц выдавала, когда нагревалась до 1392мгц скидывала и потом еще на шаг ниже бывало, но я отредактировал биос что бы не плясала частота, снизил в нем напругу, и усе. Единственное что потребления, конечно значительно выше чем у 1070: под 260Вт по-умолчанию и 220Вт с настроенным биосом.
Добавлено спустя 2 минуты 1 секунду:
Шаристый гость писал(а):
Давно известно, когда выходит новая линейка видеокарт nvidia оптимизирует больше дрова под новое поколение, а старому не уделяет внимание
Ой, а как уж АМД затыквила те же R9 Fury я вообще молчу... (по сравнению с полярисами)
бред. и тьюринг и максвелл выполняют 2 инструкции за такт. автор явно не в курсе как высчитывается производительность ядер КУДА, которая в терафлопсах измеряется.
И аффтор не прав, и вы не правы. До тьюрингов CUDA-ядро объединяло в себе диспетчер и int и FP32 юниты, использовался при этом только 1 юнит, второй простаивал. Сейчас же FP32 юниты напрямую подчинены скедулерам и диспетчерам SM, также int-ядра напрямую подчинены тем же скедулерам и диспетчерам. Т.е. ранее в пике SM в 128 CUDA-ядер мог обрабатывать фактически 128 int или FP32 команд за такт (не все так просто, потому что там есть как ограничения планировщиков, так и длительность обработки части команд заметно превышает 1 такт). Теперь же в 1SM в арифметическом домене 64-ре int, 64-ре FP32 плюс всякие там тензоры или массив FP16 (в зависимости от чипа). Т.е. SM при вдвое меньшем номинальном кол-ве CUDA-ядер способен обработать 64 FP32 и 64 int. При идеальной балансировке int и FP32 новый SM, несмотря на вдвое меньшее кол-во CUDA ядер способен обрабатывать такую же нагрузку так старый со 128 CUDA. Естественно, когда характер нагрузки меняется в любую сторону, эффективность падает (по понятным причинам). Это то в чем не прав аффтор. А вы не правы в том, что производительность арифметического домена CUDA-ядер больше НЕ измеряется только флопсами. По причине int-ядер.
Добавлено спустя 2 минуты 21 секунду:
vorvort писал(а):
В упор не вижу тыквы, обходит RTX 2070
Тебя снова начать тыкать лицом в факты? Или сам поймешь, что такое оптимизация на низкоуровневых API под конкретную архитектуру? А то тыкву легко предъявить, как фурии уже с 1650 начинают бороться.
Junior
Статус: Не в сети Регистрация: 23.04.2009 Откуда: Ташкент
Шаристый гость писал(а):
А ты походу с самого начала что я написал не читал ТТХ тут не причем, я за дрова писал, это факт который уже многие знают
дрова могут только то что им позволяют ттх. сверх никто ничего не даст.
Azaphrael писал(а):
И аффтор не прав, и вы не правы.
вся простыня что ты расписал мне по боку. в официальных спецификациях любого гпу указывается максимальная производительность шейдерного блока в операциях с плавающей запятой одинарной точности. она высчитывается путём умножения количества алу на 2 (количество исполняемых инструкций за такт), затем на тактовую частоту ядра. баста. а то что ты считаешь правильным или нет, это твоё дело. я привожу данные которые используются официально.
Member
Статус: Не в сети Регистрация: 07.09.2006 Фото: 1
Хотелось бы увидеть сравнение с старой GTX 770 и народным разогнаными процессорами Core i5 2500К, i7 2600K стоит ли с них делать апргрейд или все еще тянут?
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 12
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения