Часовой пояс: UTC + 3 часа




Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 92 • Страница 5 из 5<  1  2  3  4  5
  Пред. тема | След. тема 
В случае проблем с отображением форума, отключите блокировщик рекламы
Автор Сообщение
 

Main Character
Статус: Не в сети
Регистрация: 03.12.2004
mo3ulla писал(а):
есть мнение что это стало возможным не изза архитектуры а изза редизайна планировщика . научившегося сливать 2 интсрукции в одну и поддерживать компот .

Ну понятно, что раз SIMD, то мы просто склеиваем-режем. Но как минимум надо еще все регистры и кеши под это подогнать.
mo3ulla писал(а):
вы серьзно утверждаете что это требует полного редизайна чипа

Я такого нигде и не утверждал. Разве максвелл был полным редизайном кеплера? Покрутили там и сям, поправили узкие места с учетом задач. Тут тоже самое по сути, GP100 заточен считать, GP102/104/106 на графику.

_________________
Исследования показывают, что хранить лестницу в доме опаснее, чем ружье. Поэтому у меня 10 ружей, на случай, если какой-нибудь псих попытается протащить лестницу.



Партнер
 

Member
Статус: Не в сети
Регистрация: 15.12.2015
Я считаю, Хуанг занесет за меня игроделам...


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
4e_alex писал(а):
Если так рассуждать, то и максвелл - это

серий архитектур которые начались на "ферми" те первые полноценно основанные на унификации шейдерного массива. собственно с чего грубо говоря началась и гсн.
все остальное это допол и перепил с поиском "единственно верного решения" и добавлением чего то нового (вроде хардварной очереди в гсн) но это мелочи. так или иначе основные элементы гпу претерпевают очень мало изменений... но кардинально они не меняются как пример новые методы сжатия текстур, новые геометрические блоки (в том же паскале изменения не столько значительные даже по сравнению с полярисом).

4e_alex писал(а):
В паскалевском SM как минимум переработан warp scheduller (а вероятно и вся прочая логика по запуску инструкций), раз они прикрутили нормальный preemtion/async.

он не переработан он - доработан. разница колоссальна создание нового планировщика как минимум займет ~5 лет и даже если у нв эти идеи были после максвелла то увидим мы новый (реально новый) планировщик не раньше вольты или даже позже. невозможно разработать что то новое в отрыве от переработки всех компонентов - в паскале нет таких изменений.
4e_alex писал(а):
ALU в SM как коренное изменение архитектуры?

изменения именно на уровне стриминговых процессоров это один из факторов наращивания производительности - паскаль прибавил мало "мускул" (физических блоков) и берет "силой" (частотой). sm в паскале изменились слабо основные изменения это откат к кеплеру и "новый" полиморф движок который все эти новомодные технологии и дал вроде вр и тд
конкретно на данный момент основным фактором изменения архитектур это см и рост юнитов все остальное будет давать рост производительности но меньше чем юниты - частоты... для того чтоб дать "буст" нужно как минимум пересмотреть принципы формирования изображения часть 2. и конкретно что это будет даже в помине не известно.
4e_alex писал(а):
Еще они сделали нативный FP16

это вы про исполнение двух команд фп16 как команды фп32 при некоторых исключительных обстоятельствах? и при этом фп16 всегда было нативно в карта, но конкретно нв предлагает режим "объединения" команд для ускорения расчетов... но это именно только определенные команды и не совсем это решения на проверку хардварное хотя я например надеялся что оно полностью железное.
4e_alex писал(а):
Ну и банально в спеках у GP104 cuda compute capability 6.1 вместо 5.2 у GM204. Nvidia до сих пор не обновила документацию, но скачок версии говорит о функциональных отличиях, на уровне поддержки дополнительных инструкций.

я уверен что ничего особого переход с в4 на в5 не дал ничего... как бэ выразится. в потребительской суда уже давно все реализовано и работает а вот там где идут суперпк вычисления в области наук и бла бла вот там есть рост добавляют совершенно узкие апи для решения конкретных проблем а версии... шлепают от балды? у винды10 до релиза была сборка билда 9 а в какой то момент стало 10 - магия чисел... те понту было бы меньше если обновление было 5.3 или пример с браузерами которые десятки лет развивались с нормальными версиями а потом пришел хром... и вот уже в50 это нормальная версия.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Main Character
Статус: Не в сети
Регистрация: 03.12.2004
mag_ai писал(а):
sm в паскале изменились слабо основные изменения это откат к кеплеру и "новый" полиморф движок который все эти новомодные технологии и дал вроде вр и тд

Какой откат к кеплеру? Обратное наращивание =/= откат. Функционально то блоки изменились.
Например, смотрим тут первую табличку http://www.anandtech.com/show/10325/the-nvidia-geforce-gtx-1080-and-1070-founders-edition-review/9
Потом вспоминаем, что кеплеры не умеют dx feature level выше 11_0
mag_ai писал(а):
это вы про исполнение двух команд фп16 как команды фп32 при некоторых исключительных обстоятельствах? и при этом фп16 всегда было нативно в карта

В последний раз FP16 был нативно у nvidia аж в GF FX. Все последние поколения просто дописывали нули и считали его как FP32. Кстати, в полярисе тоже заявлено добавление нативного FP16, заключается в экономии кешей и регистров (FP16 хранятся как FP16, а не FP32). В паскале есть это + 2xSIMD.
Если это так просто делается в драйвере (впечатление, что здесь все кроме меня разработали минимум по 3 графические архитектуры), то почему раньше не сделали, и почему этого нет в полярисе.
mag_ai писал(а):
я уверен что ничего особого переход с в4 на в5 не дал ничего

Ну это уже гадание начинается. Как минимум унаследован нативный FP16, который появился в 5.3 (GF с 5.3 не было)
http://docs.nvidia.com/cuda/cuda-c-prog ... pabilities
Но раз 6.1, значит есть еще что-то (в 6.0 заявлены операции, связанные с унифицированной памятью, но это больше к GP100)

_________________
Исследования показывают, что хранить лестницу в доме опаснее, чем ружье. Поэтому у меня 10 ружей, на случай, если какой-нибудь псих попытается протащить лестницу.


 

Member
Статус: Не в сети
Регистрация: 20.06.2013
4e_alex писал(а):
то почему раньше не сделали, и почему этого нет в полярисе.

А зачем? В мобильных устройствах это еще имеет смысл ради экономии всего.
А в настолках - ваще бесполезно для игр.


 

Main Character
Статус: Не в сети
Регистрация: 03.12.2004
Yalg писал(а):
А зачем? В мобильных устройствах это еще имеет смысл ради экономии всего.

Ну так настольные GPU-ядра то сейчас в tegra идут с минимумом изменений.

_________________
Исследования показывают, что хранить лестницу в доме опаснее, чем ружье. Поэтому у меня 10 ружей, на случай, если какой-нибудь псих попытается протащить лестницу.


 

Member
Статус: Не в сети
Регистрация: 28.10.2013
Откуда: Омск
Фото: 13
fantasytime писал(а):
Я считаю, Хуанг занесет за меня игроделам...

Э, ты думаешь что с юзеров после этого станут меньше брать :)

_________________
более тупого подбора слов ,можно было придумать именно со слюноотделением и нервным тиком клацкая по клаве ,от собственной беспомощности .(с) zmey1945


 

Member
Статус: Не в сети
Регистрация: 20.06.2013
4e_alex писал(а):
Ну так настольные GPU-ядра то сейчас в tegra идут с минимумом изменений.

Ну вот с приходом паскаля в тегру все и будет. Все равно с ценовой политикой Nvidia захватить приличную долю рынка - не выйдет. Только некоторые виды устройств подходят под тегру, то есть высокопроизводительные и игровые.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
4e_alex писал(а):
Какой откат к кеплеру?

я имел ввиду наращивание регисрового файла и тд
4e_alex писал(а):
Потом вспоминаем, что кеплеры не умеют

я бы о конкретизировал это иначе что кеплеры вообще были говно как интел нетбруст... в реальности кеплер хуже ферми.
пример двух разных стриминговых процессоров
#77

4e_alex писал(а):
В последний раз FP16 был нативно у nvidia аж в GF FX. Все последние поколения просто дописывали нули и считали его как FP32.

это все же нативное в отличии от полуаппаратного решения которое есть в паскале которые только определенные (сколько раз писать очень ограниченное количество инструкций) складывает и считает как одну фп32 все остальные считаются как и считались в этом плане изменений нет.
4e_alex писал(а):
Если это так просто делается в драйвере

потому что на уровне чипа нужен управляющий бит это минимум... когда задача прилетает от драйвера то она уже не контролится программно а при слиянии двух команд нужно получить - 2 разных результата по итогу и если чип это не будет понимать то посчитает совсем не то. поэтому слияние инструкций введено только для определенного типа векторов.

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Main Character
Статус: Не в сети
Регистрация: 03.12.2004
mag_ai писал(а):
только определенные (сколько раз писать очень ограниченное количество инструкций) складывает и считает как одну фп32 все остальные считаются как и считались в этом плане изменений нет.

Это ты откуда вообще взял? Там обычный SIMD. Инструкция любая, единственное условие - одна и та же инструкция на оба набора операнд.

_________________
Исследования показывают, что хранить лестницу в доме опаснее, чем ружье. Поэтому у меня 10 ружей, на случай, если какой-нибудь псих попытается протащить лестницу.


 

Member
Статус: Не в сети
Регистрация: 23.02.2013
Откуда: г. Орел
4e_alex симд не описывает само слияние те "много данных одна инструкция" вот только много чего в симд не попадает - например не все вектора в цпу могут складываться это касается всего списка от avx128 до 512 и выше... это как пример.
... откуда я это взял? конкретно была статья с разбором тех. документации на паскаль честно ссылок не осталось (точно помню не на русском).

_________________
Мертвый киберпанк с улыбкой мутанта... (:


 

Member
Статус: Не в сети
Регистрация: 20.03.2011
Откуда: Москва
4e_alex писал(а):
Инструкция любая, единственное условие - одна и та же инструкция на оба набора операнд.

Хз насчет любой, побитовых инструкций в SSE я не наблюдаю :)

_________________
I would tell you a joke about UDP, but you probably wouldn't get it.


Показать сообщения за:  Поле сортировки  
Форум закрыт Новая тема / Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закрыто  Сообщений: 92 • Страница 5 из 5<  1  2  3  4  5
-

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 22


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB | Kolobok smiles © Aiwan