Соблюдение Правил конференции строго обязательно! Флуд, флейм и оффтоп преследуются по всей строгости закона! За статью можно проголосовать на странице материала.
Значит в 2015 будет большой Maxwell GM200 (в первом квартале )-потом по идее вторая генерация Maxwell по 16нм FinFet (GM 214 и GM 210) -далее Pascal (Gp 304 и Gp 300) и если Pascal тоже на 2 Генерации растянут -то последующии Volta (GV 404 и GV 400)-черте когда будут и явно позже 2017 года Хотя возможно Nvidia и не будет растягивать каждую Архитектуру на 2 года
Member
Статус: Не в сети Регистрация: 23.10.2011 Откуда: MO г. Балашиха
Всё может быстро поменяться, если постарается AMD со своими пиратскими островами. Это я сейчас про HBM говорю. Если реально HBM появится на решениях от AMD уже 2015 году, то тянуть с Pascal (где нечто подобное уже запрограммировано) не будет ни какого смысла. Pascal надо будет выводить уже в 2016 году.
_________________ Лучше гнать процессор, чем пургу.
Member
Статус: Не в сети Регистрация: 21.04.2012 Откуда: Юг Руси Фото: 1
Улица1905года писал(а):
тоже на 2 Генерации растянут -то последующии Volta (GV 404 и GV 400)-черте когда будут и явно позже 2017 года Хотя возможно Nvidia и не будет растягивать каждую Архитектуру на 2 года
Мы там сначала увидим что-нибудь вроде gtx1250 ti, но на вольте)
_________________ Ищу рабочий процессор QX9770 со степпингом slawm РУССКИЕ ИДУТ!
Если я правильно интерпретировал скрин, то >40TFlops на один ускоритель и на 10% большее потребление чем Titan
Нет, это на "1 Node". на него же придется и 800ГБ NVRAM. Собственно, вопрос стоит сколько NVRAM связано с каждым GPU...
Добавлено спустя 5 минут 8 секунд:
San Sanich писал(а):
Всё может быстро поменяться, если постарается AMD со своими пиратскими островами. Это я сейчас про HBM говорю. Если реально HBM появится на решениях от AMD уже 2015 году, то тянуть с Pascal (где нечто подобное уже запрограммировано) не будет ни какого смысла. Pascal надо будет выводить уже в 2016 году.
Там не такая уж и большая разница, на самом деле. Конечно, если поставить не 1.25ГГц HBM, а 2ГГц, то псп будет не 640ГБайт/с а 1Тбайт/с. Но "8ГГц" GDDR5 выдаст на модуль 32Гбайт/с (32 битная шина стандартного GDDR5 модуля). при 512-битной шине это будет 0.5Тбайт/с и 0.384Тбайт/с при 384бит. Т.е. вполне соизмеримо.
Member
Статус: Не в сети Регистрация: 23.10.2011 Откуда: MO г. Балашиха
aasheron писал(а):
при 512-битной шине это будет 0.5Тбайт/с и 0.384Тбайт/с при 384бит. Т.е. вполне соизмеримо.
HBM имеет ещё несколько плюсов с точки зрения производительности. 1. Очень короткие сигнальные линии. HBM располагается либо сверху кристалла (3D упаковка) либо рядом с кристаллом (2,5D упаковка), на одном куске текстолита с самим процессором. Длинна сигнальных линий очень маленькая по сравнению с GDDR5. Выигрыш в задержках даёт куда лучший потенциал для реализации теоретической максимальной пропускной способности. 2. Задержки HBM такие же как и у типичной GDDR5 за исключением того, что tCK = 1T вместо 4T у GDDR5. 3. Память с 8000 МГц может оказаться высоколатентной. Чудес не бывает. Посмотрите на задержки обычной DDR3 1066 (7-7-7) и 2133 (11-11-11, если не выше). Выше частота, выше задержки.
_________________ Лучше гнать процессор, чем пургу.
HBM имеет ещё несколько плюсов с точки зрения производительности. 1. Очень короткие сигнальные линии. HBM располагается либо сверху кристалла (3D упаковка) либо рядом с кристаллом (2,5D упаковка), на одном куске текстолита с самим процессором. Длинна сигнальных линий очень маленькая по сравнению с GDDR5. Выигрыш в задержках даёт куда лучший потенциал для реализации теоретической максимальной пропускной способности.
Теоретически да, но практически почему-то нет. А вот одновременная передача RAS и CAS - вполне интересное улучшение.
San Sanich писал(а):
2. Задержки HBM такие же как и у типичной GDDR5 за исключением того, что tCK = 1T вместо 4T у GDDR5.
Задержки стоит измерять все-таки в наносекундах, а не в тактах. И следует помнить, что хотя управляющие сигналы идут у HBM быстрее, считывание с одного банка будет медленнее, чем у GDDR5.
San Sanich писал(а):
3. Память с 8000 МГц может оказаться высоколатентной. Чудес не бывает. Посмотрите на задержки обычной DDR3 1066 (7-7-7) и 2133 (11-11-11, если не выше). Выше частота, выше задержки.
Пересчитайте в наносекунды. Для того, чтобы иметь точно такие же задержки как у 1066 7-7-7, памяти 2133 достаточно иметь тайминги 14-14-14. Но это задержки на управлении, а передача данных будет быстрее за счет более высокой частоты.
Добавлено спустя 22 минуты 44 секунды:
gaduka писал(а):
решил написать про свой опыт с NV видяхами
потерял кучу ноутбуков из-за NV -- > теперь боюсь брать видяхи NV
Member
Статус: Не в сети Регистрация: 23.10.2011 Откуда: MO г. Балашиха
aasheron писал(а):
Теоретически да, но практически почему-то нет.
Вы наверное имеете в виду те лохматые времена когда на мобильных видеокартах рядом с чипом присобачивали ещё и обычную графическую память? DDR2 если я правильно помню. Тогда от этой технологии отказались по причине того, что память просто отваливалась. Видимо из - за неблагоприятного температурного режима. Да и сами графические чипы были довольно слабыми не требовавшими огромных значений ПСП. Может и несовершенные контроллеры памяти резали этот профит.
aasheron писал(а):
Пересчитайте в наносекунды. Для того, чтобы иметь точно такие же задержки как у 1066 7-7-7, памяти 2133 достаточно иметь тайминги 14-14-14. Но это задержки на управлении, а передача данных будет быстрее за счет более высокой частоты.
К сожалению, разница между задержками 13 нс и 10,3 нс почти незаметна. Даже частоты не помогают. Проблема в том, что не происходит заметного падения задержек. Практически с эпохи первой DDR задержки остаются в пределах 12-15 нс. Они как якорь, не дают двигаться дальше.
_________________ Лучше гнать процессор, чем пургу.
Вы наверное имеете в виду те лохматые времена когда на мобильных видеокартах рядом с чипом присобачивали ещё и обычную графическую память? DDR2 если я правильно помню. Тогда от этой технологии отказались по причине того, что память просто отваливалась. Видимо из - за неблагоприятного температурного режима. Да и сами графические чипы были довольно слабыми не требовавшими огромных значений ПСП. Может и несовершенные контроллеры памяти резали этот профит.
Тут стоит учесть, что GDDR5 организационно все-таки проще, чем HBM, где на один канал попадает несколько банков. Да, свой внутренний контроллер (5-ый нижний слой) вносит свой плюс, но на весомые задержки я бы не рассчитывал. Да и отсутствие WCK (удвоенной частоты для передачи данных) в итоге скажется не самым лучшим образом. Разве что если реализуют впоследствие стэковую GDDR5M.
San Sanich писал(а):
К сожалению, разница между задержками 13 нс и 10,3 нс почти незаметна. Даже частоты не помогают. Проблема в том, что не происходит заметного падения задержек. Практически с эпохи первой DDR задержки остаются в пределах 12-15 нс. Они как якорь, не дают двигаться дальше.
Задержки на смене строки, банка, ряда - они особо ниже не станут просто потому, что физические явления начинают противиться. Вот и получается, что прогресс идет в том, как меньше потратить времени на считывание/запись, а вот управление не меняется.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 15
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения