читайте выше - это все были ответы на сообщения которое с чего то вдруг сравнило ай5 и вишеру - я по 10 раз принципы работы архитектур не намерен разбирать.
... ибо не умеешь и не имеешь необходимых знаний. Сообщения я читал. Вот только процессор о котором говорили - переразогнанная хрень. И только на высоких частотах он способен составить конкуренцию "противнику" работающему на гораздо более низких частотах. Если же противника разогнать...
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
aasheron писал(а):
Вот только процессор о котором говорили - переразогнанная хрень. И только на высоких частотах он способен составить конкуренцию "противнику" работающему на гораздо более низких частотах
Хрень или нет - всё познаётся в сравнении(если Пентиум 4 был таким хреновым...). Это для него штатные частоты и именно то что получит рядовой пользователь не причастный к оверклокингу. Что мешает Интел выпустить 4799 с тепловым пакетом 150-200ватт и частотой 5ГГц? - отвечать не надо, и так всем известно: маленький кристалл и термопаста вместо припоя, внутренняя конкуренция между линейками...одним словом жадность
Представьте себе если бы и в автопроме так "узко "мыслили как сейчас вы...сколько бы моделей автомобилей существовало?
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
Member
Статус: Не в сети Регистрация: 23.02.2013 Откуда: г. Орел
Asal писал(а):
Ну как скоро? Через 3-5 лет? Тогда и платформу можно будет дома менять.
давайте так у каждого цпу жизненный цикл больше чем время которое его производят на рынке еще очень много гаджетов которые в глаза не видели не встроенные граф. ядра ни опенсл ни тем более hsa - все упирается так же в желание программистов переписывать свои поделки и изучать новые возможности. то есть пример вин8 с 32-битном исполнением... хотя когда то обещали выкинуть его, но что то никак - рынок вообще пк инертен сильно. конечно есть маки скажем... вот там уже многое в приделах вк считается даже тот же новый мак про это намек на то что аппл смотрит именно на вк расчеты.
Анти-Бот писал(а):
Вот с ним в новых играх у вас скоро тормоза и начнутся!
я не понял к чему вы писали это... игры пилят на средний цпу - средний цпу на рынке 4 ядра... ед игр умеют больше.
_________________ Мертвый киберпанк с улыбкой мутанта... (:
Там сложнее, но это реально существующий большой рынок, в отличие от мизерного рынка высокопроизводительных десктопов. На серверном рынке есть за что бороться. И как показал опыт первых Opteron на K8 - при удачном процессоре вполне реально оттяпать значимый кусок.
Member
Статус: Не в сети Регистрация: 26.09.2011 Откуда: Волгоград Фото: 19
Так на диаграмме 8 ядер или 8 блоков указанны?. Могу предположить, что в данном руководстве нарисована логическая схема, чтобы программистам было проще разобраться, как делать многопоточные приложения на n ядер.
Серверостроители не смотрят рекламу. Они берут то, что им нужно. Удобнее им собрать мейнфрейм на атомах - на атомах соберут. Удобнее собрать на кавери - соберут на кавери.
_________________ Большой кот. Пушистый. Полосатый. Чёрно-белый.
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
z1000 писал(а):
В Kaveri в два раза больше транзисторов чем в Vishera. Как знать...
Там почти все эти транзисторы встроенное видеоядро съело.
Добавлено спустя 20 минут 36 секунд:
San Sanich писал(а):
Repne
ИМХО 16 ядерник, это для высокопроизводительных серверов. В десктопе с таким количеством ядер наверняка прейдётся резать частоты по самое не балуйся, что бы уложиться в рамки TDP 95-140W. Массовому сегменту FX-9590 с его 220W потребовался в ограниченном количестве.
Так и в сервеном сегменте в 12 ядерных (на базе K10 ядер как у Феномов) и 16 ядерных (на базе бульдозера) частоты тоже занижены - уровня порядка 2.5 ггц только. Впрочем как и у 10 ядерных(20 поточных с HT) серверных Intel. Однако в софте нормально оптимизированным под многопоточность, т.е. умеющим эффективно использовать все ядра, а не так что только один поток ведущий, производительностью исполнения которого и ограничивается общая скорость приложения, а все остальные только "на подтанцовке" (например большая часть игр с заявленной поддержкой многопоточности так работает) Так вот в нормальном многопоточном софте (с чем в серверном сегменте проблем обычно нет) такой подход (больше ядер, но ниже частоты в рамках примерно того же энергопакета) позволяет повысить как абсолютную скорость, так и энергоэффективность. И в десктопе такой камень был бы весьма неплох (хотя и не для игрунов, ввиду плохой поддержки многопоточности большинством игр). А для разгона вообще золото - т.к. частоты искусственно понижены относительно потенциального уровня (с целью вписаться в энергопакет), то при наличии хорошего охлаждения и запаса мощности по питанию от материнки гнались бы такие камни изумительно (процентов на 50% и более от номинала)
Но на декстоп вряд ли такие выпустят... Скорее эта секция для какого-то серверного мутанта заготовлена. У AMD были какие-то мысли насчет того, чтобы графическую встройку и в серверных сегмент пихнуть - но не для графики конечно, а чтобы встроенное видеоядро в некоторых видах расчетов помогало. Поэтому вполне позже может всплыть серверный родственных Kaveri сочетающий GCN ядра и с 16(8 модулей) х86 ядрами.
Добавлено спустя 15 минут 37 секунд:
ZloiOrk писал(а):
Так на диаграмме 8 ядер или 8 блоков указанны?. Могу предположить, что в данном руководстве нарисована логическая схема, чтобы программистам было проще разобраться, как делать многопоточные приложения на n ядер.
Там же на чистом английском прямо на схеме написано: "процессор имеет 8 вычислительных модулей (16 ядер)" Т.е. в 2 раза больше чем в старших моделях вишеры 83хх и 9ххх (4 модуля/8 ядер)
Словечки(термины) из описания впрочем тоже подсказывают что описывается какой-то серверный вариант процессора.
Так вот в нормальном многопоточном софте (с чем в серверном сегменте проблем обычно нет) такой подход (больше ядер, но ниже частоты в рамках примерно того же энергопакета) позволяет повысить как абсолютную скорость, так и энергоэффективность.
К.О. говорит о том, что в большинстве случаев в серверах есть не "многопоточный софт", а несколько копий одного приложения, или несколько пользователей одного приложения, которое по сути внутри одного процесса выделяет "виртуальные копии" для каждого пользователя. При этом в большинстве задач высокие тактовые частоты серверам особо не нужны, т.к. в БД-серверах, к примеру, гораздо важнее производительность дисковой подсистемы. А вот доп. выделенные ядра очень даже приветствуются.
Цитата:
И в десктопе такой камень был бы весьма неплох (хотя и не для игрунов, ввиду плохой поддержки многопоточности большинством игр).
Это не десктоп, это рабочая станция
Цитата:
А для разгона вообще золото
только по цене.
Цитата:
- т.к. частоты искусственно понижены относительно потенциального уровня
Ганс Христиан Андерсон? Одиночные транзисторы давно перешагнули терагерцевый рубеж, но до сих пор нет серьезных чипов хотя бы с относительно близким потенциалом. Объяснить, почему?
Цитата:
(с целью вписаться в энергопакет), то при наличии хорошего охлаждения и запаса мощности по питанию от материнки гнались бы такие камни изумительно (процентов на 50% и более от номинала)
охлаждение придется делать как у мэйнфрэйма, а в рабочей станции это недопустимо.
Цитата:
Но на декстоп вряд ли такие выпустят...
Конечно не выпустят в ближайшее время - на инженерную работу в компании, выпускающей процессоры, не берут без знания физики.
Цитата:
Скорее эта секция для какого-то серверного мутанта заготовлена. У AMD были какие-то мысли насчет того, чтобы графическую встройку и в серверных сегмент пихнуть - но не для графики конечно, а чтобы встроенное видеоядро в некоторых видах расчетов помогало.
В каких? В серверном сегменте ГПУ вычисления неактуальны. Т.е. вообще. Там им нечего обрабатывать - нет применения для числодробилок. Это удел кластеров (и то, далеко не всех разновидностей - к примеру облачные в более чем 80% случаев имеют те же требования что и сервера, т.е. большое кол-во потоков, но невысокое требование к мощности одного потока) и суперкомпьютеров.
Цитата:
Поэтому вполне позже может всплыть серверный родственных Kaveri сочетающий GCN ядра и с 16(8 модулей) х86 ядрами.
Опять же - куда и зачем? Интегрированное видеоядро может быть нужно для избавления от видеоядра в материнке, но и то, только при однопроцессорной схеме. Интегрировать в чип ГПУ, да ещё и при 8 процессорных модулях решится только отчаянный безумец. Гораздо проще усилить FP блоки в ядрах /добавить специализированный сопроцессор (который всегда будет эффективнее видеоядра).
Добавлено спустя 8 минут 8 секунд:
Garry1010 писал(а):
Толку-то, что 2 потока - это гипертрейдинг, который есть лишь дополнительный набор регистров. Всё равно они одновременно не выполняются.
Даже в одном потоке некоторые вещи выполняются одновременно (ветвления при OoOE). Уже давным-давно.
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
aasheron писал(а):
В каких? В серверном сегменте ГПУ вычисления неактуальны. Т.е. вообще. Там им нечего обрабатывать - нет применения для числодробилок. Это удел кластеров (и то, далеко не всех разновидностей - к примеру облачные в более чем 80% случаев имеют те же требования что и сервера, т.е. большое кол-во потоков, но невысокое требование к мощности одного потока) и суперкомпьютеров.
То есть вариант что серверную нагрузку могут перенести на GPU (где как раз есть так нужное для этой нагрузки огромное количество сравнительно медленных ядер) вы отрицаете категоричеки даже несмотря на то что Оракул вступил в HSA, и скоро вся Жаба может стать GPU-ускоряемой?
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
То есть вариант что серверную нагрузку могут перенести на GPU (где как раз есть так нужное для этой нагрузки огромное количество сравнительно медленных ядер) вы отрицаете категоричеки даже несмотря на то что Оракул вступил в HSA, и скоро вся Жаба может стать GPU-ускоряемой?
Вы вообще знакомы с основными типами серверов? Вкратце: Вэб, прокси, файловый, игровой, принт-сервер, БД, сервер приложений. Так вот, только сервер приложений, в неких видах приложений, может требовать каких-то серьезных расчетов. И то весьма сомнительно - обычно он делегирует эту функцию вычислительному кластеру. И это при том, что приложения с серьезными вычислениями (напомню, что основными вычислениями, для которых может быть нужна числодробилка являются большое количество FP-операций обычной и повышенной точности), доступные серверах, это единичные случаи. А прит-серверах, вэб-серверах, прокси, файл-серверах, в игровых и БД серверах во-первых нет необходимой FP нагрузки, во вторых зачастую они гораздо больше тормозятся дисковой подсистемой, не выбирая имеющейся мощности CPU.
Member
Статус: Не в сети Регистрация: 16.12.2008 Откуда: Воронеж
aasheron писал(а):
в игровых и БД серверах во-первых нет необходимой FP нагрузки
Вы так говорите будто GPU не работает с целочисленными данными и забываете что в Кавери GPU получает равноценный с CPU доступ ко всей оперативной памяти и база данных(часто используемые данные) на сервере может банально быть загружена в оперативу, поэтому претензии к дисковой подсистеме не есть повод для категорического отрицания применимости АПУ в серверах
Добавлено спустя 9 минут 56 секунд:
aasheron писал(а):
Гораздо проще усилить FP блоки в ядрах
Производители процессоров так не считают
aasheron писал(а):
добавить специализированный сопроцессор (который всегда будет эффективнее видеоядра).
ASIC-майнер который больше ничего и не умеет? - ГПУ и есть тот сопроцессор, который хоть и тупее CPU, но намного универсальнее(применимость выше, пусть и с меньшей отдачей) специализированных...
_________________ AMD Phenom II X6 1055T, Asus M4A79 Deluxe, 4gb(2x OCZ Titanium XTC OCZ2T11502G), PowerColor Radeon HD 7970 3GB
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
aasheron писал(а):
К.О. говорит о том, что в большинстве случаев в серверах есть не "многопоточный софт", а несколько копий одного приложения, или несколько пользователей одного приложения, которое по сути внутри одного процесса выделяет "виртуальные копии" для каждого пользователя. При этом в большинстве задач высокие тактовые частоты серверам особо не нужны, т.к. в БД-серверах, к примеру, гораздо важнее производительность дисковой подсистемы. А вот доп. выделенные ядра очень даже приветствуются.
К.О. конечно прав. Хотя копии приложения целиком обычно никто не запускает, "форкают" потоки внутри него занимающиеся непосредственно обработкой данных/запроса. Но разве это что-то в сказанном меняет? Маштабируемость на кол-во ядер отличная и доп. ядра никогда "лишними" не оказываются и работой загружены. Какая разница за счет чего это достигнуто и сам характер задач/нагрузки помогает?
Цитата:
Это не десктоп, это рабочая станция
Рабочая станция это одна из разновидностей десктопов
Цитата:
А для разгона вообще золото только по цене. - т.к. частоты искусственно понижены относительно потенциального уровня Ганс Христиан Андерсон? Одиночные транзисторы давно перешагнули терагерцевый рубеж, но до сих пор нет серьезных чипов хотя бы с относительно близким потенциалом. Объяснить, почему?
Не надо. Сложность участков критических к задержкам и мешающим повышать частоту НЕ увеличивается от простого размещения большего количества ТАКИХ ЖЕ одинаковых ядер на одном кристалле. Мы же не о 2х принципиально разных процессорах говорим - одном "узком" но рассчитанном на большие частоты, а другом "широком" рассчитанным на больший параллелизм но меньшие частоты. А абсолютно одном и том же процессоре. Разница только в том размещать скажем 4 копиии такого процессора на одном кристалле или же 8 штук. Частотный потенциал от этого меняется очень слабо (и зависит в основном от питания и охлаждения, которые на крупном чипе сложнее качественно обеспечить). За пруфами - можете посравнивать частотный/разгонный потенциал давно имеющихся серийных 2 3 4 "модульников" бульдозерной архитектуры.
Цитата:
охлаждение придется делать как у мэйнфрэйма, а в рабочей станции это недопустимо.
Расскажите эти сказки оверклокерам. Мы же про вариант с разгоном говорили (да и на сайте соответствующем находимся). А для оверклокера отвести от камня скажем 200-300 Вт вместо штатных 125 вт не велика проблема. И для десктопа/рабочей станции это как раз легче и проще сделать чем в серверах, где все жестко ограничено по габаритам в рамках живопырных U ящичков для стандартных стоек.
Цитата:
Конечно не выпустят в ближайшее время - на инженерную работу в компании, выпускающей процессоры, не берут без знания физики.
И причем тут физика вообще? Ограничения чисто маркетинговые - позиционирование продуктов + оценка спроса на подобную продукцию (вероятно низкий).
Цитата:
Скорее эта секция для какого-то серверного мутанта заготовлена. У AMD были какие-то мысли насчет того, чтобы графическую встройку и в серверных сегмент пихнуть - но не для графики конечно, а чтобы встроенное видеоядро в некоторых видах расчетов помогало. -- В каких? В серверном сегменте ГПУ вычисления неактуальны. Т.е. вообще. Там им нечего обрабатывать - нет применения для числодробилок. Это удел кластеров (и то, далеко не всех разновидностей - к примеру облачные в более чем 80% случаев имеют те же требования что и сервера, т.е. большое кол-во потоков, но невысокое требование к мощности одного потока) и суперкомпьютеров.
Ну хотя формально ноды для кластеров серверами не являются. Но для большинства это тоже "серверый" сегмент (градация вообще примитивная "потребительский" и "серверный", хотя и не совсем правильно) и я их тоже в том числе имел ввиду. И как раз выдержки из обсуждаемого мануала намекают что речь как раз о использовании такого процессора как ноды в кластере идет.
Цитата:
Опять же - куда и зачем? Интегрированное видеоядро может быть нужно для избавления от видеоядра в материнке, но и то, только при однопроцессорной схеме. Интегрировать в чип ГПУ, да ещё и при 8 процессорных модулях решится только отчаянный безумец. Гораздо проще усилить FP блоки в ядрах /добавить специализированный сопроцессор (который всегда будет эффективнее видеоядра).
Вы это ведущим производителям ЦП расскажите, что так можно просто взять и резко увеличить производительность FP блоков в х86 ЦП. А то они вместо этого уже очень много лет разные костыли и замены, доп. блоки, новые наборы инструкций и т.д. придумывают. Т.к. уже давно столкнулись с невозможностью дальнейшего эффективного увеличения производительности этой части "в лоб". Все GPGPU вычисления из-за этого и образовались и развились собственно.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 3
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения