Member
Статус: Не в сети Регистрация: 04.06.2005 Откуда: Оксфордшир
Ничего не слышно сможет ли графическое ядро (потоковое?) прозрачно выполнять вычисления в помощь обычным ядрам. Похоже просто продолжается процесс интегрирования северного моста в процессор.
А насчет гибкости конфигурирования я уже высказывался. Тут один процессор год отлаживают после перехода на новый техпроцесс, а сколько проблем будет при склеивании разных элементов вместе? Это только на картинках красиво и просто. А в реальности отказались даже от двух типов процессора, которые отличались лишь количеством кэша.
_________________ Таких людей уже нет, а скоро совсем не будет BTEAM_Shifty
Member
Статус: Не в сети Регистрация: 23.01.2004 Откуда: Санкт-Петербург
Цитата:
Однако, со временем все настольные процессоры AMD будут иметь в своём составе графическое ядро, которое, впрочем, может выполнять и специфические задачи вроде ускорения расчётов - это графическое ядро даже получило особое название Stream Processor Core, то есть, "потоковое процессорное ядро".
Member
Статус: Не в сети Регистрация: 15.01.2006 Откуда: Минск
Цитата:
В настольном и мобильном сегментах увеличение числа традиционных процессорных ядер не приносит адекватного прироста производительности: программное обеспечение просто не в состоянии эффективно распараллеливать нагрузку.
вот и правильно. приложения не могут сами распаралелится так просто.
Единственое что можно сделать - вручную перевести трудоёмкий процесс на второе ядро и дать приоритет реал-тайм.
Жду такой же новости от интел, или они пойдут другим путём?
_________________ У одних нефанатов рожи позеленели, у других рожи посинели. И только у правильных нефанатов рожи красные и довольные.
Member
Статус: Не в сети Регистрация: 18.03.2006 Откуда: Москва
Цитата:
вот и правильно. приложения не могут сами распаралелится так просто. Единственое что можно сделать - вручную перевести трудоёмкий процесс на второе ядро и дать приоритет реал-тайм.
Жду такой же новости от интел, или они пойдут другим путём?
Цитата:
Концепция развития многоядерных процессоров в представлении Intel напоминает известный юмористический монолог про "ну очень большие, но по пять рублей" и "очень маленькие, но по три рубля". Судя по всему, Intel видит будущее за множеством "очень маленьких, но по три рубля". Так удастся наращивать производительность при сохранении энергопотребления в разумных пределах. Самое интересное, что площадь процессора с 80 ядрами будет лишь немногим больше, чем у современных четырёхъядерных процессоров.
Member
Статус: Не в сети Регистрация: 30.07.2006 Откуда: Москва-Ярик
В моем понимании, такая архитектура является не сколько качественным, сколько количественным усовершенствованием "чипсетного" подхода. И в представленном виде, едва-ли можно говорить о плотной итеграции технологий потоковых и классических вычислений - на уровне скажем системы комманд, регистров этой интеграции нет (т.к. используются явно разделенные ядра, связанные шиной НТ). Стало быть 90% возможностей гибридных вычислений, пока остаются за бортом. Надо заметить, что размазать GPU over CPU, так чтобы это принесло хорошие результаты, задача технологически очень сложная, так что ожидать настоящие гибриды пока рановато.
_________________ Плавайте поездами Аэрофлота! И синий BSOD нам заменяет небосвод...
Жду такой же новости от интел, или они пойдут другим путём?
http://theinquirer.net/default.aspx?article=35342 What would such a vector unit bring to a, say, 4GHz follow-on core in Nehalem CPU two years down the line? Sixteen multiply-add dual ops per cycle at 4GHz gives you 128 GFLOPs peak FP throughput, or 12 times the per-core throughput in the current 2.66 GHz Kentsfield processor... After all, Nehalem is supposed to have at least four cores per die, or half a teraflop peak... How does it compare to the GPU approach, whether Nvidia or ATI, but obviously pushed first by AMD+ATI combo? Well, first of all, GPUs do have many, many more parallel pipelines than CPUs - but at much lower clock speed. By late 2008, I believe that most high end GPUs from Nvidia or ATIMD will have at least 256 unified pipelines, each running at around a gigahertz (and taking a kilowatt of power, too?). If each does a multiply-add, you again come to the same 512 GFLOPs peak number, just like in the above hypothetical vectorised Nehalem case... Problems? An obvious one - the coprocessor model is long gone from the PC programming world, so the ability to program an external coprocessor as an extension of CPU instruction set needs to be promoted all over again. You may have to rely on dedicated libraries to offload the work from CPU to GPU instead of direct extension of CPU instruction set, especially if the GPU doesn't share a common memory management model with the CPU...
Краткий перевод:
В 2008 году должен выйти Nehalem который будет иметь встроенный vector unit. Производительность для 4 ядер составит 512 GFLOP - это примерно столько же, сколько у GPU с 256 конвейерами на частоте 1 Ггц (если АМД сможет встроить такой ГПУ в проц.). Главная разница заключается в том, что для векторного блока в Nehalem выйдет новый набор х86 инструкций (не придётся менять принципы программирования) тогда как интегрированный ГПУ придётся программировать как внешний контроллер.
Ну и ещё кое что интересное:
The next generation Intel processor based on the Nehalem architecture is clearly exciting as VR-Zone has learned. Successor to quad core Yorkfield which forms part of the 45nm Penryn architecture, Bloomfield will come along and sit right on top of the 45nm Nehalem desktop processors in mid 2008. Bloomfield will have 4 cores and is capable of 8 threads like the old Hyper-Threading technology but only more advanced. Bloomfield will contain an integrated memory controller that requires a new socket refresh called Socket B with 1366 contact pads.
Последний раз редактировалось TyyOx91 22.01.2007 16:51, всего редактировалось 1 раз.
Member
Статус: Не в сети Регистрация: 04.06.2005 Откуда: Оксфордшир
Vanino писал(а):
Цитата:
Однако, со временем все настольные процессоры AMD будут иметь в своём составе графическое ядро, которое, впрочем, может выполнять и специфические задачи вроде ускорения расчётов - это графическое ядро даже получило особое название Stream Processor Core, то есть, "потоковое процессорное ядро".
Это не оно?
Это уже почти есть для обычных графических процессоров. Нужен спец софт итп. А хочется чтобы оно Само работало. Дополняло процессорные ядра как очень большой FPU
_________________ Таких людей уже нет, а скоро совсем не будет BTEAM_Shifty
Member
Статус: Не в сети Регистрация: 27.11.2006 Откуда: Воронеж
Гнусь все это, не нужен мне GPU на борту процессора, представьте как он себя при разгоне поведет (даже если и не используется)!!!
А вот VectorUnit действительно вещь полезная
новый набор х86 инструкций (не придётся менять принципы программирования) тогда как интегрированный ГПУ придётся программировать как внешний контроллер.
а почему бы для Fusion не написать тоже набор х86 инструкций?
Цитата:
Производительность для 4 ядер составит 512 GFLOP - это примерно столько же, сколько у GPU с 256 конвейерами на частоте 1 Ггц
ой, что-то я сомневаюсь.... да и софт поддержка инструкций под него может не прижиться (SSE2 если вам помнится очень долго приживалась)...
а почему бы для Fusion не написать тоже набор х86 инструкций?
Потому, что vector unit это просто дополнительный FPU интегрированный в ядро - у него будут общие с ядром конвейеры, декодеры, шедулеры и т.д. Тогда как GPU это отдельный блок на кристале, имеющий кучу юнитов никоим образом не имеющие отношния к процессору (текстурные юниты, анизотропные филтры и т.д.). Не придумывать же х86 инструкции для какой нибудь там color correction .
Member
Статус: Не в сети Регистрация: 30.07.2006 Откуда: Москва-Ярик
Diocilis
Отчасти эту проблему решат оптимизирующие компиляторы, которые, как я понимаю, обе компании смогут предоставить. Если судить здраво - решение Интел выглядит гораздо более прогрессивным, хотя-бы в плане гибкости. Вот только интересно, они действительно способны заявленные цифры обеспечить, в практическом применении....
Что касается Fusion, все публикации свидетельствуют, что эта архитектура по сути проба пера, явно не претендующая на применение в суперкомпьютинге.
_________________ Плавайте поездами Аэрофлота! И синий BSOD нам заменяет небосвод...
Если судить здраво - решение Интел выглядит гораздо более прогрессивным... Что касается Fusion, все публикации свидетельствуют, что эта архитектура по сути проба пера, явно не претендующая на применение в суперкомпьютинге.
Строго наоборот - решения Интел консервативны по самое не балуйся (здравствуй Ниагара и PowerPC), а решение АМД уже используется в "суперкомпьютинге" и та же IBM&Co. просто кипятком писаются от ее "немерянной крутости".
Кто выиграет на десктопе - ХЗ. А на "больших машинах" - выживут все подходы, только займут свои ниши.
_________________ I'm in the way, aren't I?!
Последний раз редактировалось Max Ader 22.01.2007 22:21, всего редактировалось 2 раз(а).
Member
Статус: Не в сети Регистрация: 01.07.2005 Откуда: москва
TyyOx91 писал(а):
Потому, что vector unit это просто дополнительный FPU интегрированный в ядро - у него будут общие с ядром конвейеры, декодеры, шедулеры и т.д.
Графическое ядро в первую очередь делают для того что бы графику просчитывать + в тех ситуациях когда это не нужно(используетсяд дискретное решние например и его мощности достаточно) считать физику или математику .
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 25
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения