При исполнении на Kentsfield несколькихпотоков возникают проблемы связанные с организацией общения между ядрами но не с ПСП шины ФСБ.
Да, это тоже. Но уж если есть такая проблема, то почему бы не поменять всю шину, решив и другие проблемы?
Цитата:
Шинная организация системы имеет свои недостатки. В системе, содержащей два или более процессоров (процессорных ядер), шина FSB ограничивает пропускную способность при доступе в память. Использование режима передачи данных QDR с относительно невысокой частотой синхронизации приводит к дополнительным потерям времени при обращении в память — на обращение тратится несколько тактов синхронизации шины, что может увеличить латентность доступа на 20-25 нс и более. Наконец, шина FSB может являться узким местом при наличии внешних устройств с очень высоким темпом передачи данных (например, коммуникационных контроллеров в кластерах).
_________________ Цель спора есть изменение природы истины.
Заблокирован Статус: Не в сети Регистрация: 09.07.2006 Откуда: москва
Diocilis писал(а):
потому как распараллелить программу на такое количество веток, практически невозможно и я, откровенно говоря, сомневаюсь, что появятся компиляторы способные делать это эффективно не прибегая к ручной работе программиста
Лучше поспите, и Ваш уставший ум хорошенько отдохнёт. Во-первых, G80- одноядерный чип. Во-вторых, у G80 128 потоковых процессоров (НЕ ЯДЕР), и все они по сути - блоки FPU.
А эти 80 ядер именно FPU и являются, это - раз. Чем принципиально отличается потоковый процессор от отдельного ядра, это - два. Единственное отличие от G80 это способность обмениваться данными между примитивными блоками FPU. Добавлено спустя 4 минуты, 57 секунд
lndeo писал(а):
Если не будет ссылки, то я попрошу нас рассудить. Это вообще похоже на провокацию и заведомую лож
Ну как, рассудили? В многопроцессорных системах общая шина это зло. Мало того что по ней надо данные гонять, так еще и между процами общаться. Добавлено спустя 3 минуты, 36 секунд
TyyOx91 писал(а):
Разница есть - и довольно существенная. Например АДА и Жава не требуют портирования с ОС на ОС. В худшем случае - перекомпиляцию. И не требуют от програмиста глубокого знания операционных систем и системных вызовов.
Это не преимущество языка - это возможности рантайма. Точно так же подключаем кроссплатфоменную библиотеку к любому другому компилятору и все.
Зачем же сразу мешать кроссплатформенность и поддержку многопоточности?
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Diocilis писал(а):
это может говорить только о том, что большая часть програмного кода и данных сидела в кэше возьмите калькулятор и посчитайте, какая нужна пропускная способность шины, чтобы эффективно снабжать данными 4х ядерный процессор с производительностью 32.5 мегафлопа ??? при учете, что одна типичная sse инструкция длинной 128 бит
Более 32ГБ/с при реальной ПСП <8ГБ/с. Таким образом, при потоковой обработке, 4-ядерный процессор будет ограничен именно ПСП.
Особенно тяжелая ситуация с серверными системами на 4-ядерных Xeon Clovertown, где каждый процессор имеет менее 4ГБ/с доступной ПСП.
Поэтому AMD не врет говоря о 40% преимуществе K10 в ряде задач над Clovertown. Просто у K10 реальный ПСП будет минимум вдвое больше чем у Clovertown.
скажем так для расчета изображений методом рейтрейсинга, я особой разницы не вижу
Ошибаетесь. На сайте GPGPU лежит исследование производительности райтрейсинга на разных процессорах. Х1900ХТХ только в 1.5 раза быстрее одноядерного оптерон 2.4 Ггц и в 5 раз медленнее Cell. Традиционные GPU мало подходят для райтрейсинга (и для любых других задач с интенсивным обменом данными между потоками).
Айс
Цитата:
Единственное отличие от G80 это способность обмениваться данными между примитивными блоками FPU.
Это и есть качественное отличие. В этой ветке я уже раз пять просил людей внимательно почитать презентации Интел - сами по себе ядра ничего не значат. Главное это межядерный интерфэйс. Приводя аналогию по нашему с вами спору - зачем нужны треды когда можно плодить независимые процессы с помощью fork() и весь обмен данных осуществлять через пайпы?
Intel has no plans to bring this exact chip designed with floating point cores to market. However, the company's Tera-scale research is instrumental in investigating new innovations in individual or specialized processor or core functions, the types of chip-to-chip and chip-to-computer interconnects required to best move data and most importantly, how software will need to be designed to best leverage multiple processor cores. This Teraflop research chip offered specific insights in new silicon design methodologies, high-bandwidth interconnects and energy management approaches.
Цитата:
Точно так же подключаем кроссплатфоменную библиотеку к любому другому компилятору
Если бы ещё найти, где раздают такие библиотеки под трединг... Впрочем мы так уже сильно отвлеклись.
Последний раз редактировалось TyyOx91 13.02.2007 8:09, всего редактировалось 1 раз.
Заблокирован Статус: Не в сети Регистрация: 30.05.2006 Откуда: kiev.ua
Айс Я согласен, что интеловские склейки - зло, и что у них проблемы при общении ядер с разных кристаллов. Не спорю и не спорил. Но вы писали о том, что Pentium D нагружает шину под завязку. Поскольку оснований так говорить нет это похоже на заведомо ложную информацию.
что интеловские склейки - зло, и что у них проблемы при общении ядер с разных кристаллов.
Склейки это не зло. В какой-то мере можно говорить, что медленный FSB - это зло (для многоядерных процессоров). А в том общаются процессоры - через кроссбар или через внешную шину - принципиальной разницы нет. В обоих случаях процессоры используют общую шину (кроссбар - это мультиплексер запросов от ядер). Поэтому, хоть передача данных через кроссбар и быстрее в абсолютных величинах, но при этом имеет абсолютно аналогичную "склейке" маштабируемость на n-oe число процессоров, так как имеет аналогичный "склейке" одноуровневый интерконнект (обработка взимозапросов между двумя какими либо ядрами, блокирует общую шину и не даёт "разговаривать" другим ядрам).
Не много не понял - имеются ввиду процессоры без общего кэша?
Имеется в виду, что пропускная способность текущей версии интеловской FSB меньше пропускной способности памяти. Хотя в какой-то степени это и удаётся компенсировать за счёт кэшей и префетчей.
Впрочем, всё это уже офф-топ.
Member
Статус: Не в сети Регистрация: 12.11.2004 Откуда: Владивосток
Дык если они трехмерную связь забацают, да еще один комногим не близлежашим этож МОЗГ ОБЫКНОВЕННЫЙ получитцо...
И терминатор с судным днем, паимаешь...
Member
Статус: Не в сети Регистрация: 29.10.2006 Откуда: Екатеринбург
Vail писал(а):
Michael1976 писал(а):
все процессоры работают не зависимо , можно выключать отдельные части от каждого процессора , асинхронная работа внутренних шин информации , для того , что-бы уменьшить пики тока , возможность отключать отдельные процессоры в случае перегрева и перекидывать нагрузку на другие... да и много чего другого...
Member
Статус: Не в сети Регистрация: 01.07.2005 Откуда: москва
KUTAE3 писал(а):
хм, кто-нить К9 видел, почему сразу К10?
К9 высокочастотный проект который должен было противостоять невышедшему Tejas когда стало ясно что этот самый Tejas загнулся К9 закрыли, так как надобность в нём отпала...
Айс Я согласен, что интеловские склейки - зло, и что у них проблемы при общении ядер с разных кристаллов. Не спорю и не спорил. Но вы писали о том, что Pentium D нагружает шину под завязку. Поскольку оснований так говорить нет это похоже на заведомо ложную информацию.
Для домашнего компьютера склейка не зло, а экономически оправданное решение. А вот в многопроцессорной системе это становится узким местом. Для поддержания когерентности кеша например. А то что ПСП интеловской шины ниже чем ПСП двухканальной памяти - это давно не для кого не секрет. Другое дело, что у АМД и встроенный контроллер не очень то решает эту проблему.
KUTAE3 писал(а):
хм, кто-нить К9 видел, почему сразу К10?
Как никто не видел? А как же "К9 - собачья работа" с Белуши?
Заблокирован Статус: Не в сети Регистрация: 30.05.2006 Откуда: kiev.ua
Obscured писал(а):
Да, это тоже. Но уж если есть такая проблема, то почему бы не поменять всю шину, решив и другие проблемы?
Вот тут я не понимаю почему они так настойчиво это делают. Похожим вопросом я задавался, когда Интел переходила на НетБарст. Но сейчас Интел говорит о слиянии серверной, мобильной и настольной архитектур, это может значить смену философии вообще (не только в плане контроллера, но и каких-то фишек Итаниума, например)
Айс писал(а):
ПСП интеловской шины ниже чем ПСП двухканальной памяти - это давно не для кого не секрет. Другое дело, что у АМД и встроенный контроллер не очень то решает эту проблему
У Интел вообще шины какие-то не очень прогрессивные.. что ФСБ, что CSI чем больше знаеш, тем меньше хочеца покупать комп
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 27
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения