Member
Статус: Не в сети Регистрация: 28.08.2005 Откуда: Россия Питер
Antinomy писал(а):
expert demon Неудивительно такое слышать о человека с подобной подписью.1. Без камней делать оценки можно легко - есть не один обзор, на данные которых я опираюсь2. Можно выводы делать даже без обзоров - на одной только доке. Она есть. Можно находить интересные новшества.
тебе не всё равно какой псевдоним? сам потвердил, сделал солянку из чужих тестов, интересно то что ты своё ИМХО обозвал экспертным выводом, сами выводы у всех разные, из того что невидел сделал точный вывод молодца, хрустальный шар у тебя не врёт.
serj писал(а):
Проблема 64*2 vs 128 несколько в другом и подводных камней там больше, чем кажется.RAM это не море, здесь надо обращаться к конкретным адресам в памяти, а не просто зачерпнуть воды. Потому 64*2 далеко не факт, что будет лучше 128.Второй момент - допустим контроллеров памяти два, а сколько очередей к ним и как работает взаимная пересылка данных между ними?Раз конфигурацию памяти можно менять на ходу, то это означает, что они всегда работают в режиме 64*2, но в режиме '128' действует жесткая привязка очередей. Я хочу сказать, что - тогда даже в режиме '128' контроллер работает не так, как в К7/К8.Если мне не изменяет склероз, блок передачи данных по шине у К7/8 был 64 байта? Значит блок операций с памятью должен быть кратен 64 (разбивать на субблоки - бред). Значит - в режиме '128' единицей передачи данных по RAM будет 128 байт (Привет Intel!)Мда, отличное улучшение.
гг серж откуда скопировал с хобота? я там видел подобное 8)
о...Апять битвы титанофф начались, не судьба дождаться широкого распространения камней, да и вообще, плевать на производительность, даёшь экономику! где те времена, когда брали Axpююю он что пней рвал, ну и будет феном приблизительно равен коредуба, что выбрать,конечно феном....ааа
_________________ -Приборы?!-Триста!-Что триста?!-А что приборы?!
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Knock2007 писал(а):
На скольке мне известно на кваде 8 метров кэша. Интел значит смогла как то преодолеть сложность.
Значит вам плохо известно. Квад это два ядра на одной подложке, то бишь там два кристалла. Сделать два маленьких кристалла проще чем один большой. Так же было с PentiumD. А потому там не 8, а 4+4 как у Конро. Да, конечно, это опечатка. Спасибо, исправил. serj Да, вот такой вопрос тоже интересен. Думаю для этого надо сравнивать разные способы двухканального доступа к данным в синтетике (теории) и смотреть как меняется скорость при разных конфигурациях в кодировании. По части 128-бит - не знаю, как работать начинают контроллеры, но в принципе поскольку задача проста - брать 64 оттуда и оттуда то можно как выключать очередь на одном контроллере (master\slave), так и просто дублировать (один из запроса вычленяет primary 64 блок, другой secondary). Добавлено спустя 2 минуты, 39 секунд
expert demon писал(а):
тебе не всё равно какой псевдоним?
Я разве о псевдониме?
expert demon писал(а):
что ты своё ИМХО обозвал экспертным выводом
Там кавычки неспроста и предисловие
expert demon писал(а):
откуда скопировал с хобота?
Везде ошибаются, на Хоббитах уж точно не меньше.
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Хочу увидеть хотя-бы нормальный многопоточный тест ПСП на феномах. Для моих задач (квантовая химия) ПСП жизненно важна, фактически все в нее упирается на Core2.
Недавно буквально делал симуляцию -что мне даст переход с теперешней 9x400=3600 + DDR2-800 до 8x425=3400 + DDR2-1020.
Оказалось, счет идет на 18% быстрее, при меньшей частоте процессора. Осталось только закупится сверхдешевой DDR2-1000 G.Skill пока она есть
В идеале добратся бы до стенда с K10 под Linux и потестировать.
Advanced member
Статус: Не в сети Регистрация: 10.04.2003 Откуда: Москва
Cronos, думаю, на К10 будет хуже. Думы основаны на проверенных слухах. Барселона лучше работает в многотасковом режиме. Если нужен однотасковый быстрый-быстрый доступ к памяти, то C2D. А вот C2Q уже не советую, у C2D очень эффективный L2 по своим ядрам.
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Cronos Помню-помню твои изыски по сему вопросу на dual clover и 680\P35. serj Он же писал - многопоточный и перерыл он и четырёх и восьмиядерные платформы в поисках счастья. И ещё вроде кодирование видео у тебя было. Сегодня придумал одну интересную константу (именно константу, хотя ожидал функцию) на K8 для одного из параметров ПСП. Но основано сие на тестах Хобота. Сейчас попросил знакомого протестить один вопрос, потом буду ковырять дальше. Иначе с чем сравнивать контроллер K10? Не с Конро же.
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Antinomy писал(а):
Cronos Помню-помню твои изыски по сему вопросу на dual clover и 680\P35. serj Он же писал - многопоточный и перерыл он и четырёх и восьмиядерные платформы в поисках счастья. И ещё вроде кодирование видео у тебя было.
Да, приложения под mpi, параллелятся неограничено. От много-сокетных игрушек я отказался -это сейчас просто перевод денег, не оправдывают себя. Моя новая игрушка -кластер на infiniband. Купил в штатах свитч и карточки, теперь надо еще пару нодов докупить. Все будет, естественно, разгонятся и охлаждатся водой.
Может даже удастся с помощью Mosix cделать аналог shared-memory machine (хотя для моих задач это не нужно), тогда смогу через wine запускать разные тесты многопоточные вроде Fritz Chess и прочно займу первые позиции в рейтингах Кстати, C2Q имеет заметное преимущество перед C2D при запуске двух потоков (до 15-20%) за счет того что каждому доступен весь кэш в каждом кристалле и нет соревнования за доступ. Так что C2D я даже не рассматриваю.
Member
Статус: Не в сети Регистрация: 24.10.2003 Откуда: Novosibirsk
Antinomy писал(а):
CronosКогда думаю о цене, мурашки по спине Сильно много? Там интерфейс карточек какой, ради интереса?
Cronos писал(а):
shared-memory machine
Типа объединения памяти?
Если у нас тут брать - стоимость неплохого авто. Один кабель 1-метровый стоил бы 200$ Я взял с ОЧЕНЬ хорошей скидкой, но все равно прилично. За удовольствие надо платить Интерфейс карточек PCI-E 8x, infiniband SDR 4x , 10Gbit full duplex. Свитч 24 порта, латентность < 140нс .
Для приложений shared memory машина должна выглядеть как обычная многопроцесорная SMP. Например в случае 3 нодов с квадами, будет 12-процессорная машина.
Куратор Каталога ПС
Статус: Не в сети Регистрация: 08.06.2006 Откуда: СПб-Гтн, К-100
DANIIL_BJ писал(а):
Как думаешь, АМД в К11, если не раззорятся догонят интел? Для интел это уже будет 32нм...
Техпоцесс не показатель. Когда вышел К7, он был 250-нм, что не мешало ему утирать нос 180-нм копперу на одинаковых частотах. (хотя вроде амд и интел тогда почти одновременно переходили на новые техпроцессы или я ошибаюсь?)
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Duster Не совсем. Очень долго был AthlonXP Palomino, у него был 0,18, а у конкурента уже давно 0,13. Да и Prescott во времена Бартонов. В общем, AMD в плане тех. процесса всегда отставала, зато брала эффективностью на мегагерц (раз уж техпроцесс частоту ограничивает) и всякими примочками вроде SOI, Straintened Silicon и прочих. Кстати, ты мне напомнил подать заявку
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Заблокирован Статус: Не в сети Регистрация: 12.10.2007 Откуда: РАЙ
Процессор должен выполнить 4 инструкции за такт..
Это реально..
Его и надо таким делать. Все задачи распределять на 4..
Коре скорее всего их распределяет на 2.. Поэтому и такое преимущество..
А обращение к памяти все равно нужно.. На запись и чтение..
4 канала * 2 на запись и чтение * 1 канал обратного доступа в кешь 3 уровня..
с 3 уровня снова на контроллер, распределения задач
и снова 4 инструкции за такт
Я смотрю тесты, а там загрузка неоднообразная..
это говорит о том, что ядра работают, независимо..
использование одного контроллера..
Им надо все таки, подумать о реализации технологии 4 иструкции за 1 такт..
Я вот тут еще сегодня подумал, что вот контроллер что на феноме стоит..
Его недостатки..
1. Арбитр - он выбирает что отправить в память из 4 ядер.. Задержки..
При прямых каналах их нету..
2. 4 ядра и 1 контроллер.. Работа ядер зависит от контроллера...Именно его задержки..
R670 использует скорее всего новый контроллер 8 канальный.. Вполне реально шина с 512 обрезана до 256... Возможно убрали арбитра, который распределял задачи памяти.. Точность увеличена в двое.. А мы видим изменения нес контроллер памяти..
Феном также должен понести изменения в контроллере памяти..
И все таки должна быть внедрена технология распаралеливания задач.
При такой технологии, лишние блоки в 4 ядрах можно убрать, которые выполняют повторяющиеся задачи..
И это не факт что можно склеить 4 ядра.. 35% кристала это лишние транзисторы...
Все упирается в том что нужно распаралелить эти задачи..
Ядро понесет косметический ремонт..
Именно нужно работать над распаралеливанием задач...
При многоядерности..
Увеличение числа ядер много не даст..
А имея формулу распаралеливания.. А процессор в зависимости от загрузки должен иметь, свои формулы распределения задач..
1. Распаралеливание задач
2. Сгрупирование их в ряды на исполнение..
3. Защита от перевыполнения..
Исходя из этого кешь играет огромную роль.. Потому тчо у процессоров AMD задачи часто идут через память..
Не думаю что новый интел со встроенным контроллером ощутимо даст прирост.. При максимальной обработке внутри процессора информации.. Нужна в доставке в память минимальна.. 15% прироста они получат.. Добавлено спустя 25 минут, 13 секунд гнать их тоже не куда.. Пусть сосредоточаться проанализируют..
Первый работоспособный образец и сделают новый..
При числе транзисторов в 600 млн, задача не из простых..
А пример, кросс телефонных сетей..
В этой гонке голова инженеров просто опухла.. Результат показательный R600..
Новая архитектура..
_________________ Властелин колец "братва и кольцо". Гендальф: "Команда была стоять!" Конец года дефолт корок!!! Бери - не хочу!
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
Opteron 2xxx писал(а):
Коре скорее всего их распределяет на 2.. Поэтому и такое преимущество..
Нельзя распараллелить нераспараллеливаемое. Super pi тебе в помощь от пробелов. Это мечта, несбыточная любую задачу грузить на разные ядра сразу.
Opteron 2xxx писал(а):
Им надо все таки, подумать о реализации технологии 4 иструкции за 1 такт..
При чём тут IPC и контроллер? Вы скачете меж двух вещей.
Opteron 2xxx писал(а):
4 канала * 2 на запись и чтение * 1 канал обратного доступа в кешь 3 уровня.. с 3 уровня снова на контроллер, распределения задач
Пишется-читается всё через иерархию кешей, за исключением NTS и Prefetch. А стало быть разницы между 2 на запись\чтение всё равно кеш L3 будет гонять данные.
Opteron 2xxx писал(а):
1. Арбитр - он выбирает что отправить в память из 4 ядер.. Задержки.. При прямых каналах их нету.. 2. 4 ядра и 1 контроллер.. Работа ядер зависит от контроллера...Именно его задержки..
При прямых каналах идёт перезахват шины - задержки намного выше в любом случае. К тому же там 4 ядра и 2 контроллера, в этом прелесть. Это у Intel он один. Вы бы получше почитали и подумали. Видно знание мат. части, но пока неясное мне её применение. Вроде каши.
Opteron 2xxx писал(а):
Возможно убрали арбитра, который распределял задачи памяти.
Да нельзя арбитра убрать, он за Queue и out of order следит
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Member
Статус: Не в сети Регистрация: 14.12.2005 Откуда: Спб
А мне вообще пос...ть. В 99-м году перепрыгнул на AMD и мне значительно "полегчало" в жизни. Закончилась чехарда с чипсетами\памятью\процессорами. Да, где то AMD проигрывает а где то выигрывает, но я ценю эту платформу за стабильность в первую очередь и живучесть во вторую. Сейчас сижу на S939 X2 какой то там, раскочегаренный до 2,9 гГц - комп не вырубается и не перегружается месяцами. Иногда меняю видеокарты, сегодня как раз взял 512mb Palit 8800Gt (10000р. в Кей) и спокойно рублюсь в Кризис (dx9, на ХР). Думаю к осени пересяду на AM3 + Phenom + DDR3. Устаканится (как всегда это было с АМД) тех. процесс, тихой сапой пройдут новые ревизии ядер, которые спокойно можно будет гнать до 3 и выше Ггц, вот тогда во всем этом будет смысл.
А подобные заявы
StrateG-1 писал(а):
Просто объяснение того, почему К10 такая гадость по сравнению с Core!
удел прыщавых юнцов. А вообще заметил некую странность в разделении владельцев систем на AMD или Inte, можно экстраполировать с владельцев автомобилей. Intel - golf, 99-я, фокус хэтч трехдверный (чтоб деньжат на двигло помощнее хватило), в общем полная "клиника" на дорогах и в голове. Все таки владельцы AMD систем более вменяемый народ, совершенно ОСОЗНАННО и понимая что делает, выбрал эти процессоры, в отличие от сопляков, которым их системы впарили манагеры в магазинах типа Эльдорадо (Core Quad Extreme + 512 ОЗУ + 7300GT
).
Member
Статус: Не в сети Регистрация: 13.06.2005 Откуда: Владивосток
dvdm писал(а):
А подобные заявы удел прыщавых юнцов
Лично я не за AMD или Intel (хотя болею за AMD, но без фанатизма), а за правду. И разобраться - правда ли супер-пупер Pentium4 рвёт Атлон или же это взято из энцефалограммы сна маркетологов Интел - вот в чём интерес. И, главное, почему это так. И другие архитектуры тоже. Нельзя доподлинно заявить - то лучше. Можно лишь спектр задач представить и заявить что во многих задачах или задачах такого класса оно лучше.
По части сбалансированности системы вы абсолютно правы, но сейчас речь не об этом. Пока что Deem1967Headman Спасибо
_________________ Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения