"Экспертная" оценка K10

Overclockers.ru

Конференция

FAQ по конференции

Текущее время: 24.06.2026 0:05

Сообщения без ответов | Активные темы

Список форумов » Общение » Персональные Страницы

Часовой пояс: UTC + 3 часа

Новая тема /

Закрыто

Сообщений: 48 • Страница 1 из 3 • 1 2 3 >

	Пред. тема \| След. тема
В случае проблем с отображением форума, отключите блокировщик рекламы

Автор

Сообщение

Antinomy

Добавлено: 27.11.2007 2:29

[профиль]

Member
Статус: Не в сети
Регистрация: 13.06.2005
Откуда: Владивосток

Приветствую.
Данная тема посвящена обсуждению моей статьи "Экспертная" оценка K10, а в будущем возможно и всех моих аналитических статей.

_________________
Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by

Реклама
Партнер

expert demon

Добавлено: 27.11.2007 9:21

[профиль]

Member
Статус: Не в сети
Регистрация: 28.08.2005
Откуда: Россия Питер

"Экспертная" акуратнее надо называть темы, без проца К10 на руках, без своих тестов, без самой сути статьи - без всего пустая писанина, ничего нового нет, зачем написал?

TheVITALI

Добавлено: 27.11.2007 9:35

[профиль]

Member
Статус: Не в сети
Регистрация: 15.01.2006
Откуда: Минск

Нормальная заметка. Всё только на фактах основано. И ни одного слова "процессор Х рвет процессор У на 5%". просто быстрее на 5%.

так держать Antinomy !

_________________
У одних нефанатов рожи позеленели, у других рожи посинели.
И только у правильных нефанатов рожи красные и довольные.

DANIIL_BJ

Добавлено: 27.11.2007 10:44

[профиль]

Member
Статус: Не в сети
Регистрация: 25.12.2005
Откуда: Даальний восток

expert demon

Для экспертной оценки не всегда нужно иметь образец.
Есть хорошее кол-во тестов.
При этом все заявления Antinomy делались с "~".

Хорошая статья.

KOSSAK

Добавлено: 27.11.2007 10:50

[профиль]

Member
Статус: Не в сети
Регистрация: 24.10.2007
Откуда: Киев

DANIIL_BJ +1

_________________
Creative, 1С - в топку.
Я человек положительный. Мне на все положить.

Antinomy

Добавлено: 27.11.2007 12:13

[профиль]

Member
Статус: Не в сети
Регистрация: 13.06.2005
Откуда: Владивосток

expert demon Неудивительно такое слышать о человека с подобной подписью.
1. Без камней делать оценки можно легко - есть не один обзор, на данные которых я опираюсь
2. Можно выводы делать даже без обзоров - на одной только доке. Она есть. Можно находить интересные новшества.
Что касается сути тоже вроде осветил - оценка нововведений, выведенных в результатах обзоров и замечения и анализ ошибок в обзорах. Типа временного "итого"

TheVITALI DANIIL_BJ KOSSAK Спасибо, товарищи :beer:

_________________
Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by

docstat

Добавлено: 27.11.2007 12:45

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 10.05.2007
Откуда: УКРАИНА

Antinomy
давно не читал с такой легкостью... респект за статью....

_________________
Дождь не может быть вечным. Ворон.
Ненавижу админов!!!

StrateG-1

Добавлено: 27.11.2007 12:45

[профиль]

Member
Статус: Не в сети
Регистрация: 21.08.2007

Antinomy – ничего особо нового! Просто объяснение того, почему К10 такая гадость по сравнению с Core! И еще я не силен в грамматике, но подобные багги “Улучшена работа с на 20,4%.” сильно мешают! Будь повнимательнее!

_________________
Смерть - это не конец жизни, жизнь - это начало смерти!

BloodyWerewolf

Добавлено: 27.11.2007 13:22

[профиль]

Member
Статус: Не в сети
Регистрация: 17.11.2003
Откуда: Екатеринбург

Arithmetic FPU в Сандре вообще чушь полная, а не тест. Он затачивался исключительно под P4, но для Core 2 некоторые SSE3-инструкции неудобны (во всяком случае для 65нм Core 2) например такие как haddps, hsubps - в то же время на К8 эти инструкции выполняются хоть и с меньшей производительностью чем на равнорейтинговых P4/P-D, но с большей производительностью чем на Core 2 (Интел просто забила на эти инструкции, возможно из-за SSE4.1 т.к. там есть подобные инструкции но намного удобнее:

Цитата:

Packed horizontal SSE3 instructions (HADDPS and HSUBPS) can simplify the code sequence for some tasks. However, these instruction consist of more than five micro-ops on Intel Core Solo and Intel Core Duo processors. Care must be taken to ensure the latency and decoding penalty of the horizontal instruction does not offset any algorithmic benefits.

), на К10 ессно ничего не изменилось в этом плане.
Поэтому производительность SSE(2) FPU К10 лучше мерять в других программах (тем более что горизонтальные SSE инструкции медленно выполняющиеся на Кор 2 никто кроме Сандры и не использует).

_________________
|АМД процы не так уж и плохи|
|Но все-таки Интел лучше|

Opteron 2xxx

Добавлено: 27.11.2007 13:53

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 12.10.2007
Откуда: РАЙ

Я думаю что новый феном пока еще под софтину не заточен..
Да и тестят его на старье. 32 бит опер система..
Если в зачатии коре был 32 бит.. То он может весь там 32 с декодером под 64..

А AMD 64 в зачатии.. Его тестят под 32 бит смешно.. Часть проца полностью не работает. Это естественно..
Тесты загнобить.. А не выявить сильные стороны проца..

Потом не на родной платформе, и сродной видеокартой
с заточненными дровами.. Почему то нвидеа..

Нормальных тестов то и не было..
Да и сама AMD их не дает..
Хотя бы вот эта новость

AMD Virtual Experience goes 2.0
Written by Matthew Cameron
Monday, 26 November 2007 11:28
The AMD Virtual Experience has been updated to 2.0. The AVE, as it is called, contains important information concerning AMD and AMD's partners. You can find valuable information about Barcelona and VMWare as well as technologies from Novell and Microsoft.

SSE5, должен выйти либо программы должны быть оптимизированы под него..
Как в формуле 1, заточат перед стартом..

поэтому я не верю частично в тесты эти.. В реалии все по другому бывает..
Многозадачность..
Падение FPS ниже чем на интеле по тестам..

1. Проц требует переделки контроллера памяти.
2. Заточки SSE5.
3. Увеличение кеша, я вообще не согласен так как они его сделали.. Изначально его должны были использовать для передачи между ядрами..
4. Надо менять тех процесс сам..

Все что они делают, щас они продают. То что реально было готово на данный момент..
Каждый 6 месяцев будут вноситься кординальные изменения в этот процессор..

Следующий вариант нам ждать в апреле наверное..

В любом случае те кто взяли AM2 в проигрыше не будут..
Постепенно модернизироваться будут..
AMD гарантировала переход последующих 3 поколений..

А те кто не ждет их дело..
Это первые плоды...
Кор был прорывом, K8 был прорывом..
Не думаю что прорывы будут вечно..
Коре скоро истощит всю архитектуру..
Они начнут менять дизайн ядра, вот тогда и увидите ошибок станет больше..
Как когда вышел коре, нашли там кучу багов..
Которые снимают щас с производства, чтобы не позориться..

Да и потом, что интеграция 3-х канального контроллера памяти который потребляет значительно энергии, не повлияет на тепловыделение???

Им надо увеличивать производительность.. Новый интел это лишь улучшение старой архитектуры.. И может получиться как у AMD..

И кто сказал что последующие процессоры AMD будут хуже??????
Это их дело, проведут анализ, точное иследование процессов.. Выявят слабые стороны...

И будет ли играть процессор в графике прибавлять FPS.. Чем мощнее видео, тем меньше проц играет значение в работе..
Процессор как коробка передач в графики..

_________________
Властелин колец "братва и кольцо". Гендальф: "Команда была стоять!" Конец года дефолт корок!!! Бери - не хочу!

fly9969

Добавлено: 27.11.2007 14:54

[профиль] [Фотоальбом]

Member
Статус: Не в сети
Регистрация: 19.05.2007
Фото: 0

Antinomy
вам просто необходимо иметь на руках Phenom...
За статью +1.

_________________
"Лет ми спик фром май харт"

Knock2007

Добавлено: 27.11.2007 15:42

[профиль]

Member
Статус: Не в сети
Регистрация: 07.10.2007
Откуда: Belarus

Antinomy статья нормальнавя и доступная для понимания, что самое главное.
Opteron 2xxx а вроде и никто и не говорил, что проц будет без ошибок, да и на сокете он АМ2+, т.е. промежуточном между АМ2 и АМ3. А это не раз указывало на то, что уже версия на АМ3 должна будет полностью раскрыть возможности новой архитектуры.
Хотя во многом я с вами согласен. Мало еще программ оптимизированных. Тут не все многоядерность поддерживают, а тут еще сверху навалился 2-канальный контроллер памяти. Сомневаюсь я, что на данный момент много прог могут похвастаться такой оптимизацией.
И Насчет инструкций этих....... у АМДшников ССЕ5, у Интел - ССЕ4.1..... тут уже надо как в графическом сигменте вводить некий ГОСТ вроде дирекса, только для процев, а то один себе пляшет, второй себе, а программисты себе.....

_________________
Ученые долго думали - в чем измерять частоту? Так и не придумали. Вот и пишут - Hz.

serj

Добавлено: 27.11.2007 15:49

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 10.04.2003
Откуда: Москва

Antinomy,

Спасибо, читалось интересно.

Проблема 64*2 vs 128 несколько в другом и подводных камней там больше, чем кажется.
RAM это не море, здесь надо обращаться к конкретным адресам в памяти, а не просто зачерпнуть воды. Потому 64*2 далеко не факт, что будет лучше 128.
Второй момент - допустим контроллеров памяти два, а сколько очередей к ним и как работает взаимная пересылка данных между ними?
Раз конфигурацию памяти можно менять на ходу, то это означает, что они всегда работают в режиме 64*2, но в режиме '128' действует жесткая привязка очередей. Я хочу сказать, что - тогда даже в режиме '128' контроллер работает не так, как в К7/К8.
Если мне не изменяет склероз, блок передачи данных по шине у К7/8 был 64 байта? Значит блок операций с памятью должен быть кратен 64 (разбивать на субблоки - бред). Значит - в режиме '128' единицей передачи данных по RAM будет 128 байт (Привет Intel!)
Мда, отличное улучшение.
Бред написан на ненаучных рассуждениях и не основан ни на каких данных.

Opteron 2xxx

Добавлено: 27.11.2007 16:08

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 12.10.2007
Откуда: РАЙ

serj писал(а):

Antinomy,

Спасибо, читалось интересно.

Проблема 64*2 vs 128 несколько в другом и подводных камней там больше, чем кажется.
данных.

4 - ядра, требуют постоянного доступа к памяти..

Шину HT готовы повысить до 4000 Мг..

Недоработки, надо иметь по каналу 64*2 хотя бы на каждое ядро..
Контроллер памяти просто душит, 4 ядра..
Ну на 2 ядра еще нормально, но 4 ядра, уже не есть хорошо..

Чтобы все летало нужно процу расправить крылья и вздохнуть полной грудью..
Это все равно что с голра пить, или через трубочку затягивать воду..

Коре там я думаю как в мясорубке, кусок информации, который максимально перерабатывается.
При такой структуре как у коре и скорости, он мало обращается к чипсету где память..

Там скорость и так не велика.. Потом сравнение с интеловскими процами где память почти гонится до 1700 Мг..

Чем больше ядро тем оно больше выделяет тепла..
45 тех прцесс возможно решит проблемы..
Ждем.. Может мы его и ждем..
DDR3, блок схема уже засветилась..
Его однозначно доработают.. Увеличение кеша и увеличение числа контроллеров памяти пропорционально сыграет на производительсноти..
Любая структура, требует оптимизации..
Шина памяти задушена, кеша не хватает.. Нет подпитки в информации..
Память еще не DDR3..
Внутри не движение не оптимизировано..
Это вот пока первые результаты.. То что я вижу..

vk6666

Добавлено: 27.11.2007 16:09

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 20.10.2004
Откуда: С-Пб

кратко и емко!
жемчужина в море флуда!!
отлично!

fly9969 писал(а):

вам просто необходимо иметь на руках Phenom...

_________________
Матом не ругаюсь, я на нем разговариваю
интересуют антикварные АМД-системы. писать в ЛС.
НЕНАВИЖУ ASUS!!!
*AMD OverClan*

Последний раз редактировалось vk6666 27.11.2007 16:24, всего редактировалось 1 раз.

Opteron 2xxx

Добавлено: 27.11.2007 16:16

[профиль]

Заблокирован

Статус: Не в сети
Регистрация: 12.10.2007
Откуда: РАЙ

Потом, уменьшение числа транзакций положительно скажется на тепловыделении..
Между памятью и процессором..
Добавлено спустя 9 минут, 20 секунд
А что сейчас для них узкое место

1. Информация поступает в кешь.. Которого мало.. Надо посчитать сколько его надо.. Чтобы сразу разбросать по ядрам информацию.. оптимизация самого ядра..
2 Далее в 4 ядра.. И потом, время ожидание каких либо ядер.. 1/4 - возможно повысить работу на 25%.. Только увеличением шины..
3. При возврате использовать кешь 3 уровня..
4. А если так то кешь второго уровня повысив до 2 МБ еще можно повысить работу проца..

Делаем вывод, оптимизировать можно..

Knock2007

Добавлено: 27.11.2007 16:39

[профиль]

Member
Статус: Не в сети
Регистрация: 07.10.2007
Откуда: Belarus

Opteron 2xxx слушай, ты бы им в АМД написал письмо с предлождениями к оптимизации. Серьезно, без подколов. Уж больно граммотно разъясняешься. А то они там в панике не могут понять что к чему.... а ты тут вдруг бах ... вот так и так мол сделайте и все путем будет......

_________________
Ученые долго думали - в чем измерять частоту? Так и не придумали. Вот и пишут - Hz.

Antinomy

Добавлено: 27.11.2007 17:41

[профиль]

Member
Статус: Не в сети
Регистрация: 13.06.2005
Откуда: Владивосток

StrateG-1

StrateG-1 писал(а):

ничего особо нового! Просто объяснение того, почему К10 такая гадость по сравнению с Core!

Угу, и ворчание на обзоры

BloodyWerewolf писал(а):

Поэтому производительность SSE(2) FPU К10 лучше мерять в других программах

Что посоветуете? И откуда цитата? Просто сама Сандра (сайт) чуть другое писала. Писала не про SSE3 на Конро, а sSSE3.

Opteron 2xxx писал(а):

Я думаю что новый феном пока еще под софтину не заточен..

А вопрос - с чего бы процессор точился под софт? Он точится под конкретные задачи, обработку инструкций, изредка паттерны. Это софт должен быть нормальным и не создавать тепличных условий и не юзать инструкции, под которые какая-то модель точилась, а все другие нет, то бишь редкие случаи. Есть - хорошо, но упор делать нехорошо.

Opteron 2xxx писал(а):

SSE5, должен выйти либо программы должны быть оптимизированы под него..

У Фенома нету SSE5, там 4.a.

Opteron 2xxx писал(а):

Проц требует переделки контроллера памяти.

Контроллер нормальный, тестов нет нормальных

Opteron 2xxx писал(а):

Чем мощнее видео, тем меньше проц играет значение в работе..

Строго наоборот.

Opteron 2xxx писал(а):

надо иметь по каналу 64*2 хотя бы на каждое ядро.. Контроллер памяти просто душит, 4 ядра..

Очень маловероятно. Ибо по ряду причин в K8 точно ядро не могло использовать всю мощь ПСП. Точнее у него есть ограничение в виде "константы" бит\такт. И если частота низкая, то разницы 667->800 может вообще не быть. Скоро постараюсь с помощью обладателя AM2 системы этот вопрос изучить. Вечная проблема - отсутствие железа для безумных идей. А потому и Барсу не нужно по два контроллера на ядро. Так даже лучше, ибо общие позволяют выдать тому, кто нуждается и не простаивать у ненуждающихся ядер. Загрузка эффективнее. В общем, считаю, что ПСП нужно не повышать, а дорабатывать L1 и ещё что-то. Что - как раз хочу разобраться. Но сначала для AM2 (K8).

Opteron 2xxx писал(а):

DDR3, блок схема уже засветилась..

Опять же - частоту бОльшую не использует из-за этих ограничений, а тайминги убьют последние капли прироста. Изучу и представлю на суд, если выйдет.

Opteron 2xxx писал(а):

Информация поступает в кешь.. Которого мало

Очень спорный вопрос - прирост на K8 512Kb->1Mb минимален.

Opteron 2xxx писал(а):

А если так то кешь второго уровня повысив до 2 МБ еще можно повысить работу проца..

При очень большом усложнении ядра (дизайн), размера мы получим минимальный прирост. Именно минимальный. Вот L3 ещё можно подумать, и то...

Opteron 2xxx писал(а):

Далее в 4 ядра.. И потом, время ожидание каких либо ядер.. 1/4 - возможно повысить работу на 25%.. Только увеличением шины.. При возврате использовать кешь 3 уровня..

Поподробнее можно? А то неясно немного. Возврат чего?

Opteron 2xxx писал(а):

Дискотека Авария - Зло (Варшава, был полностью уничтожен во время второй мировой войны)

:beer:

serj Спасибо и тебе за оценку от R&D эксперта

По части 2*64 немного напоминает идею с NUMA, когда "зачёрпываем" из другого пространства + их алгоритм интерливинга.
По-моему всё не так сложно. Я думаю, что очереди две, ибо они независимы. А пересылки данных нет, ибо подразумевается работа с разными ядрами. По части K7\K8. У K7 на VIA был 64-битный. У NF2 как двухканального - 128-битный. У 754 - 64 бита, один канал. У 939 - 128, два. Тут же 2*64 и режим старый, 1*128 как у обычных 939\AM2 K8. И как у Интел. В том, то и дело, что многоканальность придумали, чтобы выжать больше из существующей архитектуры и ограничений (64 бита на RAM и 200МГц на чип RAM). И сделали read burst, на основании, что часто идёт линейное чтение. Ты помню этот вопрос в статье рассматривал. Для одного ядра это единственный выход. А вот для двух 128бит уже обуза, ибо меньший блок уже нельзя запросить. И решили сделать 2*64, чтобы была возможность у разных ядер делать более мелкие запросы. Ибо если трём ядрам нужно по 64 бита, то уже понадобится не 3 такта, а 2. В общем, полезная штука для одновременной работы ядер с памятью. Всё равно одно ядро 128 бит не съест, как я писал. А меньшие блоки дают большую гибкость при случайных запросах (коих при 4 ядрах больше). Сама AMD рекомендует в однопоточных использовать режим 128-бит, а в многопоточных - 2*64. Жаль, он сам не переключается. Интересно было бы изучить вопрос разницы двух режимов. Да и по дефолту работает именно 2*64.

fly9969 писал(а):

вам просто необходимо иметь на руках Phenom...

Где бы достать ещё такое.vk6666 Спасибо.

Knock2007 писал(а):

статья нормальнавя и доступная для понимания, что самое главное.

С этим у меня часто проблемы, видно по другим. Просто тут инфы нормальной нет, вот и написал выжимку + исследование даташита. Дальше буду потихоньку наращивать, но постараюсь плавно.

_________________
Дайте мне даташиты и я переверну мир!
Вместе мы - www.ROM.by

Последний раз редактировалось Antinomy 28.11.2007 1:58, всего редактировалось 1 раз.

Knock2007

Добавлено: 27.11.2007 19:01

[профиль]

Member
Статус: Не в сети
Регистрация: 07.10.2007
Откуда: Belarus

Antinomy писал(а):

в многопоточных использовать режим 128-бит, а в многопоточных - 2*64

Наверное у вас очепятка

Antinomy писал(а):

Вот L3 ещё можно подумать, и то...

На скольке мне известно на кваде 8 метров кэша. Интел значит смогла как то преодолеть сложность.

_________________
Ученые долго думали - в чем измерять частоту? Так и не придумали. Вот и пишут - Hz.

serj

Добавлено: 27.11.2007 20:58

[профиль]

Advanced member
Статус: Не в сети
Регистрация: 10.04.2003
Откуда: Москва

Antinomy, это старая болячка. Что лучше - два отдельных диска или RAID0? RAID0 работает всегда и его эффективность от х1 до х2.
Дискретные два диска вроде-бы аналогично, только работают не всегда.
Теперь возмем не абстрактный, а то, что _мне_ нужно и для чего нужна большая скорость. Периодически возникает проблема с перекодированием фильмов. А это означает, что пара ядер будут работать над одними и теми-же данными. Утрирую, sorry, но - это означает, что один из двух контроллеров памяти будет простаивать.
Вот еслиб я на 1 ядре перекодировал, а на втором сидел и играл, тогда бы оба контроллера были задействованы на 100%.
Рассуждения ихсодили из того, что половина памяти (low) шла на один, вторая(high) на другой контроллер. Вспоминаются картинки AMD, там интерливинг между контроллерами очень маленький.
Тогда идея с двумя независимыми контроллерами выродится в то, что ядро будет половину данных брать из своего контроллера, а половину из дальнего. Т.о. через шину связи между контроллерами будет гулять половина всего трафика.
Так, теперь что с'экономили ....
С одной стороны, гоняется меньше трафика (а кого это трясет?), с другой - процессор будет ждать данных разное время. Это может быть и пустяк, а может и нет.

Новая тема /

Закрыто

Сообщений: 48 • Страница 1 из 3 • 1 2 3 >

Список форумов » Общение » Персональные Страницы

Часовой пояс: UTC + 3 часа

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 5

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти: