Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
Enot
Цитата:
Линии использовать можно.
Но нужно ли?
Цитата:
Что значит работает? Можно сказать, что банк не простаивает, выполняет какие либо действия. Возможна такая ситуация. Одному банку подали команду на активацию, а другому команду на чтение.
Значит так: "работать" априори предполагает выполнение полезной работы, полезная работа для памяти - выдача и получение данных. Делать это одновременно они не могут, а всё остальное - это перекры, перерывы на обед и другое броуновское движение, не относящееся непосредственно к работе.
Цитата:
Во-первых у тебя написано немного неправильно (слова неправильно подобраны). Ранее я привёл цитату из спецификации.
Посмотри, во сколько это написано И что именно неправильно, описание tRAS? А если хорошенько подумать и ещё раз проштудировать мануалы?
Цитата:
-Длинна пакета равна 8, т.к. 64 байта - размер строки кэша процессора. Исключения есть, но они редки.
Тааак, совсем недавно ты говорил, что строка памяти и строка кэш это разные вещи, друг с другом никак не связанные. А теперь сам взял и смешал их в кучу. Процессор получит свою строку любым способом: одним ли бёрстом, двумя или всеми четырьмя, в зависимости от длины бёрста. Для памяти это сугубо плоскопараллельно. К слову, длина строки для P4 - 128 байт
Цитата:
если идёт единичное чтение, то команда на закрытие может быть подана через tRCD+4 такта, т.е. tRAS для единичного чтения равен tRCD+4. Без вариантов.
Ты не прав несколько раз. Во-первых, как я уже говорил, длина бёрста у DDR часто те же 4 посылки, т.е. 2 такта. Во вторых, конвейризация в SDRAM не такая крутая, чтобы всё делать независимо и одновременно. Поэтому в среднее время операции почти всегда входит и время завершающих действий. Если это не очевидно, позже опишу протокол.
Raul
Цитата:
Однобитные ячейчки динамической памяти не тактируются. Поэтому говорить о том, что они "работают на частоте" - совершенно неправильно!
Зато тактируется всё остальное.
Цитата:
Похоже, они ее заторомозили, что бы потом погнать по шине до 400 Mhz.
Именно так. Затормозили саму память и удвоили её количество, оставив внешнюю логику на прежней частоте.
Заблокирован Статус: Не в сети Регистрация: 26.10.2003
GReY
Цитата:
Тааак, совсем недавно ты говорил, что строка памяти и строка кэш это разные вещи, друг с другом никак не связанные. А теперь сам взял и смешал их в кучу.
Где? Неправда.
Цитата:
Процессор получит свою строку любым способом: одним ли бёрстом, двумя или всеми четырьмя, в зависимости от длины бёрста. Для памяти это сугубо плоскопараллельно. К слову, длина строки для P4 - 128 байт
Главное - процессор не читает из памяти по байту. Он читает сразу данные в размер строки кэша. Соответственно, если размер строки кэша 64 байта, это как минимум 8 (размер пакета) х 8 байт (ширина шины данных памяти) = 64 байта. Если у Интела размер 128 байт, то будет две пересылки данных по 8 (в случае одноканального чипсета). Размер пакета меньше 8 возможен, но в современных компьютерах не использхуется или используется редко.
Цитата:
И что именно неправильно, описание tRAS?
"необходима регенерация буферов страницы" - "регенерируются" ячейки памяти. "время чтения по СЛУЧАЙНОМУ CAS#" - хоть случайному, хоть последовательному - разницы нет. "(tRCD + n*(длина посылки) + CL)/n" - не понял. "чтение завершится на столько позже" - данные передадутся несколько позже, но закрыть строку можно сразу через 4 такта. "burst length очень часто равен 4" - и когда это "часто". Процессор имеет свою предвыборку. Он читает сразу пачку из 64 байта. "ничего страшного (но не факт!)" - факт. Так неписано в спецификации и именно эта цитата приведена мной в форуме и именно про неё я тебе несколько раз говорил.
Цитата:
Во вторых, конвейризация в SDRAM не такая крутая, чтобы всё делать независимо и одновременно.
Посмотри на цитату из спецификации на 2 странице форума. Что тут не понятно? Причём здесь "не такая крутая"?
Цитата:
Именно так. Затормозили саму память и
Специально никто ничего не тормозил. Кроме всего прочего, DDR2 отличается пониженным питанием 1,8 В. Возможно это так же повлияло на скорость.
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
Ещё про tRAS и злополучную формулу:
Цитата:
Naturally, this will incur a quite dramatic performance hit since setting tRAS to 5 cycles will kill the bursts 5-8 in some of the transfers after the second clock. For example, SiSoft Sandra memory benchmark scores dropped from ~4900 (FPU and Int) to 4700/4650. Needless to say that this is also an almost guaranteed way to kill the HDD.
Заблокирован Статус: Не в сети Регистрация: 26.10.2003
GReY
Цитата:
Плиз, процитируй ещё раз.
A READ burst may be followed by, or truncated with, a PRECHARGE command to the same bank (provided that AUTO PRECHARGE was not activated). The PRECHARGE command should be issued X cycles after the READ command, where X equals the number of desired data element pairs (pairs are required by the 2n prefetch architecture).
Добавлено спустя 4 минуты, 55 секунд: Далее на рисунке примечания Precharge may be applied at (BL/2) tCK after the READ command. Note that Precharge may not be issued before tRAS ns after the ACTIVE command for applicable banks.[/quote]
Historically, tRAS was defined as the time needed to establish the necessary potential between a bitline pair within the memory array until it was safe to write back the data to the memory cells of origin after a (destructive) read. Pay attention to the word read here.
Memory, in many ways is like a book, you can only read after opening a book to a certain page and paragraph within that particular page. The RAS Pulse Width is the time until a page can be closed again. Therefore, just by definition, the minimum tRAS must be the RAS-to-CAS delay plus the read latency (CAS delay). That is fine for FPM and EDO memory with their single word data transfers. With SDRAM, memory controllers started to output a chain of four consecutive quadwords on every access. With DDR, that number has increased to eight quadwords that effectively are two consecutive bursts of four.
Now imagine someone closes the book you are reading from in the middle of a sentence. Right in your face! And does it over and again. This is what happens if tRAS is set too short. So here is the really simple calculation: The second burst of four has at least to be initiated and prefetched into the output buffers (like you get a glimpse at the headline in a book) before you can close the page without losing all information. That means that the minimum tRAS would be tRCD+CAS latency + 2 cycles (to output the first burst of four and make way for the second burst in the output buffers).
Any tRAS setting lower tRCD + CAS + 2 cycles will allow the memory controller to close the page “in your face!” over and again and that will cause a performance hit because of a truncated transfer that needs to be repeated. Along with those hassles comes the self-explanatory risk for data corruption.
Расшифровываю: активизация страницы вызывает перенос данных из ячеек в page buffer, из которого они потом выбираются по сигналу CAS# и переносятся в output buffer, а оттуда - на шину данных, причём переносится столько слов, каков burst length. Перенос данных начинается спустя CL и завершается, соответственно, спустя такое же время после "снятия" CAS#. Деактивация (а не закрытие!) страницы раньше начала переноса последнего слова из burst может иметь последствия недетерминированного характера.
Добавлено спустя 7 минут, 7 секунд: По цитате с жедека:
Самое смешное, что никакой команды READ для памяти нет Чтение начинается автоматом при неготиации CAS#, если не установлен WE. Если установлен, то начнётся запись )))
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
Цитата:
A READ burst may be followed by, or truncated with, a PRECHARGE command to the same bank
А вот эта фраза полностью подтверждает мушкина Precharge подаётся как раз спустя tRAS, и будучи поданным рано, прервёт burst. А будучи поданным СЛИШКОМ рано, обломает всё чтение.
Вот у меня сейчас память работает на 3-2-2-2CL, надо проверить, насколько ускорится память с увеличением tRAS...
Заблокирован Статус: Не в сети Регистрация: 26.10.2003
Цитата:
Как ты думаешь, почему?
"the time needed to establish the necessary potential between a bitline pair within the memory array " не достигнут. Соответственно операция закрытия выполниться не может.
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
Цитата:
Соответственно операция закрытия выполниться не может.
Не совсем. Закрытие приведёт к невозможности чтения чего-либо вообще. Потому и висяк. Вот это я и назвал "слишком".
Добавлено спустя 41 минуту, 23 секунды: Кстати, есть рацпредложение!
Жордан уже написал цикл статей по платформе на P4, пусть он ещё проверит и зависимость того же SBC от tRAS на i865, чтобы больше не было недоразумений.
Member
Статус: Не в сети Регистрация: 14.01.2004 Откуда: Екатеринбург
Вот новость про DDR2 с 3DNews.
Цитата:
Ни для кого не является секретом тот факт, что нынешние скорости DDR II-533 и особенного DDR II-400 совершенно не устраивают производителей железа. За примерами далеко ходить не нужно, именно по причине низкого быстродействия и высокой стоимости AMD пока не намерена вводить поддержку этого типа памяти для своих 64-разрядных процессоров. И вот, наконец, с данным «злом» решила бороться компания Kingston, сообщившая о начале разработки модулей DDR II с низкими задержками. Если сейчас по обыкновению они составляют 4-4-4 (CL-tRCD-tRP), то в самом ближайшем будущем возможно появление планок серии HyperX DDR2-533 с параметрами 3-3-3, согласитесь, это уже значительно лучше и быстрее. А благодаря изначально низкому напряжению в 1.8В и хорошей масштабируемости по частоте, компания вполне допускает выпуск подобной продукции в частотном исполнении 667 и 800 МГц.
_________________ Земля не может, не может не вращаться, А мур не может, не может не мурчать!
Advanced member
Статус: Не в сети Регистрация: 13.04.2003 Откуда: Салават
Хм, а ведь далеко не так плохо всё с DDRII, как нам пытаются нарисовать новостные издания!
Берём даташиты и сравниваем:
ValueRAM DDR533 против HyperX PC4300
Clock Cycle Time (tCK) 3.75ns (min.) / 8ns (max.) против 4ns (min.) / 10ns (max.)
Row Cycle Time (tRC) 55ns (min.)
Refresh to Active/Refresh Command Time (tRFC) 75ns против 70ns (min.)
Row Active Time (tRAS) 40ns (min.) / 70,000ns (max.)
Power (IDD0) 1.440 W (operating) против 8.000 W (max.)
Заблокирован Статус: Не в сети Регистрация: 26.10.2003
P.S.
О "критике заслуженных производителей памяти".
После опубликования статьи, в форуме была приведена цитата с www.LostCircuits.com, где формула tRAS=tRCD+CL+2 упоминалась и рассматривалась. После некоторого "общения" с автором LostCircuits я склоняюсь к мысли, что именно LostCircuits является родиной злополучной формулы.
Вот наиболее яркая цитата c LostCircuits:
"Naturally, this will incur a quite dramatic performance hit since setting tRAS to 5 cycles (меньше рекомендуемого значения) will kill the bursts 5-8 in some of the transfers after the second clock. ... Needless to say that this is also an almost guaranteed way to kill the HDD."
Сайт www.LostCircuits.com является довольно уважаемым, в том числе и мной. При подготовке материала я нашёл на этом ресурсе лишь поверхностное рассмотрение этого вопроса. Но в некоторых статья на LostCircuits, не относящихся напрямую к параметрам памяти, приведены достаточно подробные объяснения формулы Mushkin. Учитывая высокий авторитет LostCircuits, я написал письмо автору Michael Schuette (MS) ms@lostcircuits.com. В результате у нас получилась не большая но "сложная" дискуссия.
Всего мной было написано 11 писем (на данный момент), со стороны MS почти столько же. Перечитывая их, я нашёл очень много прямых ошибок со стороны оппонента. Характерным примером вляется формула для единичного чтения tRAS=tRCD+2 (для BL=4). Понадобилось 4 (!) письма с очень подробными, "весомыми" доводами и цитированием спецификации, чтобы мнение MS сменилось с "I am always right and the above cannot work " на "OK, it seems I was wrong regarding the time at which the precharge command is issued".
Собственно в результате дискуссии никто не изменил мнения. Ниже я приведу основные выводы. Конечно это немного "однобоко" и вырвано из контекста. Тем не менее всё это было сказано (написано). Эти выводы были сделаны почти в конце переписки, несмотря на то, что все они были подняты в начале. Сейчас это выглядит, как будто я послал вопрос и получил чёткий ответ.
О повреждении диска при слишком низком tRAS:
Вопрос: "I hear some memory work well on 2-2-2-3."
Вопрос: "I am personaly use tRAS=4 for long time without any fail."
Ответ: "Because a tRAS of 3 cannot be executed.." (далее на аналогичные вопросы ответа получено то же не было)
Вопрос: "The corruption of HDD arises only when system is bieng shutdown or when any write operation occur?"
Ответ: "Nobody knows, it happens within a few days or weeks and has been very reproducible on multiple systems. It usually takes some 2-3 weeks for the problems to occur, though."
Вопрос: "So true is that HDD corruptions may be with to low tRAS. Any "shutdown" or "write" words are only estimates without direct proofs. Right?"
Ответ: "Correct"
О формуле tRAS.
Ответ: "... this is a rule of thumb for the minimum tRAS value ..."
Ответ: "... The only suggestion I have made is that the historical rule of tRAS=tRCD+CL no longer applies because DDR abides by different rules and that there are differences between chipsets as well."
После замечания MS о том, что полученные мной данные при tRCD=5 нельзя считать корректными из-за значения, не соответствующего спецификации, я решил провести дополнительное тестирование. В качестве теста использовался только SBC. Тесты проводились под DOS (у SBC оказалась в наличии и такая версия), использовались RAM диски. Точность результатов получилась очень высокой при небольшом времени тестов. Была получена зависимость производительности от tRAS при tRCD=2,3,4,5 и CL=2,3. В общем то, единственным существенным выводом, сделанным на основании графиков, является только то, что в статье все написано правильно...
Подведу небольшой итог.
-То, что написано в статье о tRAS - написано правильно. Дискуссия с MS (LostCircuits) только подтвердила это.
-На уважаемом и авторитетном ресурсе LostCircuits имеются замечания о tRAS, которые рассматриваются и опровергаются в моей статье.
Doors4ever Возможно такой PS можно добавить в статью. (возможно нет)
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 7
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения