Member
Статус: Не в сети Регистрация: 31.01.2004 Откуда: moskow
Что я могу сказать про СИЕ:
1. Задействованы в основном команды FPU и судя по PerfMonitor - самые медленные (~10 uop) - то есть желательно переработать Алгоритм, избавляясь от медленных инструкций (типа ДЕЛЕНИЕ)
2. Fsb загружена не по полной - соответственно Скорость памяти и Двухканальность должна сильно влиять на рез-тат (кушает ~54Mb) но из-за п. 3 (ниже) не сильно влияет.
3. Скорее всего неоптимизирован алгоритм Чтения/записи памяти (напр. пишится - читается последовательно по одному значению ТИПА: "прочитал-посчитал-записал", а можно "прочитать неск значений, посчитать неск. раз, записаать неск значений" - так быстрее.
4. Кэш используется не сильно, но при этом на Cel-D 3,06 Ггц велики промахи кэша L2. (в районе 40-50%) так как данные в него не помещаются, а исп-ся оперативная память. Удача при предсказании переходов 97%...
5. Дополнительные инструкции не используются ( а это ускорило бы вычисление)...
Если шкала (от0 до 100% TGauge) не повешена на таймер, а считается в основном цикле программы, То это Один из Главных ТОРМОЗОВ всей проги...
Результат на селероне Д 3,06Ггц ~12мин. -( Добавлено спустя 18 минут, 15 секунд Bozz Bishop Скалярные SSE операции рулят 11.65 сек! на твоей проге -)
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 28
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения