TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
sco01 писал(а):
насколько помню клиент сам ставит подчеркивание вместо пробела...
И не только пробела - любые "запрещенные" символы заменяются на подчеркивания. Разрешены сейчас только буквы, цифры и подчеркивание _. Все остальное идет автоматом под замену на _.
Добавлено спустя 11 минут 32 секунды:
Agafonov_KY писал(а):
есть две карточки GeForce GTX 660 Ti, есть смысл их "вязать" друг с другом или пусть лопатят каждая свое задание по отдельности?
Ну сейчас это вообще сделать не получится. Возможность связке из нескольких карт работать над одной жабой пока только в тесте (фахбенч) и в закрытой бета-версии нового ядра есть. Т.е. сначала: 1. Дождаться выхода новых ГПУ-ядер, где такая возможность появится официально. 2. Дождаться введения QRB бонусов на ГПУ. (без него точно лучше считать 2 отдельных) 3. Только после этого оценивать - что выгоднее, считать 2 отдельных жабы с полной скоростью (2х100%) или же 2мя картаму одну, на скорости порядка 150% (относительно одиночной карты).
TSC! Russia ex-Captain
Статус: Не в сети Регистрация: 13.07.2007 Фото: 0
Mad'Max писал(а):
И не только пробела - любые "запрещенные" символы заменяются на подчеркивания. Разрешены сейчас только буквы, цифры и подчеркивание _. Все остальное идет автоматом под замену на _.
Квадратные скобки в моём нике вроде без проблем воспринимаются.
Member
Статус: Не в сети Регистрация: 15.01.2006 Откуда: Минск
вот какая идея есть програмы которые исходный код оптимизируют для повышения стабильности и быстродействия. есть програмы которые готовый ехе файл дизасемблируют, оптимизируют код на асемблере и потом компилируют. т.е. исходники програмы не нужны.
вопрос : ктонибудь с ядрами фаха что-то подобное пытался сделать? далеко не все програмисты знают что такое вообще возможно. может счёт на радеонах можно так увеличить раза в 3-4?
_________________ У одних нефанатов рожи позеленели, у других рожи посинели. И только у правильных нефанатов рожи красные и довольные.
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Что-то я такого, про оптимизацию без исходного кода, а только через дизассемблер не слышал. И на видяшках врядли толк будет, даже если такое есть. На Intel ЦП толку скорее всего не будет, т.к. ядра и так со включенной опримизаций под Intel процы компилятором от Intel же скомпилированы. Разве что на AMD ЦП, для которых Intel компилятор не оптимальный код выдает эффект может быть...
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
NONsens Хм, для игрушки (морровинд) сделано. Интересно оно вообще будет с произвольным .exe работать? На Intel это точно не поможет, там классический FPU уже и так замене везде где возможно на SSE. В ядрах F@H код и так где возможно уже под SSE компилятором оптимизирован. Тут бы мог пригодится только патчер меняющий SSE на AVX. А вот на AMD можно попробовать(особенно на бульдозерах), Intel комплятор иногда для них ставит специально х87 код, там где можно использовать SSE. К Intel даже иски подавали с обвинениями, что они специально тормозят процессоры конкрурентов в своих компляторах (определяют поддержку разных наборов инструкций не по их наличию, а по модели процессора, и если модель не Intel ставим стандартный неоптимизированный код). Intel конечно делала "покер фейс" и заявляла, что это исключительно для надежности и стабильности сделано, дескать когда они не уверены что ЦП будет корректно испольнять оптимизированный под SSEх, то используют классический. А полностью уверены они только в своих ЦП. А к желанию притопить конкурентов это разумеется никакого отношения не имеет.
Member
Статус: Не в сети Регистрация: 27.04.2003 Откуда: Москва Фото: 6
На интеловском компиляторе свет клином не сошёлся. Есть ещё, как минимум, компиляторы M$ и GNU. И в тестах SPEC емнип преимущество интеловских не вполне очевидно даже на интеловских камнях. Если кто-нибудь поделится интеловскими компиляторами, могу в SPEC CPU2000 провести сравнение.
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Так понятно, что компиляторы другие есть. Проблема в том, что F@H свои исходники никому не дает. И все SMP ядра скомпилированы именно Intel компилятором. Если бы давали исходники можно было бы уже давно с оптимизацией под SSE4 и AVX перекомпилить для современных ЦП. А для AMD процессоров еще дополнительно сравнить разные компиляторы между собой. Кстати на других (зарубежных) форумах встречал, что если софт F@H для AMD перекомпилировать свежим GNU с оптимизацией под имеющиеся наборы инструкций, счет в 2-3 раза быстрее получается чем на том Intel компиляторе, который используют в F@H. Только сравнивали видимо не сам F@H непосредственно (т.к. его кода в открытом доступе нет), а GROMACS на базе которого ядра F@H сделаны (и у которого исходный код открыт)
Добавлено спустя 8 минут 1 секунду: Я кстати попробовал http://timeslip.users.sourceforge.net/exeopt.html Все-таки эта вещь под Морровинд заточена, там нормального универсального анализатора нет, он больше по имеющимся шаблонам процедуры/циклы ищет. И слишком старый уже - он с классического х87 на SSE (1й версии видимо только?) код меняет. При попытке "оптимизировать" бинарник A3 и A4 ядер он у меня вообще глючил (вываливался с ошибкой не закончив работу). OpenCL ядро для ATI он переварил, но нашел только 1 подходящий для оптимизации кусок кода, который будет на SSE работать примерно на 20% быстрее исходного (по встроенному бечмарку, запускать считать жабы на модифированном ядре я не стал).
Member
Статус: Не в сети Регистрация: 15.01.2006 Откуда: Минск
в 2000 и 2001 году я участовал в научно-практической конференции учащихся )есть такое у меня в стране уже лет как 25, жалкое подобие на американский конкурс разработок школьников) к нам стали заглядывать иностранцы и 1 росиянин привёз програму которая могла оптимизировать код на асемблере ну например "есть 1 сложная инструкция - заменяем на 3 лёгких и получаем прирост в производительности 250%" "есть 9 команд - заменяем на 1 которая делает тоже самое но на 430% быстрее" таких трюков те кто програмирует на асемблере знает наверно пару тысяч.
=== у нас на форуме есть неплохие асм=програмисты может стоит обратиться в ветку по програмированию? мне там здорово помогли лет 7 назад по асьме и майскул
=== то что Интел ставит палки в колёса где только можно это не секрет скорее всего если пошаманить с настройками компилятора можно на определённых интеловых )и амд) процах дополнительно выжать 20-30% поскольку Интел отвечает за стабильеость и надёжность то делает всё универсальным и медленным.
=== почему бы амд не заняться написанием своего компилятора? на серверном рынке позиции амд зачастую сильнее чем у Интел чего не скажешь на рынке десктопов
Добавлено спустя 10 минут 46 секунд: почему бы амд не выделить 1 програмиста который бы помог написать нормальные ядра для фолдинга это же бесплатная супер реклама заголовки новостей "радеон 7950 на 30% быстрее жефорс титан" "установле новый рекорд в folding at home - встречаем нового рекордцмена радеон 7990" "видеокарта радеон 7770 сравнялась в быстродействии с жефорс 670 в фах" и т.д.
кстати почему на оверах нету новостей про фах? ради фаха и рв зачастую покупают более мощное железо чем требуется ради фаха гонят железо даже когда не тормозит не одна игра даже лично я не пошол бы покупать жирафа 650ти а купил бы ссд от оцз 128гб и планку оперативы на 4 гб
кстати оверам нужны авторы новостей пусть новости будет однобокими и раз в 2 недели я совершенно не против
_________________ У одних нефанатов рожи позеленели, у других рожи посинели. И только у правильных нефанатов рожи красные и довольные.
TSC! Russia BOINC-manager
Статус: Не в сети Регистрация: 19.01.2010 Откуда: Санкт-Петербург
Sir_N_Drew Это который Yutong Zhao и пишет под ником proteneer? А ему-то зачем? Он только ГПУ-ядрами занимается. И пока вроде неплохо получается, по крайней мере расшевелил болото и работа началась.
А речь шла про счет/оптимизацию для ЦП. Не знаю, кто конкретно ЦП ядрами занимается, но вот им неоднократно (не я) предлагали хотя бы автоматическую (без ручной правки/оптимизации) перекомпиляцию кода с оптимизацией под SSE4/AVX сделать, а для AMD использовать другой компилятор. Но они отказывались, под предлогом унификации, стандартизации и большей совместимости. Переводя на нормальный - им лень заморачиваться, с поддержкой кучи разных версий ядер: под SEE2, под SSE4х, под AVX и в 2х вариантах компилятора (Intel для Intel ЦП, GCC для AMD ЦП) и писать процедуру определения поддержки имеющихся наборов инструкций для клиента (чтобы он мог автоматически правильную версию ядра скачать в зависимости от ЦП на котором запущен). Гораздо проще всем одно и тоже ядро не глядя влепить - под SSE2 (кот. есть почти на всех ЦП сейчас) и одним и тем же комплятором (Intel, т.к. для Intel ЦП он выдает наилучший код и большинство парка ЦП производства именно Intel)
Добавлено спустя 14 минут 23 секунды: TheVITALI Это с твоей (нашей) позиции кажется, что интересующихся F@H (или даже РВ вообще) много. А на деле всего пару тыс. чел на всю страну только наберется. Против неск. миллионов играющих в игрушки и неск. десятков млн. компами в целом пользующихся. Поэтому на общем фоне таких "маньяков" как мы исчезающе мало, чтобы отдельно особое внимание обращать...
Member
Статус: Не в сети Регистрация: 04.12.2011 Откуда: Санкт-Петербург Фото: 6
Mad'Max странно - FAH-клиент всегда знает набор инструкций процессора, так что взять это за основу выдачи заданий и закачки ядер не так уж сложно. Видимо нужен новый программист с запалом энтузиазма.
Member
Статус: Не в сети Регистрация: 27.04.2003 Откуда: Москва Фото: 6
TheVITALI писал(а):
програму которая могла оптимизировать код на асемблере ну например "есть 1 сложная инструкция - заменяем на 3 лёгких и получаем прирост в производительности 250%" "есть 9 команд - заменяем на 1 которая делает тоже самое но на 430% быстрее" таких трюков те кто програмирует на асемблере знает наверно пару тысяч.
мне казалось, готовые бинарники таким образом вообще говоря нельзя обработать, т.к. адреса последующего кода съезжают, и брэнчи в эти участки из других мест по старым указателям могут попасть не туда. ассемблер (родной, не диз) - другое дело.
TSC! Russia member
Статус: Не в сети Регистрация: 20.03.2010 Откуда: Омск
Как избавиться от получения длинных жаб типа 85хх? Тестирую Селерон, а сервер мне выдает с типовыми настройками жабы, которые будут считаться больше 2 суток. Поставил 7-й клиент, словил аналогичную по времени счета 7808, жую.
Member
Статус: Не в сети Регистрация: 15.01.2006 Откуда: Минск
обьясните мне пожалуйста, почему если в материнке 2 проца по 4 ядра или 1 * 8 ядер и 16 потоков то нужно считать под линуксом? под виндой смп клиент не умеет считать в 16 потоков?
_________________ У одних нефанатов рожи позеленели, у других рожи посинели. И только у правильных нефанатов рожи красные и довольные.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения