Куратор темы Статус: Не в сети Регистрация: 16.08.2007 Откуда: Красноярск
Сборка общекомандной кранчерской системы.
Сбор денег: Перечисления делаем в кассу команды. В комментариях к платежу желательно указывать свой ник в форуме. Перечислять можно любую сумму в рублях начиная со 100 и заканчивая вашей фантазией. Сбор средств на сервер пока не актуален, но вклад в другие общекомандные траты всегда приветствуется.
Командный сервер. Версия 1.0 (почил в бозе)
Проектная спецификация 1. Supermicro H8QGi+-F. Ориентировочная стоимость $800-900. 2. 4*Opteron 6272. Ориентировочная стоимость $600 за штуку (с учётом доставки в Россию). 3. 4*Thermaltake CLS0017. Средняя стоимость в России 1440 рублей за штуку. 4. AirTone GF-9100B. Ориентировочная стоимость 3790 рублей. 5. Corsair CMPSU-1200AX 1200W (есть незадействованный у tguskill'а). 6. Kingston KVR1333D3N9/4G. Ориентировочная цена 660 рублей за одну планку. Восемь планок - 5280 рублей. 7. Есть рапторы по 300 гигов, Hil согласился нам их предоставить. ИТОГО: ~113000 р.
Фактическая конфигурация и расходы: писал(а):
1. Материнская плата Supermicro H8QGI-F: 1 шт. 30/12/2011 (29 880 р.) 2. Процессоры AMD Opteron 6174: 2 шт. 19/12/2011 (32 301,43 р.) + 1 шт. 19/03/2012 (15307,89 р.) + 1 шт. 25/03/2012 (13422,21 р.) 3. Кулеры Thermaltake CLS0017: 2 шт. 30/12/2011 (2 680 р.) + 2 шт. 12/04/2012 (3000 р.) 4. Корпус AirTone GF-9100B. (3800 р.) 5. Блок питания Corsair CMPSU-1200AX 1200W: 1 шт. 31/12/2011 предоставлен tguskill'ом 6. Оперативная память Samsung original M378B5273CH0-CH9: 5 шт. + M378B5273DH0-CH9: 3 шт. 29/12/2011 (5 255,72 р.) + Samsung original 8 шт. 12/04/2012 (5270 р.) 7. 300 GB WD VelociRaptor: 2 шт. 31/12/2011 предоставлены Hil'ом ИТОГО: 110917,25 р.
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
tguskill
tguskill писал(а):
Повторюсь, я поставил серверную убунту, и все работает как часы в круглосуточном режиме уже больше 2 месяцев.
Так я ж не возражаю. Надеюсь ты в курсе, что Ubuntu - это не Unix-way. В конце-концов там два винчестера! Хочет targitaj ерундой страдать и вылизывать систему - пусть страдает на другом компьютере на втором винчестере. А на первый поставить (точнее ладе развернуть через dd) и пусть считает, а не EUE ловит.
Добавлено спустя 1 минуту 39 секунд: Кстати, если у тебя система нормально стоит и считает, то её спокойно можно через dd скопировать на чистый винчестер. Потом после загрузки в безопасном режиме останется только поменять имя компьютера в системе и Samba (если она стоит) и вперёд.
_________________ Революционеров можно убить, идеи — никогда.
Member
Статус: Не в сети Регистрация: 08.08.2003 Откуда: Москва
Behc Короче, завтра сервак окажется у меня в офисе, наверное, разверну с нуля в софт-рэйде убунту серверную. Какие службы поставить? кроме ssh надо что?
TSC! Russia Vice-captain
Статус: Не в сети Регистрация: 21.03.2006 Откуда: Петербург
tguskill По-моему, от RAID в данном случае кроме лишнего геморроя никакой пользы, смотри сам в общем. Кроме SSH ещё нужно NTPd поставить, чтобы время синхронизировалось. И Samba, если будешь мониторить по сети.
_________________ Революционеров можно убить, идеи — никогда.
TSC! Russia ex-Captain
Статус: Не в сети Регистрация: 13.07.2007 Фото: 0
Behc писал(а):
Так я ж не возражаю. Надеюсь ты в курсе, что Ubuntu - это не Unix-way. В конце-концов там два винчестера! Хочет targitaj ерундой страдать и вылизывать систему - пусть страдает на другом компьютере на втором винчестере. А на первый поставить (точнее ладе развернуть через dd) и пусть считает, а не EUE ловит.
Вообще это конечно мой просчёт. Я изначально не определил круг задач, как например это было с кулерами
Предлагаю обойтись без рэйда, серверной убунтой + SSH (с пробросом портов) + ЭТО СПАМ - ОТПРАВЬТЕ ЖАЛОБУ (синий квадрат).
Добавлено спустя 12 минут 43 секунды: Надо с корпусом определяться.
Member
Статус: Не в сети Регистрация: 06.07.2004 Откуда: РФ Фото: 6
DayWalker писал(а):
может там с памятью чего?
О, нашелся человек, который верхней головой думает.
Я не понял, про какой такой рейд речь идет? Какое такое вылизывание системы? Что за фантазии? Вы что там принимаете? Я же еще на этапе сборки пришел к решению отказаться пока от рейда. Установлена система с ОФИЦИАЛЬНОГО СТАБИЛЬНОГО нетинстала на ОДИН винт. Ничего лишнего не ставилось. Только базовые утилиты + SSH. Систему вообще никто не трогает. Некому. Один раз было запущено и потом только мониторилось. Какие, нафиг, игрушки? Я тут вообще есть в наличии для этого?
6901 считается нормально. 6903 сыпется. Думаем над причиной. Потребление памяти у задач одинаковое? Или у 6903 больше? Я не в курсе. В чем разница между заданиями? Обращаю внимание, что 6903 сыпется сразу при старте. То есть, я так понимаю, при развертывании в оперативной памяти. Именно 6903, с 6901 я проблемы не вижу. Я думаю, что-то с памятью. Или банально сбоит банк или нужен специфичный пакет\драйвер для NUMA, если он существует. Надо погуглить. Кстати, вполне возможно, что в убунте такой пакет идет в базе, если он вообще в природе существует. Это нормально, на убунте отрабатывают все инновации. Если в убунте с пакетом всё хорошо, то его могут включить в дебиан. А могут и не включить... Вы вообще соображаете, что ВОСЕМЬ планок памяти без технологий проверки\коррекции в одной системе - это как бы сильно дохрена? Нет, в голову такое не приходило? А это дохрена. Надо мануал глянуть, как бы там 32 гигибайта без таких технологий вообще пределом для системы не оказалось.
Предлагаю первым делом после передачи системы погонять мемтест. Какой там, нахрен, ЭТО СПАМ - ОТПРАВЬТЕ ЖАЛОБУ (синий квадрат) может быть при нестабильности системы в штатном режиме. Вы вообще о чем? Первое правило отлова багов - убери всё лишнее. Вот будет молотить стабильно - вот тогда и о допиле можно подумать.
Перезапустил 6901 с ключем -oneunit. Как раз к утру досчитает.
Member
Статус: Не в сети Регистрация: 27.11.2011 Откуда: Киров
Ак может в количестве и дело, ведь одна из задач регистров в регистровой памяти - снижение токовой нагрузки сигнальных цепей, за счет чего и обеспечивается бОльшее число слотов памяти в серверных м.п. в отличии от одомашненых собратьев. Может оптероновский контроллер памяти обиделся на то что ему вместо положеной REG/ECC памяти подсунули плашки за 600р?
Member
Статус: Не в сети Регистрация: 06.07.2004 Откуда: РФ Фото: 6
Hazord Вообще, стоит SEC, так что надежда на стабильность была изначально.
О, я вижу, что ничего на форуме про рейд не отписал. Точно. Это же мы в асе решили забить на рейд. С этим вопросом ясно. Ребята, нет рейда. Я столкнулся с тем, что система его не видит и не стал с ним заморачиваться. Не отписал, извиняйте. Не до того было.
Добавлено спустя 9 минут 38 секунд: [01:42:17] Completed 188435 out of 250000 steps (75%) [01:51:34] Completed 190000 out of 250000 steps (76%) [02:06:26] Completed 192500 out of 250000 steps (77%) [02:21:14] Completed 195000 out of 250000 steps (78%)
6901 молотит просто "на ура". "Что-то не то". Здесь пахнет неправильными пчелами. Надо память гонять.
Member
Статус: Не в сети Регистрация: 09.03.2003 Откуда: Москва
targitaj, я как-то в описании к памяти SEC наткнулся на пост в обсуждении, почитал последние посты тут и про память вы верно думаете (не последнее это дело), хотя странно что остальные жабы считаются, тут тоже конечно вопрос. http://www.fcenter.ru/products.shtml?es ... r=97467:::: Короче ф-ц--тр...
Цитата:
При покупке из 6 модулей вообще не рабочими оказались 3. Намаялся ездить и менять по гарантии. Заменил на CH0 - все заработало... мат плата asus p8z68-v pro. думаю брак, т.к. dh0 - есть в списке рекомендуемых асусом
Member
Статус: Не в сети Регистрация: 06.07.2004 Откуда: РФ Фото: 6
Главное сделано. Оно собрано. Оно запущено. Есть первая статистика. Теперь можно будет в рабочем порядке устранять недостатки. Это все-таки не нетбук какой-нибудь. Это, блин, 4 сокета. Пусть даже и при 2 процессорах всего. Думаете, HP бабло на ровном месте за свои системы берет? Хех. Нет, понятное дело, брак везде попадается, никто не застрахован. Но ты берешь тот же HP и ты уверен, что проблем с железом у тебя не будет. Даже в голову это не берешь. Спокойно разворачиваешь систему и запускаешь сервисы. Потому что другие люди это железо как следует отработали на предмет надежности и стабильности. Не знаю, у кого там какой опыт, я лично я видел глюки отдельных сервисов из-за косячного железа. Система стабильна. Всё вроде работает. И аптаймы большие. А вот один сервис как-то вот ну не так работает. То ли подвисает, то ли подглючивает, то ли хрен поймешь. А потом убираешь\меняешь железку одну и всё ВНЕЗАПНО становится прекрасно. Не видели? А вот я видел. А чтобы выловить такие глюки - это нужен просто маэстро. Было бы оно всё так просто, не стоили бы ни железо ни спецы таких бабок. Между прочим, системе могла тупо не понравиться оперативка и она могла не запускаться по этой причине. Не видели такого? А я видел. И как из-за звука система не запускалась, тоже видел. И даже, блин, из-за кривой видяхи. И, кажется, из-за флопа. И, если правильно помню, из-за винта. Не стартует система и хоть ты тресни. И даже из-за гребанной usb-ФЛЕШКИ!!! Точно, помню, натрахался тогда вдоволь... Так что, ребяты, у нас всё зашибись. Оно, блин, не только запускается, но даже считает. Разберемся с проблемой, не сомневайтесь. Правильно говорят - не делай ничего с первого раза хорошо, не оценят сложность
Пойти поспать или поехать потаксовать? Вопросец... Мда...
Хммм... Мне тут мысля в голову пришла. Там на матери три 8 пиновых доп питания. Я подключил одно. Может быть, питания не хватает?.. Мне почему-то подумалось, что это по коннектору на каждый дополнительный ЦП при базовом одном. Может 6903 грузить сильнее камни по питанию, чем 6901? Хммм... Ладно, пусть tguskill уже сам пробует. Первый этап запуска системы предлагаю считать закрытым. ЗЫ. И не забыть выяснить про поддержку NUMA.
Добавлено спустя 1 минуту 56 секунд: qton О, блин, вот так лажа с SEC. Офигеть. Никогда с SEC проблем не имел вообще.
Member
Статус: Не в сети Регистрация: 25.08.2003 Откуда: Волгоград
Вообще мне эт все напомнило ситуацию - на одном из моих сервантов под W2K3 x86 было 16 ядер, считались (в августе было дело) 6901... Поставщик напутал, пришлось менять 5630 на 5645, приезжает курьер с процами, я без задней мысли даже папку с клиентом не бэкаплю, вставляю процы, и тут все - приплыли... на интеловском сервере СРАЗУ же client-core communication error. Ошибки железа исключены. Как потом оказалось под х86 системой 6901 не считались на числе потоков, бОльшим 16, а обычные смп - на ура. Думаю какая-то фишечка имеет место быть и в данном случае.
_________________ TT Volcano II -> TT Volcano7 -> TT Silent Tower -> ThermalRight Ultra 120 eXtreme -> ThermalRight HR-02 Чем дальше, тем тише и быстрее :)
Member
Статус: Не в сети Регистрация: 31.05.2006 Откуда: Королёв МО
У меня на восьми сокетной Tyan Thunder n4250QE обычная память вообще не завелась, Ubuntu 10.04 x64 server работает, с NUMA проблем нет. Еще на ней питание на каждом из двух этажей - 24+8+8+4 - причем часть разъемов питания необходимо для модулей памяти - в манах все описано.
_________________ IT, RC или просто блог моих интересов www.krohpit.ru
Member
Статус: Не в сети Регистрация: 16.11.2005 Откуда: Klin
targitaj писал(а):
Было бы оно всё так просто, не стоили бы ни железо ни спецы таких бабок.
а они и не стоят. у меня ибм-овский сервак забраковал палку памяти, с ней пост пройти не может. приехал специально обученный человек из москвы ажно, поменял - та же херь. благо мамо умеет сбойные палки отрубать на ходу и на спецыальном экране показывает, что не так. сервак боевой, тормозить никак, а на горячую память дергать я что-то очкую (хотя можно). ну и за что бабки плачены? а индивидуальной непереносимостью пугать легко тех, кто в сервисе не работал. как говорится: кто в армии служил... зря питалово недоподрубил, имхо
Member
Статус: Не в сети Регистрация: 16.11.2005 Откуда: Klin
targitaj писал(а):
Обращаю внимание, что 6903 сыпется сразу при старте
может все-таки что-то где-то недособралось? надобно другой дистриб пробовать, хотя бы дебиана того-же, но лучше совсем другой. раз у народу под убунтой работает, чего велосипед изобретать.
TSC! Russia member
Статус: Не в сети Регистрация: 19.07.2010 Откуда: Казань
targitaj писал(а):
Hazord Вообще, стоит SEC, так что надежда на стабильность была изначально.
Так это особо и не при чем ведь. Мне попадались бракованные плашки почти среди всех основных производителей планок (Samsung в том числе). Небольшую надежду на стабильность может дать только ECC
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 7
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения