Мои факапы

Мне конечно стыдно, но факапы у меня тоже были и в количестве. Самый первый факап - это мое мнение о том, что оценки в школе что-то значат. Мнение, к сожалению, разделяемое моими родителями вплоть до института. В реальности мой школьный аттестат не открывался никем со дня получения. Никого после школы не интересовало, знаю ли я столицу папуа-новой гвинеи и отличу ли тычинку от корешка, а крестоцветных от брюхоногих. То же самое касается митохондрий или еще каких ложножгутиков. Умение писать сочинение школьного образца про страдания князя (хотя возможно и виконта Бражелона) на поле толи Ватерлоо, толи Куликовом - никак не связано с написанием инструкций. И, лет ми спик фром май харт, то же самое касается и школьного уровня английского. В институте было получше, но был у меня эталонный факап, когда преподаватель потребовал свои лекции и указанные им куски из его же учебника по, кажется, экономике предприятия, в переписанном от руки виде. Ключевым моментом для допуска были не знания или посещаемость, а сдача переписанного, и именно вручную. По моему, это был хороший экзамен на умение эскалировать проблему на уровень завкафедры и правильно (и быстро) решать такие вопросы. Институт как таковой давал много теории, немного практики, и полный ноль в плане современных технологий. Зато в итого мне выдали красивый диплом государственного образца, в который, кстати, тоже никто не заглядывал, есть и ладно.

С рабочими факапами было интересней. Моим первым качественным факапом стал вынос второго контроллера домена на виртуалку .. без синхронизации времени. В результате время разъехалось, есть такая отвратительная особенность, и пришлось один домен-контроллер погасить, а машины перевводить в домен. Тогда я не любил читать логи каждый день, и поэтому не помню, было ли в логах что-то полезное.

Вторым, на той же работе кстати, стал перевод почты на Exchange. Первым делом, еще до перевода, я сервер Exchange поставил .. а потом случайно снес Raid на котором он был. Даже не помню как. Режим восстановления при установке не заработал, так что пришлось утром следующего дня открывать ADSI, google и читать, как Exchange вообще убить из AD.

Антиспам. Понадеялся я как-то на антиспам в Exchange. Выдержал месяц и пошел читать про развертывание антиспама Касперского.

Недоговоренность. Как-то предоставлял нам провайдер канал точка-точка, пообещав там "вот прям чистый Ethernet". Вот только оказалось, что я воспринимал чистый Ethernet как то, куда положить Vlan можно, а провайдер (точнее его менеджер) представлял как-то иначе. Выяснилось все уже при включении, вопрос решили - но осадочек остался.

Колечко на память колечко. На удаленном объекте собрали колечко. Как позже оказалось - даже не колечко, а какой-то говнокоммутатор воткнули, который у себя собрал что-то вроде ARP poison и стал гадить в сеть, а коммутаторы стали плакать типа ААА, mac flapping, туда сюда бегает !! Сеть была широкая и плоская, vlan-ов было мало .. вот только отключение этого куска кольца вызвало перестроение куска сети, и минут 10 все просто стояло.

Тонкие диски. Сделал я как-то тонкий диск на виртуалке на удаленном объекте, притащил туда данные на USB диске .. и всю ночь переливал, потому что тормозней тонкого диска ничего нет.

Управляемые коммутаторы. Переезжала у нас контора из локации А в локацию Б. СКС на новом месте была .. из говна и палок, так что было волевым решением закуплено с десяток каких-то 8 (или 16) портовых веб-управляемых коммутаторов. С одинаковым IP по умолчанию. Еще с месяц наверное перенастраивал весь этот колхоз. Причем тогда денег на маяк (тон-генератор) пожалели, хорошо у меня был (с прошлого похожего переезда) свой комплект - рации, звонилка, нож обрезной, вот этот весь минимальный набор. Потом еще купил рефлектометр. Сейчас понимаю, что можно было это все купить на отдел, потому что сумма вполне влезала в тендер, да и по тендеру бы провели. Но надо было срочно, уря-уря, вчера.

Управляемые POE коммутаторы. Прекрасная штука .. особенно когда заявлена поддержка 10 POE, а на 6 начинаются необъяснимые глюки.

Удаленная настройка коммутаторов - к дальней дороге. Настраивал коммутатор в 20 километрах от себя. Как самый умный, reload in (это была сиська) не ввел, управляющий интерфейс погасил. Пришлось перезагружать по телефону.

Электрическое говнецо. Как-то раз коллега притащил какую-то полезную железку, которую надо было воткнуть одним концом в электрическую сеть. Воткнул. После чего в серверной стало очень тихо, только затрещали пуканы. Оказалось, что группа коммутаторов сидела на паре упсов. У упсов давно сдохли батарейки, чего никто не заметил. Эта пара упсов сидела на простых (не выделенных) розетках, в одну из которых и воткнулся коллега с чем-то уже давно закороченным. Автомат, конечно, выбило. Упсы, конечно, легли. Резервную схему с воплями "ойой что то пригорает" мы конечно сделали минут за 5, и еще минут за 5 все завелось.

Электрическое говнецо-2. Как-то раз потребовалось мне сбросить пароль на ИБП APC. А там такой кабелек для COM-порта, специфический - при включении "не того" кабеля - ИБП просто выключается, типа ходят тут всякие. Сервера, конечно, обратно завелись, но было страшновато.

Электрическое говнецо-3. На одном объекте выбивало коммутаторы. Не часто, но постоянно. Оказалось, что там с потолка свисал провод. Не изолированный. В проводе была фаза. Иногда при переключении кондиционеров провод коротило на корпус стойки. Коммутаторы не одобряли.

Электрическое говнецо-4. На одном объекте я потрогал шкаф, и меня очень так душевно приложило, всеми 220 вольтами. Оказалось, дебилы зачем-то завели фазу на контакт земли, и на корпусе оказалась фаза. В соседней розетке все было нормально. Как такое работало - не понятно, но индикаторную отвертку я стал носить с собой. Говорят, частая ситуация.

Электрическое говнецо-5. Бабум! На одном объекте нашли ИБП. Что и как внутре - неизвестно, документов нет, пометок нет. Включался он даже не в розетку, а через прикручиваемый кабель. Попросили электриков включить. Электрики включили, через отдельный автомат. Включили. Щелчок автомата слышно не было, потому что внутри ИБП знатно взорвались большие конденсаторы.

СХД. При ребилде СХД (полки) вылетел еще один диск. Данным капууут. Из бекапа правда подняли, но осадок остался.

Подъем из бекапа. У Exchange есть один забавный шутк - если у ESEUTIL указаны не те пути не с теми ключами, то вместо перепроигрывания логов (это быстро) можно запустить кажется дефрагментацию базы. Была даже статья про это, только я ссылку потерял. Может и найду.

Свежие факапы. Свежие факапы, о которых я точно знаю, связаны с моим планированием и оценками времени задач в целом, да и работой в условиях стресса и самонакручивания. Самое неприятное - это наверное самонакручивание, когда ты уже знаешь, что может пойти не так. Вроде и соломки подстелил, но тут тупанул, там затупил, тут не проверил, тут поверил людям без проверки - и все, что-то не то.

Факап свежий первый, общая оценка. Надо было решить одну задачу. Я по глупости решил, что проблема то мелкая и частная, надо просто вот тут и вот там быстро починить, и все пройдет. Задача была про перемещение данных от точки 1 до точек 2 и 3. Оказалось, ничего подобного. Проблема была на всех стадиях. Данные нормально не забирались с точки 1. Данные плохо (медленно по причине смены схемы движения) переезжали в точку 2. Данные плохо хранились на точке 2, по причине недостатка места на точке, недостаточно отлаженной схемы хранения и просто потому что много чего не мониторилось. Данные не переезжали с точки 2 на точку 3. Почему - не понятно, и эскалировать задачу оказалось некому. Методологии теста нет. Саппорт мычит что-то из серии "мы ниибем, перезагрузите пару раз и переустановите систему".

Факап свежий 2. Общая оценка и с какого конца есть. Была задача "разобраться с одной сложной системой". Система была завязана на 6 разных отделов. ШЕСТЬ. Это не считая самих разработчиков системы. Процедура "разобраться" была жестко привязана ко времени. В проведении "разобраться" не был заинтересован никто. Работает же, чего трогать. Полной картины "что и как" не было ни у кого. Информации по топопривязке, в смысле кто куда ходит и зачем - аналогично. Та информация, которая была, при общем рассмотрении разделилась на две группы - а) бесполезная и б) ошибочная. Часть ошибочной информации пришла прямо от разработчиков, точнее от их техподдержки - начиная с того, можно ли сделать задачу "вот так", и заканчивая ошибками в руководстве. В стиле "гриб на странице 164 - ядовитый".

Last updated