Что делать, если ваша ИТ-конфигурация выходит из строя
Если вы работаете в сфере ИТ достаточно долго, вы будете время от времени сталкиваться с ситуациями, когда то, что вы настраиваете, просто не работает должным образом. Неважно, насколько вы опытны или сколько сертификатов у вас есть, это произойдет. Это часть работы в сфере ИТ. Настоящий вопрос, конечно, заключается в том, как заставить вашу ИТ-конфигурацию снова работать, когда уже кажется, что система настроена правильно.
Ищите проблемы с низкоуровневой ИТ-конфигурацией
Возможно, самый важный урок, который я усвоил за эти годы, заключается в том, что если что-то настроено правильно, и вы проверяли и перепроверяли конфигурацию, но она все еще не работает, ваша ИТ-конфигурация, вероятно, верна. В подобных ситуациях я рекомендую начать процесс устранения неполадок с поиска проблем более низкого уровня, которые потенциально могут способствовать возникновению проблемы, с которой вы столкнулись в настоящее время. Позвольте привести пример.
На прошлой неделе у меня возникла проблема с развертыванием агента управления на определенной виртуальной машине. На некоторых других виртуальных машинах процесс работал безупречно накануне, но по какой-то причине я просто не мог заставить агента развернуться на этой конкретной виртуальной машине. Какое-то время я был сбит с толку. Проблемная виртуальная машина была настроена точно так же, как и виртуальные машины, которые корректно работали накануне. В довершение ко всему, сообщение об ошибке было совершенно бесполезным. По сути, он сказал мне, что процесс не удался, но не дал мне никаких указаний относительно того, почему. Короче говоря, я в конце концов решил, что проблема не может быть связана с агентом, сервером управления или даже с конфигурацией виртуальной машины, потому что все эти вещи оказались хорошими. Таким образом, я начал искать проблемы более низкого уровня и в конце концов обнаружил, что моя проблема была вызвана конфликтом IP-адресов.
Просмотр файлов журнала
Еще один совет для ситуаций, в которых ваша ИТ-конфигурация просто не работает должным образом, — это потратить некоторое время на просмотр файлов журналов. Этот шаг по устранению неполадок кажется очевидным, но я должен признаться, что сам виноват в том, что игнорировал файлы журналов до тех пор, пока усилия по устранению неполадок не станут действительно серьезными. Я часто ловлю себя на том, что занимаюсь бесплодным поиском в Интернете фактического сообщения об ошибке, вместо того, чтобы сразу обращаться к журналам. Однако дело в том, что файлы журналов очень часто содержат информацию, которая не указана в самом сообщении об ошибке. Конечно, журналы иногда могут быть бесполезными и могут делать немного больше, чем просто повторять сообщение об ошибке, которое вы уже видели, но в большинстве случаев файлы журналов будут содержать дополнительную информацию, которая может помочь вам решить проблему.
Ищите другие источники информации
Что еще мне нравится делать, когда моя ИТ-конфигурация просто не работает, так это искать другие источники информации. Лог-файлы — это прекрасно, но они не всегда дают полную картину того, что происходит на самом деле. Многие приложения охватывают несколько серверов. Я обнаружил, что иногда ключевая часть информации, которая помогает вам решить проблему, на самом деле не находится на том же сервере, на котором возникает ошибка. Возможно, в проблеме виновата какая-то служба зависимостей на другой машине. Таким образом, если вы ничего не добьетесь проверкой файлов журналов сервера, проверьте соответствующие файлы журналов, которые могут существовать где-то еще.
Это поднимает еще один момент. Каким бы полезным ни было средство просмотра событий Windows, оно не является исчерпывающим, когда речь идет о предоставлении вам диагностической информации. Очень часто приложения включают дополнительные журналы в виде текстовых файлов. Эти журналы могут предоставить вам информацию, которая не отображается в средстве просмотра событий Windows.
Подтвердите, что вы думаете, что знаете
Еще один полезный шаг по устранению неполадок — проверить все, что, по вашему мнению, вы знаете о системе. В случае сервера, который отказывается правильно запускать приложение, это может включать в себя такие вещи, как проверка разрешения доменных имен или проверка того, что все необходимые системные службы запущены.
В случае сценария мне нравится добавлять строки кода в стратегических местах, которые будут выводить содержимое переменных, которые я использую. Таким образом, я могу убедиться, что переменные действительно содержат ожидаемые значения.
Используйте лабораторную среду
Если вы испробовали все основные методы устранения неполадок, но по-прежнему испытываете трудности с решением проблемы, попробуйте настроить лабораторную среду. Создайте лабораторную среду с нуля и посмотрите, возникает ли проблема в тестовой среде. Если проблема действительно возникает в тестовой среде, то проблема, вероятно, связана с вашей конфигурацией, отсутствующей зависимостью или, возможно, параметром безопасности. Если проблема не возникает в лаборатории, возможно, есть что-то внешнее по отношению к приложению, существующее в производственной среде, но не в тестовой среде.
Попробуйте уменьшить сложность
Еще одна вещь, которую вы можете сделать, чтобы попытаться решить проблему ИТ-конфигурации, — это по возможности уменьшить сложность. Например, вы можете временно отключить функции безопасности, такие как брандмауэры приложений. Однако, учитывая последствия такого рода проб и ошибок для безопасности, лучше по возможности ограничивать усилия по устранению неполадок, связанных с безопасностью, изолированной программной средой.
Получите помощь от полного новичка
Хорошо, это может быть самая большая радуйся, Мария, последняя попытка из всех. На самом деле, это звучит совершенно безумно, но я видел, как это работает. Если у вас что-то не получается, и вы перепробовали все, что только можно было придумать, попробуйте спросить кого-нибудь, кто ничего не смыслит в этой технологии. Полный новичок может иногда уловить что-то действительно простое, что опытный профессионал мог бы упустить из виду, потому что он ищет более сложную проблему.
Еще в начале 1990-х я некоторое время работал разработчиком. Близкий друг все еще учился в колледже, и у него были проблемы с домашним заданием. Он позвонил и спросил, могу ли я помочь ему отладить код, который он написал, потому что он полностью застрял, а задание должно было быть выполнено на следующий день.
В программе не было ничего сверхсложного. Он содержал всего около 150 строк кода и был написан на языке программирования, который в то время я использовал каждый день. Однако после трех часов отладки ни один из нас не обнаружил проблему. Мне удалось выяснить, какой блок кода вызывает проблему, но мне еще предстояло понять, почему проблема возникает.
Примерно в это время в комнату вошла моя жена. Она никогда в жизни не написала ни строчки кода. Я показал ей четыре или пять строк кода, где, как мне казалось, была проблема. Я не знаю, как она это сделала, но примерно за 15 секунд она нашла проблему, которую я искал последние три часа. Это был не самый большой момент моей гордости, но он просто показывает, что иногда помощь может прийти из неожиданного источника.
Проявите творческий подход
Характер работы в сфере ИТ требует, чтобы ИТ-специалисты умели устранять неполадки. Однако иногда проверенных и проверенных практик по устранению неполадок в ИТ-конфигурации просто недостаточно. Когда это происходит, вы должны быть немного более творческими в поиске способов решения проблемы. Помните, если вам кажется, что вы все делаете правильно, то, вероятно, так оно и есть. Скорее всего, проблема вызвана чем-то простым, что вы могли упустить, либо внешним фактором.