Как остановить непреднамеренные человеческие ошибки?
Мы поддерживаем огромный набор файлов на наших веб-серверах. Вчера мы были удивлены, увидев очень важный основной файл системы, который был возвращен старой версией (вероятно, некоторыми людьми, поскольку у нас нет автоматических сценариев). Пользователи частично пострадали за полдня за это.
Должен ли я запускать своего рода автоматический скрипт для сканирования последней загруженной даты (возможно?) Каждого файла и отправлять нам автоматическое оповещение в случае несоответствия основных файлов? Или есть какие-либо программы для снятия отпечатков пальцев с каждого файла и отправки оповещений? Пожалуйста, предложите, что еще можно сделать, чтобы остановить подобные человеческие ошибки.
2 ответа
Люди всегда будут ошибаться, к сожалению.
Похоже, вам нужно ограничить доступ к веб-серверу и обеспечить внесение изменений в определенный процесс. Если "кто-либо" (используя термин "свободно") может перейти на рабочий сервер и просто изменить файлы, то вы увеличиваете вероятность возникновения подобных проблем.
На самом деле, этот вид проблемы может выделить проблему еще дальше по производственной линии. Например, обычно, если людям нужно вносить прямые изменения в файлы на рабочем сервере, это исправление срочной ошибки. Настройка среды непрерывной интеграции с непрерывным автоматическим тестированием изменений кода и запуска бета-версии наряду с производством может значительно уменьшить количество ошибок, возникающих при работе, и, следовательно, (в идеале, полностью) необходимость исправления живых файлов.
Рассматривайте это как проблему обнаружения вторжений - посмотрите, например, на tripwire.