Разумное время простоя

Я управляю около 5 различными хостинговыми серверами через разных хостинг провайдеров. За последние два месяца один из серверов, на котором я работаю, был отключен дважды. Оба раза были неожиданными и довольно длинными (36 часов и 4 часа). Рассматриваемый сервер - это VPS, а не общий сервер. Учитывая мой опыт работы с другими моими серверами / провайдерами (как VPS, так и общими), это кажется недопустимым временем простоя.

  • Как вы думаете?
  • Что вы считаете разумным временем простоя для ваших серверов (запланированных и незапланированных)?

2 ответа

Решение

Ты получаешь то, за что платишь.

Какой у вас SLA с вашим провайдером? У тебя даже есть такой? Если есть какой-то один фактор, объясняющий разницу в цене, это так. Если вам нужно гарантированное время безотказной работы (например, 3 9 с), вам придется заплатить за него. Например, время безотказной работы 5–9 обойдется вам значительно дороже.

Чтобы ответить на ваш вопрос: вы получили объяснение причин этого простоя? 36 часов слишком долго. 4 часа не обязательно (если это редкость). Это аппаратный сбой? Если это так, вы не можете ничего с этим поделать. Однажды у меня был провайдер, который иногда заполнял их конфигурацию, и почта перестала работать, пока я не сказал им, чтобы это исправить. Для меня это было неприемлемо.

Серверное оборудование выйдет из строя. Это только вопрос времени. Вместо того, чтобы пытаться определить, что является разумным, я хотел бы задать вам еще один вопрос: каковы все возможные способы сбоя вашей конфигурации, и готовы ли вы изменить настройки для учета этих возможностей?

Например, предположим, что ваш сайт размещен на одном VPS. Вот несколько примеров сбоев:

  1. VPS может стать коррумпированным
  2. Гипервизор может потерпеть неудачу
  3. Сетевое оборудование в шкафу может умереть
  4. Проблемы с питанием / нагревом могут существовать в центре обработки данных
  5. Магистральная интернет-связь может упасть.

Вы можете снизить риск того, что #1 и #2 закроют ваш сайт, установив балансировщик нагрузки и второй VPS. Означает ли этот уменьшенный риск дополнительные расходы?

Это обсуждение превращается в вопрос аварийного восстановления в какой-то момент.

Другие вопросы по тегам