Будет ли Azure перезагружать / перезаписывать /(оба) мой экземпляр, если он не отвечает?
У меня есть веб-проект Azure, который включает в себя долгую задачу запуска установки стороннего программного обеспечения на экземпляр; Время от времени я видел экземпляры, которые не отвечают, поэтому я внедряю пробу, чтобы балансировщик нагрузки принял это к сведению, а не направил трафик на плохие экземпляры. Этого, конечно, недостаточно - я бы хотел, чтобы Azure (Fabric?) Затем перезагрузил экземпляр, а если это не помогло (то есть заставил экземпляр правильно ответить на зонд) - повторно отобразил экземпляр, Это поведение, и если да, то где это задокументировано? Я долго искал, но ничего полезного не нашел.
Спасибо
2 ответа
Используя API управления, вы должны иметь возможность внешнего наблюдения за вашими ролями. Затем, если вы занимаетесь много времени, вы сможете заставить его переизображаться.
http://blogs.msdn.com/b/kwill/archive/2013/02/28/heartbeats-recovery-and-the-load-balancer.aspx описывает состояние экземпляра роли, что Azure делает для восстановления, и как использовать датчик балансировки нагрузки.
Когда вы говорите, что ваш экземпляр не отвечает, означает ли это, что экземпляр отображается на портале как занятый (или что-то, кроме Ready), или просто IIS не отвечает на запросы? Если первый (экземпляр показывает занят), то вам не нужен датчик балансировки нагрузки, так как Azure автоматически удалит этот экземпляр из ротации. Если последнее (IIS не отвечает), то вы можете потенциально реализовать событие StatusCheck в своем веб-коде, так что если у самого w3wp возникнет проблема, то экземпляр будет снят с производства матрицей, но если сам w3wp исправен, и он это просто запросы, которые не отвечают, тогда вам понадобится датчик балансировки нагрузки.
Наличие хорошего решения для мониторинга и восстановления очень ценно, но я бы порекомендовал вместо того, чтобы перезагружать экземпляры, чтобы смягчить проблему w3wp, вам следует вместо этого выяснить причину, по которой ваши экземпляры не отвечают. Исправьте источник проблемы, а не применяйте лейкопластырь:). Сообщение в блоге по адресу http://blogs.msdn.com/b/kwill/archive/2013/02/28/heartbeats-recovery-and-the-load-balancer.aspx и, в частности, сценарий устранения неполадок 5, может быть хорошее место, чтобы начать расследование.