Очень неравномерная балансировка нагрузки облачного сервиса с Azure
Я использую Azure для размещения облачной службы, которую я недавно изменил, чтобы она масштабировалась на несколько экземпляров, включая рабочую роль кэширования сеанса. Мой вопрос: почему я вижу экстремальную нагрузку (более 90%) в одном случае, но не в других (15-20% во всех остальных случаях)? Я должен беспокоиться?
Прежде чем настроить балансировку нагрузки и когда мой единственный экземпляр достигнет 95% нагрузки, он замедлится до ползания - станет непригодным для использования. Есть ли способ убедиться, что у меня нет пользователей, испытывающих это, потому что они каким-то образом циклически перезагружаются на перегруженном экземпляре?
2 ответа
Мы обнаружили, что у нас был похожий тип ситуации, когда один экземпляр с балансировкой нагрузки отказал; мы увидели, что вся нагрузка была перенесена, но не сбалансирована снова. Мы обнаружили, что отключение поддержки на пару минут позволяет нагрузке снова распределиться, после чего мы можем снова включить ее.
http://technet.microsoft.com/en-us/library/cc772183(v=ws.10).aspx
Ну... баланс лазурной нагрузки основан на циклическом разбросе... поэтому распределение должно быть почти равным (что-то вроде 60-40 или даже 70-30 все еще приемлемо)... так что просто чтобы быть уверенным: вы уверены, что ваш не используется IIS "перенаправление" (я забыл название функции), что бы установить липкий сеанс?
Я должен сказать, что без дальнейших подробностей о том, что ваш сайт на самом деле "делает и как", довольно сложно советовать... Я должен сказать, что это поведение странное, но не ясно, что это ошибка балансировщика нагрузки...
Edit1: я бы посоветовал вам дополнительно изучить, что делает парень на 90%, отслеживая его действия... возможно, вам не повезло, и запросы, которые вызовут большую нагрузку, попадают в эту машину и те, которые будет быстро работать, будет работать другой... Еще одна вещь, которая может произойти, это то, что что-то может застрять (возможно, с бесконечным циклом)... если вы реализовали масштабируемую архитектуру, я бы порекомендовал вам предоставить другую машину и убить того, кто страдает...
Edit2: простой способ убедиться, что балансировщик нагрузки работает: войти в систему удаленно на сервисные машины и заменить что-то вроде изображения, которое отображается на главной странице (то, что вы легко можете заметить, просто взглянув на страницу). На сервере 1 положим, скажем, жёлтое изображение, а на сервере 2 - красное изображение (хорошо... может быть, что-то не так радикально, но вы понимаете...). Затем продолжайте загружать страницу снова и снова...