Как рассчитать время простоя сетевой системы
Вот две системы, A и B. Как рассчитать время простоя каждой.
Для А, должно ли оно быть: 0,01 * 10 * 6 * 12 = 7,2 часа / год?
Система имеет 10 физических узлов, и если какой-либо из этих узлов вышел из строя, вся система выйдет из строя. Вероятность отказа для отдельного узла составляет 1% в месяц, а время простоя составляет 6 часов для исправления. Тогда каково время простоя всей системы в год.
Система B имеет 10 физических узлов, если работает 9 из 10 узлов, вся система может функционировать как обычно. Вероятность отказа для отдельного узла составляет 1% в месяц, а время простоя составляет 6 часов для исправления. Тогда каково время простоя всей системы в год.
2 ответа
Мы говорим об ожидаемых простоях здесь, поэтому нам придется использовать вероятностный подход.
Мы можем использовать пуассоновский подход к этой проблеме. Ожидаемая частота отказов составляет 1% в месяц для одного узла или 120% (1,2) для 10 узлов за 12 месяцев. Таким образом, вы правы, что 1,2 сбоев / год * 6 часов / сбоев = 7,2 часа / год для ожидаемого значения А.
Вы можете выяснить, насколько вероятно данное количество простоя, используя 7,2 в качестве лямбда-значения для распределения Пуассона.
Используя R: ppois(6, лямбда = 7,2) = 0,42, это означает, что с вероятностью 42% у вас будет меньше 6 часов простоя в год.
Для B это также Пуассон, но важна вероятность того, что второй узел выйдет из строя через шесть часов после первого отказа.
Частота отказов (при условии 30-дневного месяца с 120 6-часовыми периодами) составляет 0,0083% за 6-часовой период на узел.
Итак, мы смотрим на вероятность двух неудач в течение шести часов, умноженных на количество шестичасовых периодов в году.
Используя R: dpois(2,0, лямбда =(0,01/120)) * 365 * 4 = 0,000005069
0,000005069 * 3 ожидаемых часа / отказ = 54,75 миллисекунд ожидаемое время простоя в год. (3 ожидаемых часа на каждый сбой, потому что второй сбой должен произойти в среднем на половине первого сбоя.)
Частота отказов 1% / месяц / узел имеет вероятность 0,00138889% отказов в любой данный час. Я использовал биномиальное распределение в Excel, чтобы смоделировать вероятность отказов N узлов, когда 8760 ч / г * 10 узлов = 87600 "испытаний". Я получил эти результаты:
0 failure: 29.62134067 %
1 failure: 36.03979837 %
2 failure: 21.92426490 %
3 failure: 8.89142792 %
4 failure: 2.70442094 %
5 failure: 0.65805485 %
6 failure: 0.13343314 %
...and so forth
Отказы N могут вызвать 6N часов простоя (если они независимы). Тогда для каждых 6N часов простоя одного узла вероятность того, что ни один из других 9 узлов не выйдет из строя, равна (100% - 0,00138889%) ^ (9 * 6N)
,
Таким образом, ожидаемое время простоя двух узлов P(1 node down) * (1 - P(no other node down)) * 6 hours / 2
(делится на два, потому что в среднем 2-й сбой происходит в средней точке ремонтируемого узла). Когда подведены все N
число сбоев Я получил ожидаемое время простоя двух узлов в 9,8 секунды / год, теперь я представляю, насколько это правильно, но это должно дать приблизительное представление. Довольно грубое решение:/