Как вы могли бы построить график отклонения от базовой линии во времени для числовых и факторных распределений в R?

Как я могу построить аномалии или вариации в распределении различных столбцов кадра данных или объекта XTS в R?

При просмотре данных веб-журнала, если я планирую время отклика и вижу кучу запросов, которые занимают много времени, я хочу знать, действительно ли что-то было другим с точки зрения запросов.

У меня обычно есть эти данные как объект dataframe или xts. В рамках этого интересующие меня столбцы относятся к одному из трех типов:

  • числовой
  • Конечный фактор
  • Бесконечный фактор.

Когда я говорю "конечный и бесконечный", я имею в виду это скорее в практическом или аналогичном смысле. Так, например, IP-адреса, хотя и конечны, для моих целей были бы бесконечны. Конечными примерами могут быть выбран сервер, код ответа HTTP или метод HTTP. Так что с бесконечным примером, IP-адресом, я действительно не хочу, чтобы мой пример заботился о том, каков IP-адрес, распределение хитов по отдельным IP-адресам. Для конечного примера, я буду заботиться о значениях.

Так что я хотел бы иметь возможность установить репрезентативное распределение этих данных для каждого интересующего меня столбца (пока не беспокоиться о статистической значимости, я рад сообщить о нем) в течение периода времени, например 1 минуты (или чего-то еще) период, необходимый для установления чего-то представительного для нормального движения) Затем постройте линию для каждого столбца с течением времени. Эта линия будет увеличиваться (или, возможно, также уменьшаться), если распределение этой колонки в течение этой минуты значительно отличается от моей выборки.

0 ответов

Другие вопросы по тегам