Обработка файла журнала с помощью R

Я только что узнал о R, который, кажется, идеальный инструмент для получения статистики по лог-файлам веб-сервера. Я смотрел на несколько библиотек, как zoo а также plyr, но ни один из них не предлагает прямого решения для агрегирования данных с метками времени.

Есть ли R lib или учебник или документация, которая фокусируется на анализе файла журнала, например данных? Какие акценты на агрегации времени в срезах?

Возможные случаи использования:

  • среднее время запроса в день
  • среднее количество запросов за сеанс в день
  • получить самые медленные запросы на этой неделе
  • ...

1 ответ

Такого рода вопросы обработки данных с метками времени на самом деле довольно распространены. Поскольку ваш вопрос расплывчат, мой ответ ограничен некоторыми указателями. Для примера агрегации временных рядов смотрите (которые, кстати, все ответы от меня):

Все эти ответы используют одну и ту же стратегию в сочетании с plyr а также ggplot2 пакет. Это должно начать вас. Обратите внимание, что это только мои ответы, которые я нашел за пару минут. Вероятно, есть гораздо больше, чтобы найти, особенно если вы ищете более конкретные вопросы.

Другие вопросы по тегам