Обработка файла журнала с помощью R
Я только что узнал о R, который, кажется, идеальный инструмент для получения статистики по лог-файлам веб-сервера. Я смотрел на несколько библиотек, как zoo
а также plyr
, но ни один из них не предлагает прямого решения для агрегирования данных с метками времени.
Есть ли R lib или учебник или документация, которая фокусируется на анализе файла журнала, например данных? Какие акценты на агрегации времени в срезах?
Возможные случаи использования:
- среднее время запроса в день
- среднее количество запросов за сеанс в день
- получить самые медленные запросы на этой неделе
- ...
1 ответ
Такого рода вопросы обработки данных с метками времени на самом деле довольно распространены. Поскольку ваш вопрос расплывчат, мой ответ ограничен некоторыми указателями. Для примера агрегации временных рядов смотрите (которые, кстати, все ответы от меня):
Все эти ответы используют одну и ту же стратегию в сочетании с plyr
а также ggplot2
пакет. Это должно начать вас. Обратите внимание, что это только мои ответы, которые я нашел за пару минут. Вероятно, есть гораздо больше, чтобы найти, особенно если вы ищете более конкретные вопросы.