Сравнивая временные последовательности

Я пытаюсь обернуть голову вокруг этой задачи и задаюсь вопросом, есть ли стандартный способ сделать это или некоторые библиотеки, которые были бы полезны.

Определенные события отслеживаются и синхронизируются в нескольких источниках данных S1 ... SN. Записанная информация - это тип события и метка времени. Может быть несколько событий одного типа последовательно или они могут быть прерывистыми. Могут быть "пропущенные" события - то есть, когда один из источников пропускает его, и, наоборот, когда источник вводит "ложное срабатывание". Как правило, существует разница во времени между наблюдениями одного и того же события в разных источниках. Эта разница во времени имеет постоянную составляющую из-за физического расположения источников, но может также иметь изменяющуюся составляющую, обусловленную задержкой в ​​сети и другими факторами.

Мне нужно найти алгоритм, который бы нашел оптимальный максимальный интервал времени, который должен использоваться для группировки наблюдений во всех источниках в одном "наблюдаемом событии" и позволять обнаруживать пропущенные события и ложные срабатывания.

Мне интересно, если решение действительно где-то в области статистики, а не алгоритмы. Любой вклад будет высоко ценится.

1 ответ

Решение

Похоже, вы создаете систему посещаемости:-) В системе, которую я создаю в настоящее время, такая группировка наблюдений также необходима. В моем случае есть сотрудники, у которых есть пропуск, который они ставят перед паролем, чтобы зарегистрировать свою посещаемость. Сначала система выберет все посещаемости от одного сотрудника. Затем он положит их в коробки по одному дню, заказанные по времени регистрации. Каждая регистрация будет оцениваться с точки зрения начала или остановки. Если первая регистрация является начальной регистрацией, то система будет искать регистрацию остановки максимум через 12 часов. Если остановка не наступает, вставляется остановка. Дополнительные сведения могут быть введены в действие, когда планирование известно. Возможно, вы могли бы использовать статистику, но в моем случае речь шла об алгоритмах в сочетании со знаниями об организации.

Другие вопросы по тегам