Как можно прогнозировать временные ряды в условиях реального времени, когда невозможно отслеживать каждый элемент?
Проблема: Найти предполагаемое время жизни объекта (например, время, когда оно написано в следующем) или соответствующий PDF. Это известно как процесс обновления.
Ограничение: невозможно отслеживать метаданные для каждого отдельного объекта
Допущения: неточности в прогнозировании для объектов с малым объемом допустимы, но погрешность должна уменьшаться с ростом популярности объекта
Есть ли у вас какие-либо идеи о том, как эти прогнозы могут быть достигнуты, возможно, с помощью структур данных эскиза (фильтры Блума, эскизы по количеству минут и т. Д.) Или форм выборки (например, выборка с экспоненциальным смещением из пласта)? Может ли допущение конкретной проблемы принять конкретный случайный процесс (например, процесс Пуассона)?
Красочный пример этой проблемы: оценить, когда пользователь в следующий раз посетит ваш сайт или щелкнет по чему-либо, не имея возможности отслеживать историю каждого пользователя.