Использование лагов или ежемесячных категориальных функций для распознавания сезонности с DeepAR и TFT из pytorch-прогнозирования

Я пытаюсь прогнозировать ежемесячные продажи с помощью DeepAR и Temporal Fusion Transformer из pytorch-прогнозирования. Используемые мной данные имеют месячную сезонность, а сезонность одинакова или, по крайней мере, очень похожа для разных стран.

При создании TimeSeriesDataSet с помощью pytorch-прогнозирования я мог установить запаздывание параметра для целевой переменной. В документации об этом сказано:

Лаги могут быть полезны для обозначения сезонности моделей.

Я не уверен, что это лучший вариант, чем использование месяца или, может быть, месяца и страны в сочетании в качестве категориальной характеристики, чтобы упростить распознавание сезонности.

У кого-нибудь был собственный опыт работы с этой темой или объяснение, какой выбор будет лучшим?

Заранее спасибо!

1 ответ

Алгоритм DeepAR автоматически генерирует признаки для временных рядов. Подробнее здесь

https://docs.aws.amazon.com/sagemaker/latest/dg/deepar_how-it-works.html

  • Вы также можете добавить свою собственную функцию (как категориальную, так и непрерывную) для каждой временной серии. (например, праздничные дни и т. д.)
  • Это хорошо работает, когда у вас есть несколько временных рядов с более чем 300 точками данных для каждого.
  • Все временные ряды должны иметь одинаковую частоту.

Бенчмарк по DeepAR и TFT в ваших руках, думаю TFT превзойдет.

Другие вопросы по тегам