Можно ли вывести неопределенность прогнозов для модели временных рядов из распределения остатков большой репрезентативной выборки?
Позвольте мне проиллюстрировать вопрос на примере: представьте, что вы строите модель для прогнозирования завтрашних осадков над Лондоном с использованием некоторых переменных. Давайте предположим, что доступны данные за 300 лет (1718-2018). Из этих aprox. 110 000 баллов, вы используете 70 000 для обучения вашей модели и 40 000 для тестирования. Если 95 % от остатков тестового набора находятся в диапазоне от -5 +5 мм:
1. Правильно ли будет сказать, что неопределенность прогнозируемых значений для 2019 года составит +-5 мм или любой другой асимметричный интервал, который мы получим? 2. Зависит ли это в каком-то смысле от теоретического распределения остатков в соответствии со структурой и / или предположениями модели? (помните, что выборка большая и представительная)